104
BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR

BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

  • Upload
    others

  • View
    18

  • Download
    0

Embed Size (px)

Citation preview

Page 1: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

BETİMLEYİCİ DURUM SAPTAYICI ARAŞTIRMALAR

MERKEZİ EĞİLİM OumlLCcedilUumlTLERİ

Herhangi bir değişken iccedilin toplanan bireysel verilerin genellikle belirli bir merkezinokta civarında değerler aldığı goumlzlemlenmektedir Merkezi eğilim oumllccediluumltleribirimlerin hangi değer etrafında toplandığını goumlsteren ve dolayısıyla ana kitleyitemsil eden (niteleyen) sayısal değerlerdir

Uygulamada en yaygın kullanılan merkezi eğilim oumllccediluumltleri ortalamalar (aritmetikortalama geometrik ortalama harmonik ortalama) ortanca (medyan) ve mod(tepe değer) olarak sayılabilirAritmetik Ortalama

Aritmetik ortalama bireylerin tamamının eşit ağırlığa sahip olduğunu varsayanbir merkezi eğilim oumllccediluumltuumlduumlr Yığın iccedilin aritmetik ortalama aşağıdaki formuumll ilehesaplanır

120583 =1198831 + 1198832 +⋯+ 119883119873

119873=σ119894=1119873 119883119894119873

Burada 120583 yığın iccedilin aritmetik ortalamayı 119873 ise yığındaki birim sayısını goumlstermektedir

Yığından seccedililen bir oumlrnekten hesaplanan aritmetik ortalama ise ത119883 semboluuml ile goumlsterilmekte olup hesaplama formuumlluuml aşağıdaki gibidir

ത119883 =1198831 + 1198832 +⋯+ 119883119899

119899=σ119894=1119899 119883119894119899

Burada 119899 oumlrnekteki birim sayısıdır

Aritmetik ortalamanın oumlzellikleri

Oumllccedilme duumlzeyi en az eşit aralıklı olan değişkenler iccedilinhesaplanabilir Diğer bir ifadeyle nicel değişkenler iccedilinhesaplanabilir

Hesaplama formuumlluumlnde birimlerin tamamını kullanırDolayısıyla aykırı (uccedil) değerlerden etkilenir

Geometrik Ortalama

Herhangi bir değişkenin zamana bağlı olarak izlediğideğişkenlik oranı geometrik ortalama ile oumllccediluumlluumlrHesaplama formuumlluuml aşağıdaki gibidir

119866119874 = 119873 1198831 1198832⋯119883119873 = 1198831 1198832⋯119883119873Τ1 119873

Geometrik ortalamanın oumlzellikleri

Hesaplama formuumlluumlnde birimlerin tamamını kullanırAncak aykırı (uccedil) değerlerden aritmetik ortalama kadaretkilenmez

Geometrik artış (ya da azalış) goumlsteren diziler iccedilinhesaplanması uygundur

Veriler arasında sıfır ya da negatif değerler olmasıdurumunda geometrik ortalama hesaplanamaz

Harmonik Ortalama

Bir aracın saatteki hızı hane halkı başına gelir arazi başına uumlretim gibi ldquoYbaşına Xrdquo olarak ifade edilen ve ldquoXrsquoin sabitrdquo olduğu durumlar iccedilin kullanılanmerkezi eğilim oumllccediluumltuuml harmonik ortalamadır Buna karşın ldquoY sabitrdquoolduğunda tercih edilen merkezi eğilim oumllccediluumltuuml aritmetik ortalamadır Bireyselveriler iccedilin harmonik ortalamanın formuumlluuml aşağıda verilmiştir

119867119874 =119873

σ119894=1119873 1

119883119894Oumlrneğin A şehirden B şehrine uzaklık 300 kilometre (km) olsun A şehrindenB şehrine bir suumlruumlcuuml ilk 100 kmrsquoyi saatte 100 km hızla ikinci 100 km saatte80 km hızla ve geri kalan mesafeyi ise saatte 90 km hızla gitmiştir Buoumlrnekte Y saati ve X kmrsquo yi goumlstermek uumlzere ldquoY başına Xrdquo ifadesi ldquosaatbaşına kmrdquo olmaktadır Aynı zamanda Xrsquo ler 100 kmrsquo lik mesafeler ile sabitolup uygun ortalama oumllccediluumltuuml harmonik olmaktadır

119867119874 =3

1100

+180

+190

= 8926 kmsaat

Harmonik ortalamanın oumlzellikleri

Veriler arasında sıfır ya da negatif değerler olması durumundaharmonik ortalama hesaplanamaz

Harmonik ortalama aritmetik ve geometrik ortalamaya goumlreaşağı eğilimlidir Diğer bir deyişle 119867119874 le 119866119874 le 120583 olmaktadır

Ortanca (Medyan)

Ortanca hesabından oumlnce bireysel veriler kuumlccediluumlkten buumlyuumlğe doğrusıralanmalıdır Ortanca sıralı dizilerde ortaya duumlşen değerdir

Goumlzlem sayısı 119873 tek sayı olduğunda ortanca 119883 119873+1 2 minus incideğer iken

119873 ccedilift sayı olduğunda ortanca Τ1198831198732 + 119883(119873+2)2 2 olarak

hesaplanır

Ortancanın oumlzellikleri

En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır

Tepe Değer (Mod)

En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz

Tepe değerin oumlzellikleri

Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ

Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır

Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır

Varyans ve Standart Sapma

Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir

1205902 =1

119873

119894=1

119873

119883119894 minus 120583 2

Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır

120590 =1

119873

119894=1

119873

119883119894 minus 120583 2

Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir

1199042 =1

119899 minus 1

119894=1

119899

119883119894 minus ത119883 2

Burada

ത119883 Oumlrnek ortalamasını

1199042 Oumlrnek varyansını

119899 Oumlrnekteki birim sayısını goumlstermektedir

Değişim Katsayısı

Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır

Ccedilarpıklık Katsayısı

Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır

DK =120590

120583

Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır

120572 =12058331205903

Ccedilarpıklık Katsayısı

120572 lt 0 ise dağılım sola ccedilarpıktır

120572 gt 0 ise dağılım sağa ccedilarpıktır

120572 = 0 ise dağılım simetriktir

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 2: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

MERKEZİ EĞİLİM OumlLCcedilUumlTLERİ

Herhangi bir değişken iccedilin toplanan bireysel verilerin genellikle belirli bir merkezinokta civarında değerler aldığı goumlzlemlenmektedir Merkezi eğilim oumllccediluumltleribirimlerin hangi değer etrafında toplandığını goumlsteren ve dolayısıyla ana kitleyitemsil eden (niteleyen) sayısal değerlerdir

Uygulamada en yaygın kullanılan merkezi eğilim oumllccediluumltleri ortalamalar (aritmetikortalama geometrik ortalama harmonik ortalama) ortanca (medyan) ve mod(tepe değer) olarak sayılabilirAritmetik Ortalama

Aritmetik ortalama bireylerin tamamının eşit ağırlığa sahip olduğunu varsayanbir merkezi eğilim oumllccediluumltuumlduumlr Yığın iccedilin aritmetik ortalama aşağıdaki formuumll ilehesaplanır

120583 =1198831 + 1198832 +⋯+ 119883119873

119873=σ119894=1119873 119883119894119873

Burada 120583 yığın iccedilin aritmetik ortalamayı 119873 ise yığındaki birim sayısını goumlstermektedir

Yığından seccedililen bir oumlrnekten hesaplanan aritmetik ortalama ise ത119883 semboluuml ile goumlsterilmekte olup hesaplama formuumlluuml aşağıdaki gibidir

ത119883 =1198831 + 1198832 +⋯+ 119883119899

119899=σ119894=1119899 119883119894119899

Burada 119899 oumlrnekteki birim sayısıdır

Aritmetik ortalamanın oumlzellikleri

Oumllccedilme duumlzeyi en az eşit aralıklı olan değişkenler iccedilinhesaplanabilir Diğer bir ifadeyle nicel değişkenler iccedilinhesaplanabilir

Hesaplama formuumlluumlnde birimlerin tamamını kullanırDolayısıyla aykırı (uccedil) değerlerden etkilenir

Geometrik Ortalama

Herhangi bir değişkenin zamana bağlı olarak izlediğideğişkenlik oranı geometrik ortalama ile oumllccediluumlluumlrHesaplama formuumlluuml aşağıdaki gibidir

119866119874 = 119873 1198831 1198832⋯119883119873 = 1198831 1198832⋯119883119873Τ1 119873

Geometrik ortalamanın oumlzellikleri

Hesaplama formuumlluumlnde birimlerin tamamını kullanırAncak aykırı (uccedil) değerlerden aritmetik ortalama kadaretkilenmez

Geometrik artış (ya da azalış) goumlsteren diziler iccedilinhesaplanması uygundur

Veriler arasında sıfır ya da negatif değerler olmasıdurumunda geometrik ortalama hesaplanamaz

Harmonik Ortalama

Bir aracın saatteki hızı hane halkı başına gelir arazi başına uumlretim gibi ldquoYbaşına Xrdquo olarak ifade edilen ve ldquoXrsquoin sabitrdquo olduğu durumlar iccedilin kullanılanmerkezi eğilim oumllccediluumltuuml harmonik ortalamadır Buna karşın ldquoY sabitrdquoolduğunda tercih edilen merkezi eğilim oumllccediluumltuuml aritmetik ortalamadır Bireyselveriler iccedilin harmonik ortalamanın formuumlluuml aşağıda verilmiştir

119867119874 =119873

σ119894=1119873 1

119883119894Oumlrneğin A şehirden B şehrine uzaklık 300 kilometre (km) olsun A şehrindenB şehrine bir suumlruumlcuuml ilk 100 kmrsquoyi saatte 100 km hızla ikinci 100 km saatte80 km hızla ve geri kalan mesafeyi ise saatte 90 km hızla gitmiştir Buoumlrnekte Y saati ve X kmrsquo yi goumlstermek uumlzere ldquoY başına Xrdquo ifadesi ldquosaatbaşına kmrdquo olmaktadır Aynı zamanda Xrsquo ler 100 kmrsquo lik mesafeler ile sabitolup uygun ortalama oumllccediluumltuuml harmonik olmaktadır

119867119874 =3

1100

+180

+190

= 8926 kmsaat

Harmonik ortalamanın oumlzellikleri

Veriler arasında sıfır ya da negatif değerler olması durumundaharmonik ortalama hesaplanamaz

Harmonik ortalama aritmetik ve geometrik ortalamaya goumlreaşağı eğilimlidir Diğer bir deyişle 119867119874 le 119866119874 le 120583 olmaktadır

Ortanca (Medyan)

Ortanca hesabından oumlnce bireysel veriler kuumlccediluumlkten buumlyuumlğe doğrusıralanmalıdır Ortanca sıralı dizilerde ortaya duumlşen değerdir

Goumlzlem sayısı 119873 tek sayı olduğunda ortanca 119883 119873+1 2 minus incideğer iken

119873 ccedilift sayı olduğunda ortanca Τ1198831198732 + 119883(119873+2)2 2 olarak

hesaplanır

Ortancanın oumlzellikleri

En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır

Tepe Değer (Mod)

En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz

Tepe değerin oumlzellikleri

Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ

Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır

Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır

Varyans ve Standart Sapma

Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir

1205902 =1

119873

119894=1

119873

119883119894 minus 120583 2

Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır

120590 =1

119873

119894=1

119873

119883119894 minus 120583 2

Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir

1199042 =1

119899 minus 1

119894=1

119899

119883119894 minus ത119883 2

Burada

ത119883 Oumlrnek ortalamasını

1199042 Oumlrnek varyansını

119899 Oumlrnekteki birim sayısını goumlstermektedir

Değişim Katsayısı

Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır

Ccedilarpıklık Katsayısı

Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır

DK =120590

120583

Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır

120572 =12058331205903

Ccedilarpıklık Katsayısı

120572 lt 0 ise dağılım sola ccedilarpıktır

120572 gt 0 ise dağılım sağa ccedilarpıktır

120572 = 0 ise dağılım simetriktir

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 3: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Yığından seccedililen bir oumlrnekten hesaplanan aritmetik ortalama ise ത119883 semboluuml ile goumlsterilmekte olup hesaplama formuumlluuml aşağıdaki gibidir

ത119883 =1198831 + 1198832 +⋯+ 119883119899

119899=σ119894=1119899 119883119894119899

Burada 119899 oumlrnekteki birim sayısıdır

Aritmetik ortalamanın oumlzellikleri

Oumllccedilme duumlzeyi en az eşit aralıklı olan değişkenler iccedilinhesaplanabilir Diğer bir ifadeyle nicel değişkenler iccedilinhesaplanabilir

Hesaplama formuumlluumlnde birimlerin tamamını kullanırDolayısıyla aykırı (uccedil) değerlerden etkilenir

Geometrik Ortalama

Herhangi bir değişkenin zamana bağlı olarak izlediğideğişkenlik oranı geometrik ortalama ile oumllccediluumlluumlrHesaplama formuumlluuml aşağıdaki gibidir

119866119874 = 119873 1198831 1198832⋯119883119873 = 1198831 1198832⋯119883119873Τ1 119873

Geometrik ortalamanın oumlzellikleri

Hesaplama formuumlluumlnde birimlerin tamamını kullanırAncak aykırı (uccedil) değerlerden aritmetik ortalama kadaretkilenmez

Geometrik artış (ya da azalış) goumlsteren diziler iccedilinhesaplanması uygundur

Veriler arasında sıfır ya da negatif değerler olmasıdurumunda geometrik ortalama hesaplanamaz

Harmonik Ortalama

Bir aracın saatteki hızı hane halkı başına gelir arazi başına uumlretim gibi ldquoYbaşına Xrdquo olarak ifade edilen ve ldquoXrsquoin sabitrdquo olduğu durumlar iccedilin kullanılanmerkezi eğilim oumllccediluumltuuml harmonik ortalamadır Buna karşın ldquoY sabitrdquoolduğunda tercih edilen merkezi eğilim oumllccediluumltuuml aritmetik ortalamadır Bireyselveriler iccedilin harmonik ortalamanın formuumlluuml aşağıda verilmiştir

119867119874 =119873

σ119894=1119873 1

119883119894Oumlrneğin A şehirden B şehrine uzaklık 300 kilometre (km) olsun A şehrindenB şehrine bir suumlruumlcuuml ilk 100 kmrsquoyi saatte 100 km hızla ikinci 100 km saatte80 km hızla ve geri kalan mesafeyi ise saatte 90 km hızla gitmiştir Buoumlrnekte Y saati ve X kmrsquo yi goumlstermek uumlzere ldquoY başına Xrdquo ifadesi ldquosaatbaşına kmrdquo olmaktadır Aynı zamanda Xrsquo ler 100 kmrsquo lik mesafeler ile sabitolup uygun ortalama oumllccediluumltuuml harmonik olmaktadır

119867119874 =3

1100

+180

+190

= 8926 kmsaat

Harmonik ortalamanın oumlzellikleri

Veriler arasında sıfır ya da negatif değerler olması durumundaharmonik ortalama hesaplanamaz

Harmonik ortalama aritmetik ve geometrik ortalamaya goumlreaşağı eğilimlidir Diğer bir deyişle 119867119874 le 119866119874 le 120583 olmaktadır

Ortanca (Medyan)

Ortanca hesabından oumlnce bireysel veriler kuumlccediluumlkten buumlyuumlğe doğrusıralanmalıdır Ortanca sıralı dizilerde ortaya duumlşen değerdir

Goumlzlem sayısı 119873 tek sayı olduğunda ortanca 119883 119873+1 2 minus incideğer iken

119873 ccedilift sayı olduğunda ortanca Τ1198831198732 + 119883(119873+2)2 2 olarak

hesaplanır

Ortancanın oumlzellikleri

En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır

Tepe Değer (Mod)

En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz

Tepe değerin oumlzellikleri

Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ

Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır

Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır

Varyans ve Standart Sapma

Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir

1205902 =1

119873

119894=1

119873

119883119894 minus 120583 2

Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır

120590 =1

119873

119894=1

119873

119883119894 minus 120583 2

Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir

1199042 =1

119899 minus 1

119894=1

119899

119883119894 minus ത119883 2

Burada

ത119883 Oumlrnek ortalamasını

1199042 Oumlrnek varyansını

119899 Oumlrnekteki birim sayısını goumlstermektedir

Değişim Katsayısı

Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır

Ccedilarpıklık Katsayısı

Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır

DK =120590

120583

Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır

120572 =12058331205903

Ccedilarpıklık Katsayısı

120572 lt 0 ise dağılım sola ccedilarpıktır

120572 gt 0 ise dağılım sağa ccedilarpıktır

120572 = 0 ise dağılım simetriktir

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 4: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Geometrik Ortalama

Herhangi bir değişkenin zamana bağlı olarak izlediğideğişkenlik oranı geometrik ortalama ile oumllccediluumlluumlrHesaplama formuumlluuml aşağıdaki gibidir

119866119874 = 119873 1198831 1198832⋯119883119873 = 1198831 1198832⋯119883119873Τ1 119873

Geometrik ortalamanın oumlzellikleri

Hesaplama formuumlluumlnde birimlerin tamamını kullanırAncak aykırı (uccedil) değerlerden aritmetik ortalama kadaretkilenmez

Geometrik artış (ya da azalış) goumlsteren diziler iccedilinhesaplanması uygundur

Veriler arasında sıfır ya da negatif değerler olmasıdurumunda geometrik ortalama hesaplanamaz

Harmonik Ortalama

Bir aracın saatteki hızı hane halkı başına gelir arazi başına uumlretim gibi ldquoYbaşına Xrdquo olarak ifade edilen ve ldquoXrsquoin sabitrdquo olduğu durumlar iccedilin kullanılanmerkezi eğilim oumllccediluumltuuml harmonik ortalamadır Buna karşın ldquoY sabitrdquoolduğunda tercih edilen merkezi eğilim oumllccediluumltuuml aritmetik ortalamadır Bireyselveriler iccedilin harmonik ortalamanın formuumlluuml aşağıda verilmiştir

119867119874 =119873

σ119894=1119873 1

119883119894Oumlrneğin A şehirden B şehrine uzaklık 300 kilometre (km) olsun A şehrindenB şehrine bir suumlruumlcuuml ilk 100 kmrsquoyi saatte 100 km hızla ikinci 100 km saatte80 km hızla ve geri kalan mesafeyi ise saatte 90 km hızla gitmiştir Buoumlrnekte Y saati ve X kmrsquo yi goumlstermek uumlzere ldquoY başına Xrdquo ifadesi ldquosaatbaşına kmrdquo olmaktadır Aynı zamanda Xrsquo ler 100 kmrsquo lik mesafeler ile sabitolup uygun ortalama oumllccediluumltuuml harmonik olmaktadır

119867119874 =3

1100

+180

+190

= 8926 kmsaat

Harmonik ortalamanın oumlzellikleri

Veriler arasında sıfır ya da negatif değerler olması durumundaharmonik ortalama hesaplanamaz

Harmonik ortalama aritmetik ve geometrik ortalamaya goumlreaşağı eğilimlidir Diğer bir deyişle 119867119874 le 119866119874 le 120583 olmaktadır

Ortanca (Medyan)

Ortanca hesabından oumlnce bireysel veriler kuumlccediluumlkten buumlyuumlğe doğrusıralanmalıdır Ortanca sıralı dizilerde ortaya duumlşen değerdir

Goumlzlem sayısı 119873 tek sayı olduğunda ortanca 119883 119873+1 2 minus incideğer iken

119873 ccedilift sayı olduğunda ortanca Τ1198831198732 + 119883(119873+2)2 2 olarak

hesaplanır

Ortancanın oumlzellikleri

En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır

Tepe Değer (Mod)

En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz

Tepe değerin oumlzellikleri

Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ

Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır

Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır

Varyans ve Standart Sapma

Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir

1205902 =1

119873

119894=1

119873

119883119894 minus 120583 2

Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır

120590 =1

119873

119894=1

119873

119883119894 minus 120583 2

Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir

1199042 =1

119899 minus 1

119894=1

119899

119883119894 minus ത119883 2

Burada

ത119883 Oumlrnek ortalamasını

1199042 Oumlrnek varyansını

119899 Oumlrnekteki birim sayısını goumlstermektedir

Değişim Katsayısı

Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır

Ccedilarpıklık Katsayısı

Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır

DK =120590

120583

Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır

120572 =12058331205903

Ccedilarpıklık Katsayısı

120572 lt 0 ise dağılım sola ccedilarpıktır

120572 gt 0 ise dağılım sağa ccedilarpıktır

120572 = 0 ise dağılım simetriktir

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 5: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Harmonik Ortalama

Bir aracın saatteki hızı hane halkı başına gelir arazi başına uumlretim gibi ldquoYbaşına Xrdquo olarak ifade edilen ve ldquoXrsquoin sabitrdquo olduğu durumlar iccedilin kullanılanmerkezi eğilim oumllccediluumltuuml harmonik ortalamadır Buna karşın ldquoY sabitrdquoolduğunda tercih edilen merkezi eğilim oumllccediluumltuuml aritmetik ortalamadır Bireyselveriler iccedilin harmonik ortalamanın formuumlluuml aşağıda verilmiştir

119867119874 =119873

σ119894=1119873 1

119883119894Oumlrneğin A şehirden B şehrine uzaklık 300 kilometre (km) olsun A şehrindenB şehrine bir suumlruumlcuuml ilk 100 kmrsquoyi saatte 100 km hızla ikinci 100 km saatte80 km hızla ve geri kalan mesafeyi ise saatte 90 km hızla gitmiştir Buoumlrnekte Y saati ve X kmrsquo yi goumlstermek uumlzere ldquoY başına Xrdquo ifadesi ldquosaatbaşına kmrdquo olmaktadır Aynı zamanda Xrsquo ler 100 kmrsquo lik mesafeler ile sabitolup uygun ortalama oumllccediluumltuuml harmonik olmaktadır

119867119874 =3

1100

+180

+190

= 8926 kmsaat

Harmonik ortalamanın oumlzellikleri

Veriler arasında sıfır ya da negatif değerler olması durumundaharmonik ortalama hesaplanamaz

Harmonik ortalama aritmetik ve geometrik ortalamaya goumlreaşağı eğilimlidir Diğer bir deyişle 119867119874 le 119866119874 le 120583 olmaktadır

Ortanca (Medyan)

Ortanca hesabından oumlnce bireysel veriler kuumlccediluumlkten buumlyuumlğe doğrusıralanmalıdır Ortanca sıralı dizilerde ortaya duumlşen değerdir

Goumlzlem sayısı 119873 tek sayı olduğunda ortanca 119883 119873+1 2 minus incideğer iken

119873 ccedilift sayı olduğunda ortanca Τ1198831198732 + 119883(119873+2)2 2 olarak

hesaplanır

Ortancanın oumlzellikleri

En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır

Tepe Değer (Mod)

En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz

Tepe değerin oumlzellikleri

Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ

Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır

Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır

Varyans ve Standart Sapma

Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir

1205902 =1

119873

119894=1

119873

119883119894 minus 120583 2

Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır

120590 =1

119873

119894=1

119873

119883119894 minus 120583 2

Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir

1199042 =1

119899 minus 1

119894=1

119899

119883119894 minus ത119883 2

Burada

ത119883 Oumlrnek ortalamasını

1199042 Oumlrnek varyansını

119899 Oumlrnekteki birim sayısını goumlstermektedir

Değişim Katsayısı

Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır

Ccedilarpıklık Katsayısı

Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır

DK =120590

120583

Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır

120572 =12058331205903

Ccedilarpıklık Katsayısı

120572 lt 0 ise dağılım sola ccedilarpıktır

120572 gt 0 ise dağılım sağa ccedilarpıktır

120572 = 0 ise dağılım simetriktir

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 6: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Harmonik ortalamanın oumlzellikleri

Veriler arasında sıfır ya da negatif değerler olması durumundaharmonik ortalama hesaplanamaz

Harmonik ortalama aritmetik ve geometrik ortalamaya goumlreaşağı eğilimlidir Diğer bir deyişle 119867119874 le 119866119874 le 120583 olmaktadır

Ortanca (Medyan)

Ortanca hesabından oumlnce bireysel veriler kuumlccediluumlkten buumlyuumlğe doğrusıralanmalıdır Ortanca sıralı dizilerde ortaya duumlşen değerdir

Goumlzlem sayısı 119873 tek sayı olduğunda ortanca 119883 119873+1 2 minus incideğer iken

119873 ccedilift sayı olduğunda ortanca Τ1198831198732 + 119883(119873+2)2 2 olarak

hesaplanır

Ortancanın oumlzellikleri

En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır

Tepe Değer (Mod)

En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz

Tepe değerin oumlzellikleri

Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ

Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır

Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır

Varyans ve Standart Sapma

Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir

1205902 =1

119873

119894=1

119873

119883119894 minus 120583 2

Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır

120590 =1

119873

119894=1

119873

119883119894 minus 120583 2

Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir

1199042 =1

119899 minus 1

119894=1

119899

119883119894 minus ത119883 2

Burada

ത119883 Oumlrnek ortalamasını

1199042 Oumlrnek varyansını

119899 Oumlrnekteki birim sayısını goumlstermektedir

Değişim Katsayısı

Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır

Ccedilarpıklık Katsayısı

Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır

DK =120590

120583

Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır

120572 =12058331205903

Ccedilarpıklık Katsayısı

120572 lt 0 ise dağılım sola ccedilarpıktır

120572 gt 0 ise dağılım sağa ccedilarpıktır

120572 = 0 ise dağılım simetriktir

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 7: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Ortancanın oumlzellikleri

En az sıralama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilir

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedildeğerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

Birimlerin yarısı ortancadan kuumlccediluumlk diğer yarısı ise ortancadan buumlyuumlkdeğerler alır

Tepe Değer (Mod)

En ccedilok tekrar eden değere tepe değer adı verilir 1rsquoden fazla tepe değeriolabilir Ya da her değer sadece 1 kez goumlzlendiğinde tepe değerhesaplanamaz

Tepe değerin oumlzellikleri

Sınıflama duumlzeyinde oumllccediluumllen değişkenler iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuumlduumlr

Hesaplama formuumlluuml birimlerin tamamını kullanmaz Bu nedenle uccedil değerlerden etkilenmez

Matematiksel işlemlere ortalama kadar uygun değildir

MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ

Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır

Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır

Varyans ve Standart Sapma

Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir

1205902 =1

119873

119894=1

119873

119883119894 minus 120583 2

Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır

120590 =1

119873

119894=1

119873

119883119894 minus 120583 2

Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir

1199042 =1

119899 minus 1

119894=1

119899

119883119894 minus ത119883 2

Burada

ത119883 Oumlrnek ortalamasını

1199042 Oumlrnek varyansını

119899 Oumlrnekteki birim sayısını goumlstermektedir

Değişim Katsayısı

Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır

Ccedilarpıklık Katsayısı

Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır

DK =120590

120583

Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır

120572 =12058331205903

Ccedilarpıklık Katsayısı

120572 lt 0 ise dağılım sola ccedilarpıktır

120572 gt 0 ise dağılım sağa ccedilarpıktır

120572 = 0 ise dağılım simetriktir

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 8: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

MERKEZİ DAĞILIM OumlLCcedilUumlTLERİ

Birimlerin hangi değer etrafında toplandığını goumlstereneğilim oumllccediluumltleri (ortalamalar) ccediloğu zaman yeterli bilgiyisağlayamamaktadır Oumlrneğin A ve B hisse senetlerifiyatlarına ilişkin guumlnluumlk ortalamaların eşit olduğunuvarsayalım Bu durumda A ve B hisse senetleri iccedilin ortalamadeğerlerin kıyaslanması anlamlı olmamaktadır Buna karşınhisse senedi fiyatları iccedilin ortalamalar aynı olsa da ortalamacivarındaki dağılımları farklılaşacaktır Hisse senedi fiyatıbakımından ortalama civarındaki dağılımı daha homojen(tuumlrdeş) olan zaman iccedilerisinde daha istikrarlı bir seyirizlemektedir Daha istikrarlı olan hisse senedi iccedilin risk dahaaz olacaktır

Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır

Varyans ve Standart Sapma

Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir

1205902 =1

119873

119894=1

119873

119883119894 minus 120583 2

Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır

120590 =1

119873

119894=1

119873

119883119894 minus 120583 2

Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir

1199042 =1

119899 minus 1

119894=1

119899

119883119894 minus ത119883 2

Burada

ത119883 Oumlrnek ortalamasını

1199042 Oumlrnek varyansını

119899 Oumlrnekteki birim sayısını goumlstermektedir

Değişim Katsayısı

Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır

Ccedilarpıklık Katsayısı

Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır

DK =120590

120583

Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır

120572 =12058331205903

Ccedilarpıklık Katsayısı

120572 lt 0 ise dağılım sola ccedilarpıktır

120572 gt 0 ise dağılım sağa ccedilarpıktır

120572 = 0 ise dağılım simetriktir

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 9: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Bir başka oumlrnekte doumlviz kurları iccedilin verilebilir Şoumlyle kienflasyon hedeflemesi rejimi uygulayan Merkez Bankalarıiccedilin doumlviz kurları serbest piyasada belirlenmektedir MerkezBankaları doumlviz kurunun değerine değil ancak kurlardakioynaklığa (volatiliteye) bağlı olarak piyasaya muumldahaledebulunmaktadır Oynaklık kurların dağılımlarındaki genelgidişatın izlenmesi ile oumllccediluumllmektedir Oynaklığın sayısalolarak ifadesi ise merkezi dağılım oumllccediluumltleri ile muumlmkuumlnolmaktadır Uygulamada en ccedilok kullanılan merkezi dağılımoumllccediluumltleri varyans ve standart sapma ile değişim katsayısıdır

Varyans ve Standart Sapma

Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir

1205902 =1

119873

119894=1

119873

119883119894 minus 120583 2

Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır

120590 =1

119873

119894=1

119873

119883119894 minus 120583 2

Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir

1199042 =1

119899 minus 1

119894=1

119899

119883119894 minus ത119883 2

Burada

ത119883 Oumlrnek ortalamasını

1199042 Oumlrnek varyansını

119899 Oumlrnekteki birim sayısını goumlstermektedir

Değişim Katsayısı

Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır

Ccedilarpıklık Katsayısı

Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır

DK =120590

120583

Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır

120572 =12058331205903

Ccedilarpıklık Katsayısı

120572 lt 0 ise dağılım sola ccedilarpıktır

120572 gt 0 ise dağılım sağa ccedilarpıktır

120572 = 0 ise dağılım simetriktir

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 10: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Varyans ve Standart Sapma

Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır Bu nedenleverilerin ortalamadan farklarına dayalı bir dağılım oumllccediluumltuuml hesaplanamaz Varyansveriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilirBireysel veriler iccedilin yığın varyansının hesaplama formuumlluuml aşağıdaki gibidir

1205902 =1

119873

119894=1

119873

119883119894 minus 120583 2

Karesel bir ifadenin ortalaması daima sıfırdan buumlyuumlk olacaktır O halde varyansiccedilin tanım aralığı 0 ile +infin olmaktadır Yorumu ise şu şekilde yapılabilir Varyansdeğeri sıfıra yaklaştıkccedila dağılımın homojenliği artacaktır Diğer bir ifadeylevaryans değeri sıfırdan uzaklaştıkccedila dağılımındaki homojenlik azalacak dolayısıylaheterojenlik artacaktır Varyansın birimi 119883rsquo in oumllccediluuml biriminin karesidir Bu nedenleuygulamada varyans yerine onun pozitif karekoumlkuuml olan standart sapma kullanılırBoumlylece 119883rsquo in oumllccediluuml birimi ile ifade edilen bir dağılım oumllccediluumltuumlne geccedililmiş olmaktadır

120590 =1

119873

119894=1

119873

119883119894 minus 120583 2

Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir

1199042 =1

119899 minus 1

119894=1

119899

119883119894 minus ത119883 2

Burada

ത119883 Oumlrnek ortalamasını

1199042 Oumlrnek varyansını

119899 Oumlrnekteki birim sayısını goumlstermektedir

Değişim Katsayısı

Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır

Ccedilarpıklık Katsayısı

Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır

DK =120590

120583

Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır

120572 =12058331205903

Ccedilarpıklık Katsayısı

120572 lt 0 ise dağılım sola ccedilarpıktır

120572 gt 0 ise dağılım sağa ccedilarpıktır

120572 = 0 ise dağılım simetriktir

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 11: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Yığından seccedililen rastgele bir oumlrnekten bulunan oumlrnek varyansı iccedilin hesaplama formuumlluumlaşağıdaki gibidir

1199042 =1

119899 minus 1

119894=1

119899

119883119894 minus ത119883 2

Burada

ത119883 Oumlrnek ortalamasını

1199042 Oumlrnek varyansını

119899 Oumlrnekteki birim sayısını goumlstermektedir

Değişim Katsayısı

Dağılım oumllccediluumltuuml olarak standart sapmanın birimi 119883rsquoin birimidir Buna karşın iki ya da daha fazla yığın herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında ilgili değişkenin oumllccedilme birimleri farklı olabilir Oumlrneğin Tuumlrkiye ile ABDrsquoni gelir dağılımları bakımından karşılaştırdığımızda şayet gelirin birimi Tuumlrkiye iccedilin TL ABD iccedilin US dolar ise standart sapmanın kullanılması uygun olmayacaktır Gerekli doumlnuumlşuumlm yapılıp Tuumlrkiye iccedilin gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz Bu nedenle değişkenin oumllccediluuml biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım oumllccediluumltuumlne ihtiyaccedil vardır Bu oumllccediluumlt değişim katsayısıdır

Ccedilarpıklık Katsayısı

Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır

DK =120590

120583

Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır

120572 =12058331205903

Ccedilarpıklık Katsayısı

120572 lt 0 ise dağılım sola ccedilarpıktır

120572 gt 0 ise dağılım sağa ccedilarpıktır

120572 = 0 ise dağılım simetriktir

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 12: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Ccedilarpıklık Katsayısı

Değişim katsayısı standart sapmanın aritmetik ortalamaya oranıile bulunan ve dolayısıyla birimden bağımsız olan bir oumllccediluumlttuumlrDK değişim katsayısını goumlstermek uumlzere bu katsayı aşağıdaki gibihesaplanır

DK =120590

120583

Herhangi bir değişkenin ortalamalara goumlre simetrik olup olmadığıccedilarpıklık katsayısı ile hesaplanmaktadır Asimetrik durum ise solaya da sağa ccedilarpık şeklinde iki farklı durumundan biri olarakkarşımıza ccedilıkmaktadır Merkezi eğilim oumllccediluumltlerinden aritmetikortalama ortanca ve tepe değer birbirine eşitse dağılımın simetrikolduğu kararına varılır

120572 =12058331205903

Ccedilarpıklık Katsayısı

120572 lt 0 ise dağılım sola ccedilarpıktır

120572 gt 0 ise dağılım sağa ccedilarpıktır

120572 = 0 ise dağılım simetriktir

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 13: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Ccedilarpıklık Katsayısı

120572 lt 0 ise dağılım sola ccedilarpıktır

120572 gt 0 ise dağılım sağa ccedilarpıktır

120572 = 0 ise dağılım simetriktir

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 14: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Basıklık Katsayısı

Dağılımın varyansı ile ilgili bir oumlzelliktir Verilerin varyansıkuumlccediluumlkse daha sivri bir dağılıma varyansı buumlyuumlkse dahabasık bir dağılıma sahiptir

bull Basıklık Katsayısı

bull120574 lt 0 ise dağılım basıktır

bull120574 gt 0 ise dağılım sivridir

bull120574 = 0 ise dağılım normaldir

120574 =12058341205904

minus 3

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 15: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

SPSSrsquoTE VERİ GİRİŞİ

385 kişiye yapılan anket soruları aşağıdaki verilmiştir

Soru 1 Cinsiyetiniz

Erkek (1) Kadın (2)

Soru 2 Yaşınız helliphelliphelliphelliphellip

Soru 3 Mesleğiniz

Emekli (1) EsnafZanaatkar (2) Ev Kadını (3)

İşccedili (4) İşsiz (5) Memur (6)

Serbest Meslek (Doktor Avukat Muumlhendis Eczacı vb) (7)

Tuumlccarİşadamı (8)

Soru 4 Eğitim Durumunuz

İlkoumlğretim (1) Lise (2) Uumlniversite (3)

Soru 5 Aylık Toplam Geliriniz helliphelliphelliphellip

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 16: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Kesinlikle

Katılmıyorum

(1)

Katılmıyorum

(2)

Kararsızım

(3)Katılıyorum

(4)

Kesinlikle

Katılıyorum

(5)

L1Verilen Hizmetin

Kalitesi Yuumlksektir

L2Verilen hizmet iccedilin

bekleme suumlresi azdır

L3Ccedilalışan kişilerin

hizmet sunumu yuumlksektir

L4

İlgili personelin muumlşteri

şikacircyetlerini youmlnetme davranışı

iyidir

L5 İşyerlerine ulaşım kolaydır

L6Ccedilalışan personelin

muumlşteriye davranışı iyidir

L7Yuumlruumltuumllen işlemler başarıyla

tamamlanmaktadır

L8Verilen hizmetlerinin

ccedileşitliliği yeterlidir

L9Verilen hizmetler iccedilin

uygun fiyatlar alınmaktadır

L10Benzer hizmet sunan

birimlerden daha guumlvenlidir

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 17: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Verilerin frekans tablosunu merkezi eğilim ve dağılım

oumllccediluumltlerini hesaplar ve grafiklerini ccedilizer

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 18: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Yukarıdaki pencerede frekans dağılımı oluşturulmak istenilendeğişkenler Variable(s) kısmına atılarak OKrsquoe basılır

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 19: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Yukarıdaki verilen eğitim duumlzeyine ait frekans dağılımıtablosunda ankete katılan 385 kişinin 111rsquoi İlkoumlğretim 172rsquosiLise ve 102rsquosi Uumlniversite mezunudur Percent suumltunu frekanslarınyuumlzdelik dağılımını vermektedir Buna goumlre ankete katılanların288rsquoi İlkoumlğretim 447rsquosi Lise ve 265rsquou Uumlniversite mezunudur

Şayet değişkenin iccedilinde lsquokayıp goumlzlemrsquo varsa Percent yerineValid Percent suumltunu yorumlanır

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 20: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Merkezi Eğilim ve Dağılım Oumllccediluumltlerinin Elde Edilmesi

SPSSrsquote Analyze rarr Descriptive Statistics rarr Frequences rarr Statisticskısmına girilerek ilgili merkezi eğilim ve dağılım oumllccediluumltleri seccedililir

Mean= Aritmetik Ortalama

Median= Medyan

Mode= Mod (Tepe Değer)

Std Deviation= Standart Sapma

Variance=Varyans

Range=Accedilıklık

(Maksimum-Minimum)

Skewness=Ccedilarpıklık

Kurtosis=Basıklık

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 21: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Ankete katılan 385 kişinin aylık

ortalama geliri 2009 TL Ortanca gelir

1672 TL standart sapma 1174 TL dir

Mod değerinin uumlzerinde tanımlanan

lsquoarsquo accedilıklaması birden fazla mod değeri

olduğunu goumlstermektedir

Ccedilarpıklık ve Basıklık oumllccediluumltleri

incelendiğinde aylık gelir değişkeni

Ccedilarpıklık=1062 ile sağa ccedilarpık bir

dağılıma Basıklık=0542 ile de sivri

bir dağılıma (varyansı kuumlccediluumlk) sahiptir

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 22: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Hangi oumllccedilme duumlzeyinde hangi merkezi eğilim ve dağılımoumllccediluumltuumlnuuml kullanmak gerektiği aşağıdaki tabloda verilmiştir

Oumllccedilme Duumlzeyi Oumllccediluumlt

Sınıflama (Nominal) Mod

Sıralama (Ordinal) Mod Medyan

Eşit Aralıklı (Interval)Tuumlm merkezi eğilim ve dağılım

oumllccediluumltleri kullanılırOranlama (Ratio)

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 23: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Aylık toplam gelir değişkenin dağılımını Histogramına bakarak

goumlrebiliriz SPSSrsquode Analyze rarr Descriptive Statistics rarr Frequences

rarr Charts kısmına girilerek Histogram ccedilizdirilir

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 24: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

EXPLORE MENUumlSUuml

Tuumlm birimlerin yada her bir gruptaki birimlerin betimleyici

istatistiklerini hesaplar

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 25: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Dependent variable kısmına nicel bir değişken ve factor list

kısmına ise sınıflama veya sıralama oumllccedilme duumlzeyinde oumllccediluumllmuumlş

nitel bir değişken atılır

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 26: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Yukarıdaki tabloda hem erkek hem de kadınlar iccedilin ayrı ayrı

aylık toplam gelire ait merkezi eğilim ve dağılım oumllccediluumltleri yer

almaktadır

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 27: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Meslek değişkeni iccedilin hesaplanabilen tek merkezi eğilim oumllccediluumltuuml tepe değerdir (mod)

Mod ve medyan aykırı (uccedil) değerlerden etkilenmez

Aritmetik ortalama birimlerin tamamını kullanmaz

Sağa ccedilarpık bir dağılımda mod değeri en buumlyuumlktuumlr

Sola ccedilarpık bir dağılımda birimlerin ccediloğunluğu ortalamadan daha buumlyuumlk değer alır

Standart sapmanın birimi yoktur (birimden bağımsızdır)

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 28: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

TEST SORULARIS-1) Aşağıdaki merkezi eğilim oumllccediluumltlerinden hangisi (hangileri) aykırı değerlerden etkilenmez

A) Mod B) Medyan C) Aritmetik ortalama D) Mod ve medyan

S-2) Boy uzunluğu (cm) iccedilin hesaplanan standart sapma iccedilin birim aşağıdakilerden hangisidir

A) Birimi yoktur B) cm C) 1198881198982 D) 11988811989812

S-3) Ccedilarpıklık katsayısı -05 ve basıklık katsayısı 08 iken aşağıdaki yorumlardan hangisi doğrudur

A) Sola ccedilarpık ve basık B) Sağa ccedilarpık ve sivri

C) Sola ccedilarpık ve sivri D) Sola ccedilarpık ve normal

S-4) Herhangi bir değişkenin zamana bağlı olarak izlediği değişkenlik oranı hangi merkezi eğilim oumllccediluumltuuml ile hesaplanmalıdır

A) Aritmetik B) Geometrik C) Harmonik D) Medyan

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 29: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

NİCEL VERİ ANALİZİ

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 30: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

HİPOTEZ TESTLERİ

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlaraistatistiksel hipotez denir

Hipotezin yığından seccedililen bir oumlrneklem vasıtasıylaincelenmesine hipotez testi adı verilir

Hipotez testinde işlem parametrenin belirli bir değere eşitolduğu şeklindeki ldquosıfır hipotezi (1198670)rdquo ile parametrenin belirlibir değerden kuumlccediluumlk buumlyuumlk veya farklı olduğu şeklindekialternatif hipotezden ( 1198671 ) hangisinin oumlrnekle daha iyibağdaştığını goumlstermektir

Hipotez testinde sıfır hipotezinin doğru olduğu varsayımı ileteste başlanır

Oumlrnekten elde edilen sonuccedil sıfır hipotezi doğru iken buumlyuumlk birolasılıkla karşılaşılabilecek bir sonuccedilsa sıfır hipotezi kabul edilirBuna karşın oumlrneğin verdiği sonuccedil sıfır hipotezi doğru iken ccedilok zayıfbir olasılıkla karşımıza ccedilıkabilecek bir sonuccedilsa sıfır hipotezireddedilir ve dolayısıyla alternatif hipotez kabul edilir

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 31: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Bir hipotez testi sonucunda verilen karar iccedilin aşağıdaki doumlrtdurumdan birisi soumlz konusu olacaktır

Uygulamada 120572 iccedilin genellikle 10 5 veya 1 değerleriseccedililir 120572 ile 120573 arasında ters youmlnde bir ilişki vardır 120572 araştırmacıtarafından belirlendikten sonra 120573 rsquonın değerinin testi yapantarafından belirlenmesi muumlmkuumln değildir Burada yapılacakişlem 120572 belli iken 120573rsquoyı minimum yapacak yollara başvurmaktır

Karar

1198670 Red Edildi 1198670 Red Edilemedi

1198670 Gerccedilekte

Doğru Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

YanlışDoğru Karar

(Testin Guumlcuuml=1 minus 120573)Yanlış Karar

(II Tip Hata=120573)

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 32: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Karar

1198670 Red Edildi

(Succedillu)

1198670 Red Edilemedi

(Masum)

1198670

Masum

(Doğru)

Yanlış Karar

(I Tip Hata=120572)Doğru Karar

(Guumlven Duumlzeyi=1 minus 120572)

Succedillu

(Yanlış)

Doğru Karar

(Testin Guumlcuuml=1 minus 120573)

Yanlış Karar

(II Tip Hata=120573)

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 33: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

βyı Etkileyen Faktoumlrler

Hipotezdeki parametre değeri ile parametrenin gerccedilek değeriarasındaki fark arttıkccedila da artar

Anlamlılık duumlzeyi 120572 azalırken 120573 artar

Yığın standart sapması 120590 arttıkccedila 120573 artar

Oumlrnek hacmi 119899 azaldıkccedila 120573 artar

Hipotez testlerinde izlenmesi gereken aşamalar şoumlyledir

Hipotezlerin kurulması

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabul boumllgelerininbelirlenmesi

Test istatistiğinin hesaplanması

Karar

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 34: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Hipotezlerin Kurulması

Hipotez testlerinde 1198670hipotezinin doğru olduğu varsayımıyapılır

Hipotez yığın parametresine ilişkin ortaya atılan biriddiadır

1198670 hipotezi parametrenin belirli bir değere eşitliğini ifadeetmektedir

Oumlrneğin ldquoA-boumllgesindeki hane-halklarının ortalama aylıkgeliri en az 2000 TLrsquodirrdquo iddiasında parametre yığınortalaması 120583 olup hipotezler aşağıdaki gibi kurulur

1198670 120583 = 2000

1198671 120583 gt 2000

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 35: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

İlgili İstatistiğin Oumlrnekleme Dağılımı Uumlzerinde Ret ve Kabul Boumllgelerinin Belirlenmesi

İlgili istatistiğin oumlrnekleme dağılımı uumlzerinde ret ve kabulboumllgeleri 120572anlamlılık duumlzeyi ve alternatif hipotez 1198671 dikkatealınarak belirlenir

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 36: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Test İstatistiğinin Hesaplanması

Ortalama iccedilin hipotez testinde ldquotest istatistiğirdquo standartnormal değişken (Z) ya da serbestlik derecesi n-1 olanstudent t-değişkeni olmaktadır Yığın oranına ilişkin hipoteztestinde test istatistiği standart normal değişken (Z) ikenyığın varyansı iccedilin bu istatistik serbestlik derecesi n-1 olanki-kare değişkeni olmaktadır

Karar Kuralı

İlgili istatistik iccedilin hesaplanan test istatistiğinin değeri retboumllgesinde ise 1198670 hipotezi 120572 anlamlılık duumlzeyindereddedilebilir kararına varılır Bu sonuccedil dolaylı olarak 1198671hipotezinin kabul edilmesi anlamına gelmektedir Bunakarşın test istatistiğinin değeri kabul boumllgesine duumlşerse 1198670hipotezi seccedililen anlamlılık duumlzeyinde reddedilemez

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 37: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Olasılık değeri (p-değeri) sıfır hipotezinin doğruluğu iccedilin hesaplanan olasılıkdeğerine karşılık gelmektedir Sıfır hipotezi doğru iken seccedililen oumlrnekten bulunantest istatistiğine dayalı olarak hesaplanan p-değeri doğru olan sıfır hipoteziniyanılgıya duumlşerek reddetme olasılığıdır O halde bu olasılık değerinin 1rsquoe yakınolması sıfır hipotezini destekleyen bir kanıt iken 0rsquoa yaklaşması 1198670 hipoteziningeccedilersiz olduğu anlamına gelmektedir

Hesaplanan p-değerine goumlre karar kuralı şu şekildedirp-değeri lt 120572 ise 1198670 hipotezi reddedilir

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 38: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

COMPARE MEANS MENUumlSUuml

Analyze menuumlsuumlnuumln bir alt menuumlsuuml olan Compare Means ile verisetinde yer alan değişkenlerin bağımlı ve bağımsız olarakayrılmasıyla betimleyici istatistiklerin (Means) hesaplanması tekoumlrneklem t testi (One-Sample T Test) bağımsız iki oumlrneklem t testi(Independent-Samples T Test) eşleştirilmiş t testi (Paired-Samples TTest) ve tek youmlnluuml varyans analizi (One-Way ANOVA) uygulamalarıyapılmaktadır

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 39: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Means Menuumlsuuml

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 40: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Bağımlı değişken aylık toplam gelir nicel değişkeni ve bağımsız

değişken ise cinsiyet nitel değişkeni olmak uumlzere kadın ve

erkekler iccedilin aylık toplam gelire goumlre ayrı ayrı betimleyici

istatistikler elde edilir

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 41: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Means rarr Options kısmına girildiğinde istenilen betimleyiciistatistikler seccedililir

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 42: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Bu tablo explore menuumlsuumlndeki tablonun bir benzeridir Farklıolarak geometrik ve harmonik ortalama değerleri tabloda yeralmaktadır

Means menuumlsuuml yardımıyla iccedil iccedile bağımsız değişkenler iccedilindebetimsel istatistikler elde edilebilir Bu işlem şoumlyle yapılır

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 43: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Kadın ve erkeklerin eğitim duumlzeylerine goumlre tabakalara ayrılarak aylık toplamgelirin betimsel istatistiklerini elde etmek iccedilin Means penceresindeIndependent List kısmında Layer kullanılır Soldaki şekilde Cinsiyet değişkeniIndependent List kısmına atılır ve Nextrsquoe basılır Sağdaki şekilde iseIndependent List kısmına Eğitim Duumlzeyi değişkeni atılarak sonuccedillar aşağıdakigibi bulunur

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 44: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Sonuccedillardan da goumlruumllduumlğuuml uumlzere hem erkekler hem de kadınlar

eğitim duumlzeyine goumlre tabakalanarak betimsel istatistikler ayrı ayrı

elde edilir

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 45: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

One-Sample T-Test Menuumlsuuml (Tek Oumlrneklem İccedilin T-Testi )

Yığın ortalaması 120583 iccedilin ortaya atılan iddialar iccedilin hipotez testinde sıfırve alternatif hipotezler aşağıdaki gibi yazılır

1198670 120583 = 1205830 iken1198671 120583 lt 12058301198671 120583 gt 12058301198671 120583 ne 1205830

Burada 1205830 herhangi bir reel sayıdır Yığından ldquo119899rdquo birimlik rastgele oumlrnekseccedilildiğinde seccedililen oumlrnekten hareketle hesaplanan ortalama

ത119883 =σ119894=1119899 119883119894119899

olacaktır

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 46: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Yığındaki aylık ortalama gelirin 2200 TLrsquoye eşit olup olmadığı iddiası testedilmek istenmektedir Bu amaccedilla hipotezler aşağıdaki gibi kurulur

1198670 120583 = 22001198671 120583 ne 2200

Test istatistiği serbestlik derecesi laquon-1raquo olan t-değişkenidir Aşağıdaki formuumll ile t-istatistiği hesaplanır

119905 =ത119883 minus 120583

ൗ119878 119899

SPSSrsquode bu hipotezleri test edelim

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 47: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

One Sample T-Test penceresinde Test Variable(s) kısmına Aylık

Toplam Gelir Test Value kısmına ise 1205830 değeri yazılır ve Daha sonra

OKrsquoe basılır

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 48: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Yukarıdaki tabloda verilen p-değeri alternatif hipotezin ccedilift taraflı

olduğu durumda geccedilerli olan olasılık değeridir

1198671 120583 ne 2200 alternatif hipotezinin testi durumunda p-

değeri=0002lt120572 = 005 olduğundan 1198670 hipotezi reddedilir

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 49: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Independent-Samples T-Test Menuumlsuuml (Bağımsız Oumlrneklerde T-Testi)

Bağımsız iki grubun yığın ortalamalarını karşılaştırmak iccedilin kullanılır1198831~119873 1205831 1205901

2 ve 1198832~119873 1205832 12059022 bağımsız rastgele değişkenler olmak

uumlzere iki yığının ortalamalarına ilişkin ortaya atılan iddialar iccedilinhipotezler

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 lt 1205832 rarr 1198671 1205831 minus 1205832 lt 0

1198671 1205831 gt 1205832 rarr 1198671 1205831 minus 1205832 gt 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 50: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Durum Test İstatistiği Serbestlik Derecesi

12059012 ve 1205902

2

bilinmiyor

12059012 = 1205902

2

119905ℎ =ത1198831 minus ത1198832

1199041199012 11198991

+11198992

1199041199012

=11990412 1198991 minus 1 + 1199042

2 1198992 minus 1

1198991 + 1198992 minus 2

1198991 + 1198992 minus 2

12059012 ve 1205902

2

bilinmiyors

a

12059012 ne 1205902

2

119905ℎ =ത1198831 minus ത1198832

11990412

1198991+11990422

1198992

11990412

1198991+11990422

119899211990414

11989912 1198991 minus 1

+11990424

11989922 1198992 minus 1

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 51: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

İki grup ortalamasının hipotez testinde ilk aşama yığın grupvaryanslarının eşit olup olmadığının test edilmesi gereklidir Bunailişkin hipotezler

1198670 12059012 = 1205902

2

1198671 12059012 ne 1205902

2

1198670 hipotezi altında test istatistiği

119865ℎ =11990412

11990422

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 52: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Kadın ve Erkeklerin yığındaki aylık ortalama gelirleri accedilısındanfarklılık goumlsterip goumlstermediklerini test etmek istiyoruz Budurumda hipotezler aşağıdaki gibidir

1198670 1205831 = 1205832 rarr 1198670 1205831 minus 1205832 = 0

1198671 1205831 ne 1205832 rarr 1198671 1205831 minus 1205832 ne 0

Yandaki pencerede Grouping Variablekısmında Define Groups lsquoa girilir ve aşağıdaki gibi tanımlanır

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 53: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Yandaki tabloda 1198670 12059012 =

12059022 hipotezinin testine ait

sonuccedillar verilmiştir Sigdeğeri olasılık değerine karşılık gelmektedir

119878119894119892 = 0592 gt 120572 = 005olduğundan grup varyanslarının eşit olduğunu goumlsteren 1198670

hipotezi reddedilememektedir

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 54: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Levene testine goumlre grup varyansları eşit bulunduğundan dolayı 1198670 1205831 minus1205832 = 0 sıfır hipotezini 1198671 1205831 minus 1205832 ne 0 alternatif hipotezine karşı test etmekiccedilin yukarıdaki tablonun birinci satırı kullanılır

119904119894119892 2 minus 119905119886119894119890119889 gt 120572 = 005olduğundan 1198670 sıfır hipotezi reddedilememektedir Boumlylece erkek ve kadınların aylık ortalama harcamaları arasında fark olmadığı sonucuna varılır

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 55: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

BAĞIMLI (EŞLEŞTİRİLMİŞ) OumlRNEKLERDE T-TESTİ(PARİED SAMPLE T TEST) MENUumlSUuml

Bağımlı oumlrnekler iccedilin deney tasarımı iki farklı biccedilimde karşımıza ccedilıkmaktadır

Bunlar

1 İşlem oumlncesi-işlem sonrası tasarımı

2 Etkisi arındırılmak istenen değişkene goumlre eşleştirme tasarımı

İşlem oumlncesi ve sonrası tasarımda rastgele seccedililen bireyler uumlzerinden X

değişkeni iccedilin goumlzlem değerleri toplandıktan sonra bu bireyler bir işleme tabi

tutulmakta ve aynı bireylerin işlem sonrası goumlzlem değerleri de

kaydedilmektedir Bu tuumlr araştırmalarda yapılan işlemin etkili olup olmadığı

sorusuna cevap aranmaktadır

Oumlrneğin A işletmesinde ccedilalışan memurlardan rastgele seccedililen kişilerin iş

verimliliği (uumlretimhafta) şeklinde oumllccediluumllmuumlş olsun Bu bireyler bir hizmet-iccedili

eğitime tabi tutulduktan sonra tekrar iş verimliliği (uumlretimhafta) oumllccediluumllmuumlş

olsun Hizmet iccedili eğitimin iş verimliliğini arttırdığı iddiası test edilecek ise bu

test iccedilin uygun youmlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testidir

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 56: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Ele alınan değişken uumlzerinde başka bir değişkenin etkisi arındırılmak istenebilirOumlrneğin A ve B diyet youmlntemlerinin zayıflama uumlzerindeki etkisini araştırır ikenetkisi arındırılmak istenen değişken kişilerin kilosu olabilir Bu durumda aynıkiloya sahip kişiler eşleştirildikten sonra bu kişiler rastgele olarak A ve Byoumlntemine atanır Boumlylece her iki grupta da aynı kiloya sahip kişiler olduğundanzayıflama uumlzerinde kilonun etkisi arınmış olacaktır Bu durumda da uygunyoumlntem bağımlı (eşleştirilmiş) oumlrneklerde t-testi olacaktır

bull Yığından 119899 goumlzlemli rastgele bir oumlrneğin seccedilildiği ve bu oumlrneğe ilişkin 1199091 1199101 1199092 1199102 hellip 119909119899 119910119899 eşleşmiş goumlzlemlerin elde edildiği varsayılsın Birinci ve

ikinci grubun ortalamalarının eşit olduğunu iddiasının testinde eşleşmiş 119909119894 119910119894goumlzlem değerleri arasındaki fark 119889119894 = 119909119894 minus 119910119894 olmak uumlzere sıfır hipotezi vealternatif hipotezleri

bull 1198670 120583119889 = 0 iken 1198671 120583119889 lt 0 veya 1198671 120583119889 gt 0 veya 1198671 120583119889 ne 0 olacaktır

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 57: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Test istatistiği ise serbestlik derecesi 119899 minus 1 olan t

değişkenidir

119905ℎ =ҧ119889

Τ119878119889 119899~119905119899minus1

Burada

ҧ119889 =σ 119889119894

119899ve 119878119889 =

1

119899minus1σ119894=1119899 119889119894 minus ҧ119889

2

Bu test iccedilin 119901 minus 119889119890ğ119890119903119894 1198671 hipotezine bağlı olarak hesaplanır

Karar kuralı 119901 minus 119889119890ğ119890119903119894 lt 120572 ise 1198670 hipotezi reddedilebilir

şeklindedir

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 58: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Oumlrnek 1 2013 yılında yapılan araştırmada A kurumundan

memnuniyet iccedilin hazırlanan 10 soruluk Likert oumllccedileğinin

puanlanmasından elde edilen verilerin ortalaması alınarak her

birey iccedilin genel memnuniyet skoru elde edilmiştir Ccedilalışma

2014 yılında aynı bireyler uumlzerinde uygulanmış ve genel

memnuniyet skoru tekrar hesaplanmıştır lsquoA kurumundan

ortalama memnuniyet 2014 yılında bir oumlnceki yıla goumlre

artmıştırrsquo iddiasını 005 anlamlılık duumlzeyinde test ediniz

119889119894 = 1199092013119894 minus 1199092014119894

olmak uumlzere hipotezler

1198670 120583119889 = 01198671 120583119889 lt 0

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 59: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

SPSSrsquote Transform menuumlsuumlnuumln altındaki Compute Variable altmenuumlsuumlnden 2013 yılı iccedilin 385 kişinin ortalama memnuniyetskorları hesaplanır

Yukarıdaki pencerede memnuniyet skoru oluşturmak iccedilin 10 Likert

sorusunun ortalaması alınmıştır

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 60: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Yukarıdaki pencerede Paired variables kısmında variable 1 lsquoe

memnuniyet skoru değişkeni variable 2rsquoe memnuniyet değişkeni

atanır

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 61: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Alternatif hipotez 1198671 120583119889 lt 0 şeklinde tek youmlnluuml olduğundan

119905ℎ lt 0 olmalıdır ve yukarıdaki tabloda 119905ℎ değerinin negatif

olduğu goumlruumllmektedir119901minus119889119890ğ119890119903119894

2= 0000 lt 005 olduğundan

1198670hipotezi 005 anlamlılık duumlzeyinde reddedilebilir Bu sonuccedil A

kurumunda ortalama memnuniyetin 2013 yılına goumlre 2014

yılında arttığını goumlstermektedir

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 62: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

TEK FAKTOumlRLUuml VARYANS ANALİZİ (ONE-WAY ANOVA) MENUumlSUumlTek faktoumlrluuml varyans analizi ikiden fazla grubun yığın ortalamalarının

karşılaştırılmasında kullanılan bir youmlntemdir ve iki bağımsız oumlrneklem iccedilin t testinin

2rsquoden fazla gruba genişletilmiş halidir

Niccedilin grupların ortalamalarını ikişerli karşılaştırmak yerine varyans analizine

ihtiyaccedil duyulmaktadır

2rsquoden fazla grubun ortalamalarının karşılaştırılması soumlz konusu ise ccedilok sayıda t testinin

kullanılması 1 tip hatanın artmasına yol accedilmaktadır

Oumlrneğin 4 tane grubumuz olsun ve bu grupların yığın ortalamalarını ikişerli

karşılaştırmak isteyelim Bu durumda şayet t testi kullanacak olsaydık 1-2 1-3 1-4 2-3

2-4 ve 3-4 grupları iccedilin ayrı ayrı 6 tane t testi yapmamız gerekecekti Her bir testte 1 tip

hata yapma olasılığı 5 iccedilin guumlven duumlzeyi 095 (1 tip hata yapmama olasılığı) olmak

uumlzere 6 test iccedilin 1 tip hata yapmama olasılığı

095 times 095 times 095 times 095 times 095 times 095 = 0735

olur 1 tip hata yapma olasılığı ise 1 minus 0735 = 0265 olarak bulunur Boumlylece 120572anlamlılık duumlzeyi 5rsquoden 265rsquoe yuumlkselmiş olur

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 63: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Ccedilok sayıda t testi uygulamanın 1 Tip hata (gerccedilekte doğru olan birsıfır hipotezini reddetme olasılığı) yapma olasılığını arttırdığınagoumlre bir ccedilok gruba ait ortalamaları tek bir adımda eş zamanlıolarak karşılaştırabilecek bir youmlnteme ihtiyaccedil duyulmaktadır Buyoumlntem varyans analizi youmlntemi olarak adlandırılır Varyans analiziyoumlnteminde bağımlı değişkenin oumllccedilme duumlzeyi eşit aralıklı veyaorantılı olmalıdır

Tek faktoumlrluuml varyans analizinin varsayımları şunlardır Her bir grubun seccedilildiği yığın normal dağılıma sahip olmalıdır Her bir grubun seccedilildiği yığınların varyansları birbirine eşittir Her bir gruptaki oumlrnekler birbirinden bağımsızdır

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 64: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Oumlrneğin uumlccedil farklı gelir grubunda kişilerin iş memnuniyetinioumllccedilmeye ccedilalışalım Şayet gruplar arasında fark varsa her birgelir grubu kendi iccedilinde kuumlccediluumlk bir varyansa sahip olmalı yanimemnuniyet puanları birbirine yakın olmalıdır Ayrıcagruplardaki her bir bireyin memnuniyet puanı diğer gruptakiherhangi bir bireyden oumlnemli oumllccediluumlde farklı olmalıdır

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 65: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Bazı durumlarda farklı gruplarda yer alan bireyler arasındaki farklılıktan ccedilokaynı grupta yer alan bireyler arasındaki farklılık daha buumlyuumlk olabilir

Burada grupların farklılığından ccedilokaynı grupta yer almasına rağmenbirbirinden ccedilok farklı memnuniyetpuanına sahip bireyler soumlz konusudur

Varyans analizinin yapmaya ccedilalıştığı şey şudur Gruplar arasındakivaryansı ve grupların kendi iccedillerindeki varyansı hesaplayarak birbirineoranlamak ve bu varyansların buumlyuumlkluumlklerine goumlre bir karar vermektir

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 66: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

1 2

1 2

11 12 1

21 22 2

31 32 3

1 2 k

k

k

k

k

n n n k

G G G

x x x

x x x

x x x

x x x

119909119894119895 119895 119892119903119906119901119905119886 119894 119887119894119903119894119898119894119899 119886119897119889120484ğ120484 119889119890ğ119890119903

ҧ119909119895 119895 gruptaki birimlerin ortalamas120484

119899119895 119895 119892119903119906119901119905119886119896119894 119887119894119903119894119898119897119890119903119894119899 119904119886119910120484119904120484

ҧ119909 Genel ortalama

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 67: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

ANOVA Tablosu

Değişimin

Kaynağı

Serbestlik

Derecesi

Kareler

Toplamı

Kareler Ortalaması

F

Gruplar

Arasık-1 GAKT

GAKO=

GAKT(k-1)GAKOGIKO

Gruplar

İccedilin-k GIKT

GIKO=

GIKT(n-k)

Toplam n-1 TKT

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 68: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Tek faktoumlrluuml varyans analizinde ortalamalarının karşılaştırılmasında kullanılanhipotezler şoumlyledir

1198670 1205831 = 1205832 = ⋯ = 1205831198961198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895 = 12 hellip 119896

ANOVA tablosuna goumlreŞayet 119865 gt 119865 119896minus1 119899minus119896 120572 ise 1198670 hipotezi reddedilir Yani gruplar yığın

ortalamalarına goumlre farklılık goumlstermektedir

Varyans analizinin oumlnemli varsayımlarından birisi grupların geldikleri yığınvaryanslarının eşit olduğudur Gruplara ait yığın varyanlarının eşit olmadığıdurumda F testi yerine Welch veya Brown-Forsythe tarafından oumlnerilen veasimptotik olarak F dağılıma sahip testler kullanılır Welch testi Brown-Forsythe testinden daha guumlccedilluumlduumlr

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 69: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Oumlrnek 2 Eğitim duumlzeyine goumlre yığındaki aylık ortalamagelirler farklılaşmakta mıdır

İlk olarak her bir eğitim duumlzeyinin yığın varyanslarınıneşitliği test edilir Options penceresinin altındanHomogeneity of variance test kısmı seccedililir

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 70: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Grupların yığın varyanslarının eşitliğinin testi iccedilinhipotezler şoumlyledir

1198670 12059012 = 1205902

2 = 12059032

1198671 1205901198942 ne 120590119895

2 119887119886119911120484 119894 119907119890 119895prime119897119890119903 119894ccedil119894119899

119901 minus 119889119890ğ119890119903119894 119904119894119892 lt 120572 =005 olduğundan yığınvaryanslarının eşit olduğu 1198670

hipotezi reddedilir

Yığın varyansları eşit olmadığındanyığın ortalamalarınınkarşılaştırılmasında F testikullanılamaz F testi yerine Welch veyaBrown-Forsythe testlerinden birisitercih edilir Bu işlem yandaki Optionspenceresinden yapılır

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 71: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

1198670 1205831 = 1205832 = 12058331198671 120583119895

prime 119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119889119894ğ119890119903119897119890119903119894119899119889119890119899 119891119886119903119896119897120484119889120484119903 119895

= 123

Welch testi sonucuna goumlre 119901 minus 119889119890ğ119890119903119894 = 0001 lt 120572 = 005 olduğundanyığın ortalamalarının eşit olduğu 1198670 hipotezi reddedilebilir Yani eğitimduumlzeyine goumlre yığında aylık ortalama gelirler 5 anlamlılık duumlzeyindefarklılaşmaktadır sonucuna varılır Aynı sonuccedil Brown-Forsythe testinde debulunmuştur

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 72: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

DOĞRU-YANLIŞ SORULARIDoğru Yanlış

Birinci ve ikinci tip hata arasında ilişki yoktur

Geccedilerliliği olasılık esaslarına goumlre araştırılabilen varsayımlara istatistiksel hipotez denir

Bağımsız oumlrneklerde t-testi ikiden fazla grubun yığın ortalamalarının karşılaştırılmasında kullanılan bir youmlntemdir

Anlamlılık duumlzeyi (I Tip hata) 120572 azalırken ikinci tip hata 120573 artar

İşlem oumlncesi-işlem sonrası tasarımında iki yığın ortalamasınıneşit olduğu iddiası eşleştirilmiş oumlrneklerde t-testi ile araştırılır

Sıfır hipotezi 1198670 parametrenin belirli bir değerden farklı olduğunu ifade eder

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 73: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

TEST SORULARIS-1) İkiden fazla grubun ortalamaları karşılaştırıldığında kullanılan youmlntem aşağıdakilerden hangisidir

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

S-2) I tip hata aşağıdakilerden hangisine karşılık gelir

A) Gerccedilekte doğru olan sıfır hipotezini reddetme olasılığı

B) Gerccedilekte doğru olan sıfır hipotezini kabul etme olasılığı

C) Gerccedilekte yanlış olan sıfır hipotezini reddetme olasılığı

D) Gerccedilekte yanlış olan sıfır hipotezini kabul etme olasılığı

S-3) Yığın standart sapması (120590) ile ikinci tip hata (120573) arasındaki ilişki iccedilin aşağıdakilerden hangisi doğrudur

A) İlişki yoktur B) İlişki aynı youmlndedir

C) İlişki ters youmlndedir D) Ccediloğunlukla aynı nadiren ters youmlndedir

S-4) A kurumundan memnuniyet skorunun cinsiyete goumlre farklılaşmadığı iddiası test edilecektir Aşağıdaki testlerden hangisi uygulanmalıdır

A) Bağımsız oumlrneklerde t-testi B) Eşleşmiş oumlrneklerde t-testi

C) Tek oumlrneklem t-testi D) Tek faktoumlr varyans analizi

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 74: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

KORELASYON ANALİZİ

Pearson Korelasyon KatsayısıDoğrusal ilişkili iki değişken arasındaki ilişkinin guumlcuumlnuuml ve youmlnuumlnuuml oumllccedilen bir istatistiktirve -1 ile +1 arasında değerler almaktadır

120588119883119884 =119862119900119907 119883 119884

120590119884120590119883Burada120588119883119884 X ve Y değişkenleri arasındaki Pearson korelasyon katsayısını119862119900119907(119883 119884) X ve Y değişkenleri arasındaki kovaryansı120590119884 Y değişkeninin standart sapmasını120590119883 X değişkeninin standart sapmasınıgoumlstermektedirKovaryans katsayısı da iki değişken arasındaki ilişkinin youmlnuumlnuuml goumlsteren bir oumllccediluumlttuumlrBu katsayı negatif olduğunda ilişki ters youmlnluuml iken pozitif değerler ilişkinin aynı youmlnluumlolduğunu goumlsterir Ancak kovaryans katsayısının tanım aralığı minusinfin+infin olduğundanilişkinin derecesi hakkında bilgi veremez Ayrıca kovaryansın birimi 119883prime119894119899 119887119894119903119894119898119894 times119884prime119899119894119899 119887119894119903119894119898119894119889119894119903 Oysaki korelasyon katsayısının birimi yoktur Diğer bir ifadeylekovaryans X ve Yrsquonin birimlerine bağlı bir değer alırken korelasyon birimden bağımsızolmaktadır Uygulamalı ccedilalışmalarda ilişki katsayısının birimden bağımsız olması biravantajdır Bu iki durum dikkate alındığında iki değişken arasındaki ilişkinin kovaryansyerine korelasyon katsayısı ile araştırılması daha uygun olmaktadır

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 75: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

VarsayımlarHer iki değişken de normal dağılıma sahip olmalıHer iki değişken en az eşit aralıklı oumllccedilme duumlzeyinde oumllccediluumllmuumlş olmalıdırİki değişken arasındaki ilişki doğrusal olmalı

OumlzelliklerCohenrsquoin standardı dikkate alındığında Pearson korelasyon katsayısı 010-

029 arasında ise zayıf bir ilişkiyi 030-049 arasında ise orta duumlzeyde birilişkiyi 050 den yukarıda ise guumlccedilluuml bir ilişkiyi goumlstermektedir120588119883119884 lt 0 ise X ve Y değişkenleri arasında ters youmlnluuml120588119883119884 gt 0 ise X ve Y değişkenleri arasında aynı youmlnluuml birilişki vardır

Korelasyon katsayısı simetriktir (120588119883119884 = 120588119884119883) Diğer bir ifade ile bağımlıbağımsız değişken ayrımı yoktur

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 76: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Correlaterarr Bivarite kısmındanyapılmaktadır

SPSSrsquote Korelasyon Analizi

Yandaki penceredeVariables kısmınakorelasyonu bulunacakiki değişken atılır vedaha sonra hangikorelasyon oumllccediluumltuumlkullanılacaksa seccedililir

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 77: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Oumlrnek Aylık gelir ve aylık gıda harcaması değişkeni arasındaki uygun korelasyonkatsayısını hesaplayınızYukarıdaki pencerede Variables kısmına aylık gelir ve aylık gıda harcaması değişkenleriatılır Daha sonra değişkenler normal dağılıma sahip ve nicel olduğundan Pearsonkorelasyon katsayısı işaretlenir

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 78: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

1198670Aylık gıda harcaması ile aylık gelir arasında ilişki yoktur (120588119883119884= 0)1198671Aylık gıda harcaması ile aylık gelir arasında ilişki vardır (120588119883119884ne 0)

Sig (2-tailed) lt 005 olduğundan 1198670 reddedilebilir

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 79: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

DOĞRUSAL REGRESYON ANALİZİ

Regresyon analizi bağımlı değişken (Y) ile bağımsız değişkenler (1198831 1198832 hellip 119883119896 )arasındaki ilişkiyi doğrusal formda ifade eden bir modeldir Doğrusal regresyonanalizinde bağımlı değişken nicel iken bağımsız değişkenler hem nicel hem de nitelolabilir Yığın iccedilin doğrusal regresyon eşitliği aşağıdaki gibi tanımlanır

119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894

Burada 120572rsquolar modelin bilinmeyen parametreleridir 120576 ise kesin ilişkiyi bozan hataterimidir Bu ilişkide Y bağımlı değişkeni 1198831 1198832 hellip 119883119896 bağımsız değişkeninin birfonksiyonudur

Diğer bir ifadeyle 119884 = 119891 1198831 1198832 hellip 119883119896 şeklinde yazılabilir Bu durum Y ile X arasındabir nedensel ilişki olduğuna işaret etmektedir Bu nedensel ilişkinin youmlnuuml ise XrsquolerdenYrsquoye doğrudur Diğer bir ifadeyle X değişkenleri Y değişkeninin nedenidir Nedenselliğinyoumlnuuml hakkında ise oumlnsel bilgi ile karar verilmektedir Oumlnsel bilgi ilgili bilim dalındangelen teorilere dayalı olup verilerle ortaya ccedilıkartılamaz Oumlrneğin tuumlketim ile gelirarasındaki ilişkide tuumlketim bağımlı gelir ise bağımsız değişken olacaktır Ccediluumlnkuuml iktisatbilimi tuumlketimi gelirin bir fonksiyonu olduğunu varsaymaktadır (Tuumlketim=f(Gelir)

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 80: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Regresyon analizinin amacı bağımlı değişkendeki varyansın kaynağını araştırmaktırBu modeller karar vericilerin kullanacağı bazı bilgileri sağlamaktadır Regresyonmodelleri genellikle yapısal analiz ve oumlngoumlruuml amaccedillı olarak kullanılmaktadır Modelkurucu bir parametreyi modeldeki diğer parametrelerden fonksiyonel olarakbağımsız varsayarak modeli kuruyorsa o parametre yapısal olarak adlandırılır Birparametre yapısal ise diğer her şey sabitken 119883119895rsquonin Y uumlzerindeki marjinal etkisi 120572119895kadar olacaktır Diğer bir ifadeyle 119883119895 ve Y suumlrekli değişkenler olmak uumlzere Yrsquoin 119883119895rsquoegoumlre kısmi tuumlrevi 119883119895rsquonin Y uumlzerindeki marjinal etkisidir

119883119895prime119899119894119899 119884 uuml119911119890119903119894119899119889119890119896119894 119898119886119903119895119894119899119886119897 119890119905119896119894119904119894 =

120597119884

120597119883119895= 120572119895

O halde diğer her şey sabitken 119883119895 değişkeni 1 birim değiştiğinde Y değişkeni 120572119895birim kadar değişecektir Modeldeki 1205720katsayısı sabit terim (veya kesim katsayısı)olarak adlandırılmaktadır 1198831 = 1198832 = ⋯ = 119883119896 = 0 olduğunda 119884 = 1205720 değerinialacaktır Sabit terim ccediloğu zaman anlamlı bir yoruma sahip değildir Oumlrneğin konutfiyatının bağımlı konut yuumlzoumllccediluumlmuumlnuumln (metrekare) bağımsız değişken olduğu birregresyon modelinde 1205720 konutun yuumlzoumllccediluumlmuuml sıfır olduğunda konutun fiyatınakarşılık gelecektir Bu da uygulamada karşılaşılmayacak bir durum olduğundan 1205720lsquoınyorumlanması anlamlı olmayacaktır Buna karşın tuumlketim-gelir ilişkisinde gelir sıfırolduğunda tuumlketim 1205720 kadar olacaktır Bu da zorunlu tuumlketime karşılık gelmektedirBu oumlrnekte 1205720 lsquoın yorumlanması anlamlı goumlruumllmektedir Aynı zamanda 1205720 katsayısı1198831 = 1198832 = ⋯ = 119883119896 = 0olduğunda 119884rsquonin ortalama değerine karşılık gelmektedir Bunedenle 119884rsquonin ortalaması sıfır olmadıkccedila sabit terimin modelden dışlanması uygundeğildir

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 81: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Regresyon eşitliğinde yer alan hata terimi 120576 kesin ilişkiyi bozan rastgele değişkendirAynı zamanda hata terimi bağımlı değişkendeki değişimin bağımsız değişkenlertarafından accedilıklanmayan kısmını da tanımlamaktadır Dolayısıyla hata terimininregresyon eşitliğine katılmasının nedenleri şu şekilde sıralanabilir

İhmal edilen (modele alınmayan) oumlnemli bağımsız değişkenlerOumlnemli olmayan bağımsız değişkenlerin modele katılmasıDeğişkenlerin oumllccediluumllmesinde yapılan hatalar (Oumllccedilme hataları)Modelin matematiksel kalıbında kesinlik olmaması

Doğrusal regresyon modelinin sağlanması gereken varsayımlar aşağıda verilmiştir

Y ile Xrsquoler arasındaki ilişki 119884119894 = 1205720 + 12057211198831119894 + 12057221198832119894 +⋯+ 120572119896119883119896119894 + 120576119894 şeklindedoğrusaldır

Hata terimi rastgele değişkendir Hata teriminin ortalaması sıfırdır Hata teriminin varyansı sabittir Hata terimleri arasında ardışık bağımlılık (otokorelasyon) yoktur 119894 ne 119895 iccedilin119862119900119907 120576119894 120576119895 = 0

Bağımsız değişken Xrsquoler tekrar eden oumlrneklerde sabittir Bunun bir sonucu olarakhata terimi ile bağımsız değişkenler arasında ilişki yoktur

Hata teriminin dağılımı normal dağılımdır Goumlzlem sayısı bağımsız değişken sayısından en az bir fazla olmalıdır (119899 gt 119896)

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 82: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Belirleme katsayısı (1198772) bağımlı değişkendeki toplam değişimin yuumlzde kaccedilının bağımsızdeğişkenler tarafından accedilıklandığını goumlsteren istatistiki bir oumllccediluumlttuumlr Bu katsayı modelin accedilıklamaguumlcuuml olarak da yorumlanmaktadır Diğer bir ifadeyle belirleme katsayısı 1rsquoe yaklaştıkccedila modelinaccedilıklama guumlcuuml artmakta ve seccedililen bağımsız değişkenler yardımıyla bağımlı değişkendeki toplamdeğişimlerin buumlyuumlk bir boumlluumlmuuml accedilıklanabilmektedir

Bağımlı değişken iccedilin toplam kareler toplamı (TKT) aşağıdaki gibi yazılabilir

119879119870119879 =

119894=1

119899

119884119894 minus ത119884 2

119879119870119879 = 119877119870119879 + 119860119870119879Burada toplamı kareler toplamı (TKT) regresyonla accedilıklanan kareler toplamı (RKT) ve regresyonla accedilıklanamayan kareler toplamı veya artık kareler toplamı (AKT) şeklinde iki kısma ayrılır Belirleme katsayısı (1198772)

1198772 =119877119870119879

119879119870119879= 1 minus

119860119870119879

119879119870119879şeklinde hesaplanır Burada

119877119870119879 =

119894=1

119899

119884119894 minus ത1198842

119860119870119879 =

119894=1

119899

119884119894 minus 1198841198942

Modelin Accedilıklama Guumlcuuml Belirleme Katsayısı

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 83: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

SPSSrsquote iki değişken arasındaki korelasyon analizi Analyze rarr Regression rarr Linear kısmındanyapılmaktadır

SPSSrsquote Doğrusal Regresyon Analizi

Yandaki pencerede Dependentkısmına bağımlı değişken Independent(s) kısmına ise bağımsız değişkenler atılır

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 84: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Oumlrnek 3 Aylık gelir ve hanede yaşayan kişi sayısının aylık gıda harcaması uumlzerindeki etkisini doğrusalregresyon analizi ile inceleyiniz

119910119894 = 1205720 + 12057211198831198941 + 12057221198831198942 + 120576119894

ො119910119894 = minus15614 + 0385 1198831198941 + 254581198831198942

ො1205720 = minus15614 rarr 1198831 = 1198832 = 0 iken ortalama aylık gıda harcaması -1561 TL dir ො1205721 = 0385 rarr Diğer her şey sabitken aylık gelir 1 TL arttığında aylık gıda harcaması 0385 TL artar ො1205722 = 25458 rarr Diğer her şey sabitken hanede yaşayan kişi sayısı 1 artarsa aylık gıda harcaması 25458 TL artar

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 85: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Aylık gıda harcamasını 916 oranında aylık gelir ve hanede yaşayan kişi sayısıdeğişkenleri accedilıklamaktadır

1198670 1205721 = 01198671 1205721 ne 0119905ෝ1205721 = 27274 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani aylık gelir

değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205722 = 01198671 1205722 ne 0119905ෝ1205722 = 4028 ve p-değeri=0 lt 005 olduğundan 1198670 reddedilebilir Yani hanede

yaşayan kişi sayısı değişkeninin katsayısı istatistiksel olarak anlamlıdır

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 86: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

1198670 1205721 = 1205722 = 0 (Kurulan regresyon modeli anlamsızdır)1198671 120572119895

prime119897119890119903119894119899 119890119899 119886119911 119887119894119903119894 119904120484119891120484119903119889119886119899 119891119886119903119896119897120484119889120484119903 119895 = 12

F=529851P=0000lt α = 005 olduğu iccedilin 1198670 reddedilebilir Yani kurulan regresyon modeliistatistiksel olarak anlamlıdır

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 87: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

DOĞRU-YANLIŞ SORULARIDoğru Yanlı

ş

Pearson korelasyon katsayısı simetriktir Yani X ile Y yerine Y ile

X arasındaki korelasyonu hesaplamak sonucu değiştirmez

Korelasyon X ile Y değişkenleri arasındaki nedensel ilişkinin youmlnuuml

hakkında bilgi vericidir

Pearson korelasyon katsayısı sadece doğrusal ilişkiler hakkında

bilgi verebilir

Belirleme katsayısı 1198772 sıfıra yaklaştıkccedila modelin accedilıklama guumlcuuml

azalır

Regresyon analizinde ihmal edilen oumlnemli bağımsız değişkenler

hata teriminin oumlnemli bir kaynağıdır

Regresyon analizinde hata terimi deterministik bir bileşendir

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 88: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

TEST SORULARIS-1) Y bağımlı ve X bağımsız değişkeni arasındaki doğrusal regresyon eşitliğinin parametreleri

tahmin edilmiş ve sabit terim 3 eğim katsayısı ise 06 olarak bulunmuştur Xrsquoin Y uumlzerindeki

marjinal etkisi iccedilin aşağıdaki yorumlardan hangisi doğrudur

A) Diğer her şey sabitken X 1 arttığında Y 06 artar

B) Diğer her şey sabitken X 1 birim arttığında Y 06 artar

C) Diğer her şey sabitken X 1 birim arttığında Y 06 birim artar

D) Diğer her şey sabitken X 1 arttığında Y 06 birim artar

S-2) Aşağıdakilerden hangisi X ve Y değişkenleri arasındaki ilişkiyi oumllccedilmek iccedilin hesaplanan

Pearson korelasyon katsayısının birimidir

A) Birimden bağımsızdır B) Xrsquoin birimi (Yrsquonin birimi) C) Xrsquoin birimi D) Yrsquonin

birimi

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 89: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

S-3) Regresyon analizi aşağıdaki amaccedillardan hangisi (hangileri) iccedilin kullanılır

A) Oumlngoumlruuml ve yapısal analiz B) Sadece oumlngoumlruuml

C) Sadece yapısal analiz D)Bağımlı değişkeni accedilıklamak

4) X ve Y değişkenleri arasındaki Pearson korelasyon katsayısı 098 olarak

hesaplanmıştır Aşağıdaki yorumlardan hangisi tam olarak doğru yapılmıştır

A) X ve Y arasında aynı youmlnde ilişki vardır B) X ve Y arasında aynı youmlnde

kuvvetli bir ilişki vardır

C) X ve Y arasında aynı youmlnde orta derecede ilişki vardır D) X ve Y arasında

aynı youmlnde oldukccedila kuvvetli doğrusal bir ilişki vardır

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 90: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

SPSSrsquoTE CcedilAPRAZ TABLO

Ccedilapraz tablo temel olarak iki kategorik değişken arasındaki ilişkiyi analiz etmekiccedilin kullanılır Oumlrneğin cinsiyet ve oy verilen parti arasında ilişki olup olmaması gibi

Ccedilapraz tablolar izlenen amaca goumlre uumlccedil tuumlrluuml yapılmaktadır (Darcy ve Rohrs 1995)

Bir değişkenin bir başka değişken uumlzerindeki etkisini goumlstermek (yuumlzdelemeninyoumlnuuml eğer satır -yatay youmlnuumlndeki- değişkeni bağımsız değişken ise bu youmlndeyok eğer bağımsız değişken suumltuumln ndash dikey youmlnuumlndeki- değişkeni ise bu youmlndeyapılır)

Bir grubun komposizyonunu (dağılımını) belirlemek iccedilin

Ccedilaprazlanan değişkenler sonucu ortaya ccedilıkan olası alt grupların buumltuumln iccedilindekikomposizyonunu belirlemek iccedilin

Oumlrneğin cinsiyet ile gelir duumlzeyi arasındaki ilişkiyi goumlsteren ccedilapraz tablonunoluşturulmasında SPSSrsquote aşağıdaki adımlar uygulanır

Analyze rarr Descriptive Statistics rarr Crosstabshellip

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 91: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Cellshellip menuumlsuumlnde aşağıdaki kısımlar işaretlenir

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 92: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Kİ-KARE BAĞIMSIZLIK TESTİ

Uygulamalı ccedilalışmalarda değişkenlerin buumlyuumlk bir boumlluumlmuuml sınıflama ya da sıralamaoumllccedilme duumlzeyinde nitel değişkenlerdir Eğer iki değişken arasında ilişki yoksa bu ikideğişkenin bağımsız olduğu soumlylenebilir İki değişken bağımsız ise değişkenlerdenbirinin değerini bilmek diğer değişkenin alacağı değeri tahmin etmemize yardımcıolmaz Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişken arasındakiilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

1205942 bağımsızlık testinde ccedilapraz tablonun oluşturulması oumlnemli bir yer tutar Butablonun oluşturulmasında oumlncelikle değişkenlerin kaccedil farklı değer alacağı saptanırBirinci değişken (1198831) duumlzeyleri 119888 ve ikinci değişken (1198832) 119903 duumlzeyli olsun Bu durumda

119899119894119895 1198831 değişkeninin 119894 ve 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı(Goumlzlenen frekanslar)

119899119894 1198831 değişkeninin 119894 duumlzeyindeki oumlrnek birimlerinin sayısı

119899119895 1198832 değişkeninin 119895 duumlzeyindeki oumlrnek birimlerinin sayısı

Goumlzlenen frekanslar 119866119894119895 = 119899119894119895 ile goumlsterilirsin

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 93: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

1198670Değişkenler bağımsızdır

1198671Değişkenler bağımsız değildir

1205942 bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan birtesttir İki değişken bağımsız ise 119894 satır ve 119895 suumltunda yer alan huumlcre iccedilin beklenenfrekans 119861119894119895

119861119894119895 =119899119894 times 119899119895

119899şeklinde hesaplanır

1198670 hipotezi doğru iken test istatistiği

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895

2

119861119894119895

Bu test istatistiği 119888 minus 1 119903 minus 1 serbestlik dereceli 1205942 dağılımına sahiptir Yukarıdatanımlanan 120594ℎ

2 değeri araştırmacı tarafından oumlnceden belirlenen 1 tip hata duumlzeyine120572 karşılık gelen 1205942tablo değeri ile karşılaştırılarak 1198670 hipotezi test edilir

120594ℎ2 gt 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilebilir

120594ℎ2 le 120594119879119886119887119897119900

2 ise 1198670 hipotezi reddedilemez

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 94: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Ki-kare bağımsızlık testinde dikkat edilmesi gereken hususlar

(i) Beklenen frekanslar 1rsquoden kuumlccediluumlk olmamalıdır

(ii)Beklenen frekansların en fazla 20rsquosi 5rsquoden daha kuumlccediluumlk olabilir

Bu koşullar sağlanmadığında

Oumlrnek ccedilapı arttırılabilir

Satırlar veya suumltunlar birleştirilebilir

(iii) Her iki değişken iccedilin duumlzeylerin 2 olması durumunda (2 times 2) Yatesduumlzeltmesi yapılmalıdır

120594ℎ2 =

119894=1

119888

119895=1

119903119866119894119895 minus 119861119894119895 minus 05

2

119861119894119895

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 95: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Oumlrnek 1 Eğitim duumlzeyi ile gelir duumlzeyi arasında 5 anlamlılıkduumlzeyinde ilişki var mıdır

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 96: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

1198670 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki yoktur

1198671 Eğitim duumlzeyi ile gelir duumlzeyi arasında ilişki vardır

Yukarıdaki tabloda 1198670 hipotezinin testinde Pearson Chi-Square değerine

bakılır 120594ℎ2 = 52829 ve p-değeri=0000lt005 olduğundan lsquoEğitim duumlzeyi ile

gelir duumlzeyi arasında ilişki yokturrsquo sıfır hipotezi reddedilebilir

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 97: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Oumlrnek 2 Cinsiyet ile yaşanılan yer arasında 5 anlamlılık duumlzeyindeilişki var mıdır

1198670 Cinsiyet ile yaşanılan yer arasında ilişki yoktur1198671 Cinsiyet ile yaşanılan yer arasında ilişki vardır

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 98: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

Ccedilapraz tablo 2 times 2 olduğundan Pearson Chi-Square değeri yerine Continuity

Correction (Yates Duumlzeltmeli 120594ℎ2 ) katsayısına bakılır 120594ℎ

2 = 0629 ve p-değeri=0426gt005 olduğundan lsquoCinsiyet ile yaşanılan yer arasında ilişki yokturrsquosıfır hipotezi reddedilememektedir

Ccedilapraz tablo 2 times 2 olduğunda ve 5rsquoden kuumlccediluumlk beklenen frekansların sayısı 20rsquoden buumlyuumlk olduğundabirleştirme yapılamadığından dolayı yukarıdaki tabloda Fisher Exact testi kullanılmalıdır

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 99: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

DOĞRU-YANLIŞ SORULARI

Doğru Yanlış

Sınıflama ya da sıralama oumllccedilme duumlzeyinde goumlzlemlenmiş iki değişkenarasındaki ilişki Ki-kare (1205942)bağımsızlık testi ile araştırılabilir

Ki-kare bağımsızlık testi goumlzlenen ve beklenen frekanslar arasındaki farklara dayalı olan bir testtir

Ki-kare bağımsızlık testinde beklenen frekansların tamamı 5rsquoden kuumlccediluumlk olamaz

Ccedilapraz tablo 3x3 boyutunda ise Ki-kare bağımsızlık testinde Yatesduumlzeltmesi yapılmalıdır

Cinsiyet ile oy verilen parti arasında ilişki yoktur iddiası Ki-karebağımsızlık testi ile araştırılır

Doumlviz kuru ile enflasyon arasındaki ilişki Ki-kare bağımsızlık testi ile araştırılır

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20

Page 100: BETİMLEYİCİ, DURUM SAPTAYICI ARAŞTIRMALAR · Ortancanın özellikleri En az sıralamadüzeyindeölçülendeğişkenleriçinhesaplanabilir. Hesaplama formülübirimlerin tamamınıkullanmaz

TEST SORULARIS-1) Eğitim duumlzeyi ile Avrupa Birliğine uumlyelik (katılsın fark etmez katılmasın) hakkındaki

tutumlar arasındaki ilişki olup olmadığı Ki-kare bağımsızlık testi ile araştırılacaktır

Aşağıdakilerden hangisi sıfır (1198670) hipotezidir

A) Eğitim duumlzeyi arttıkccedila ABrsquoye uumlye olma youmlnuumlndeki eğilim artar

B) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki vardır

C) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar arasında ilişki yoktur

D) Eğitim duumlzeyi ile ABrsquoye uumlye olma hakkındaki tutumlar birbirinden bağımsız değildir

S-2) Kikare bağımsızlık testinde beklenen frekansların en az yuumlzde kaccedilı 5rsquoden kuumlccediluumlk olamaz

A) 5 B) 10 C) 15 D) 20