37
7.Sunum Yrd. Doç. Dr. Sedat ŞEN 1

KORELASYON - Bir akademisyenin websitesi7.Sunum Yrd. Doç. Dr. Sedat øEN 1 . Yrd. Doç. Dr. Sedat øEN 2 Bağımlı Değ. Bağımsız Değ. Analiz Sürekli İki kategorili t-testi,

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

  • 7.Sunum

    Yrd. Doç. Dr. Sedat ŞEN 1

  • Yrd. Doç. Dr. Sedat ŞEN 2

    Bağımlı Değ. Bağımsız Değ. Analiz

    Sürekli İki kategorili t-testi, Wilcoxon testi

    Sürekli Kategorik ANOVA, linear regresyon

    Sürekli Sürekli Korelasyon, doğrusal regresyon

    İki kategorili Sürekli Lojistic regresyon

    İki kategorili İki kategorili Ki-Kare testi

  • Buraya kadar olan konularda (t-testi, ANOVA vb.) bağımlı değişkenin gruplar arasında anlamlı bir fark gösterip göstermediğini test ettik.

    Bu sunumumuzda farklı bir araştırma sorusunu cevaplamak yeni bir yöntem kullanacağız.

    Bu sunumda fark yerine ilişki durumuna korelasyon yöntemi ile bakacağız.

    Korelasyon temel anlamda iki değişken arasındaki ilişkiyi göstermek için kullanılır.

    Yrd. Doç. Dr. Sedat ŞEN 3

  • Aşağıdaki formül vasıtasıyla iki değişkene ait değerler kullanılarak hesaplanan değere «Pearson Momentler Çarpımı Korelasyon Katsayısı» denir. Karl Pearson tarafından geliştirildiği için Pearson korelasyonu adını almıştır.

    Yrd. Doç. Dr. Sedat ŞEN 4

  • Tablodaki iki değişkene ait kovaryans değerinin 4.25 olarak hesaplandığını biliyorsak. Bu değeri iki değişkenin standart sapmasına bölersek korelasyon katsayısını (r) hesaplayabiliriz. Korelasyon değeri r harfi ile gösterilmektedir.

    Yrd. Doç. Dr. Sedat ŞEN 5

    Katılımcı 1 2 3 4 5 Ar. Ortalama

    St. Sapma

    Varyans

    İzlenen Reklam Sayısı

    5 4 4 6 8 5.4 1.67 2.80

    Alınan Ürün 8 9 10 13 15 11.0 2.92 8.50

    • r = 4.25/(1.67x2.92) • r = 0.871 • İki değişken arasında pozitif yönde yüksek bir ilişki olduğunu

    söyleyebiliriz.

  • Korelasyon (ilişki), iki değişkenin birlikte değişiminin bir ölçüsüdür.

    Boy uzunluğu ile kilo arasındaki ilişki, yaş ile boy arasındaki ilişki, çalışma saati ve sınav puanı arasındaki ilişki, hava sıcaklığı ve doğalgaz tüketimi arasındaki ilişki eğer sayısal veriler varsa korelasyon katsayısı cinsinden gösterilebilir.

    Korelasyon katsayısı matematiksel olarak -1 ile +1 arasında değerler alır.

    Yrd. Doç. Dr. Sedat ŞEN 6

  • Korelasyonun büyüklüğü (0-1) iki değişken arasındaki ilişkinin gücünü gösterirken işareti (+,-) değişkenlerin aynı yönde (+) artıp azaldığını ya da zıt yönlerde (-) artış ve azalış gösterdiğini belirtir.

    Hava sıcaklığı ve doğalgaz tüketimi arasındaki ilişki NEGATİF

    Çalışma saati ve sınav puanı arasındaki ilişki POZİTİF olabilir.

    Eğer iki değişken arasında hiç ilişki yoksa korelasyon katsayısı sıfır ya da sıfıra yakın bulunur.

    Eğer iki değişken birbiriyle yüzde yüz oranında ilişkili ise korelasyon maksimum (1) değeri (mükemmel ilişki) alır.

    Yrd. Doç. Dr. Sedat ŞEN 7

  • İki değişken arasında hesaplanan korelasyon (r) değeri:

    r

  • Korelasyon katsayısını yorumlarken neden-sonuç ilişkisinden bahsetmek doğru değildir. Çünkü korelasyon bize iki değişken arasındaki ilişkinin büyüklüğünü gösterirken neden-sonuç ilişkisine dair bir şey söylememektedir. A değişkeni B değişkeni etkiliyor olabilir ya da B değişkeni A değişkenini etkiliyor olabilir. Başka bir alternatif de iki A ile B değişkenleri arasında neden-sonuç ilişkisi olmayabilir. Korelasyon değeri neden-sonuç ilişkisinin yönünü vermemektedir. Korelasyon değerine bakarak neden-sonuç ilişkisinden bahsedemememizin başka sebebi de üçüncü bir değişkenin etkisidir. İki değişkenin arasındaki neden-sonuç ilişkisini diğer değişkenlerin etkisinden bağımsız düşünemeyiz.

    Yrd. Doç. Dr. Sedat ŞEN 9

  • T-testi ve ANOVA analizlerinde gördüğümüz gibi araştırmacılar bu analizleri kullanarak bir hipotezi test edebilmektedir. Korelasyonu kullanarak bir sıfır hipotez test edilebilmektedir. Korelasyonda test edilen sıfır hipotezi iki değişken arasında bir ilişki olmadığını (r = 0) belirtmektedir(İLİŞKİ YOK). Alternatif hipotez ise iki değişken arasında bir ilişki olduğunu belirtir (İLİŞKİ VAR). Burada da elde edilen p-değerine bakarak sıfır hipotezini reddedip edemeyeceğimizi söyleyebiliriz. Örneğin p-değeri 0.05’ten küçük bulunduğunda sıfır hipotezini reddedip alternatif hipotezi kabul edebiliriz. Yani iki değişken arasında anlamlı bir ilişki bulunmaktadır diyebiliriz.

    Yrd. Doç. Dr. Sedat ŞEN 10

  • Pearson korelasyonu hesaplaması için değişkenlerin sürekli olması yani en azında eşit aralıklı ölçek düzeyinde olması gerekmektedir. Eğer Pearson korelasyon katsayısının anlamlılığından bahsetmek istiyorsak örneklem dağılımının normal olması varsayımının yerine getirilmesi gerekmektedir. Normalliğin nasıl kontrol edileceğine önceki sunumlardan bakabilirsiniz.

    Değişkenlerin normal dağılıma sahip olmadığı durumlarda Spearman Sıra korelasyon katsayısı tercih edilir.

    Yrd. Doç. Dr. Sedat ŞEN 11

  • Açılan SPSS ekranında bivariate (ikili) ve Partial (kısmi) olmak üzere iki korelasyon türü karşımıza çıkmaktadır.

    İkili (bivariate) korelasyon iki değişken arasındaki korelasyonu gösterirken kısmi (partial) korelasyon iki değişken arasındaki ilişkiyi gösterirken diğer değişkenlerine etkisini kontrol etmek için kullanılır.

    Pearson korelasyon ve Spearman korelasyon katsayıları ikili korelasyonlar arasındadır.

    Yrd. Doç. Dr. Sedat ŞEN 12

  • Yrd. Doç. Dr. Sedat ŞEN 13

    • Açılan SPSS ekranında bivariate (ikili) Pearson korelasyon ve Spearman korelasyon katsayıları ikili korelasyonlar arasındadır.

  • Sunumun başında önce varyans ve kovaryans sonra da korelasyon değerlerini hesapladığımız veriyi SPSS ile korelasyon değeri hesaplamada kullanacağız. Veride katılımcıların izledikleri reklam sayıları ile aldıkları ürün sayıları içeren iki değişken verilmektedir.

    Yrd. Doç. Dr. Sedat ŞEN 14

  • Yan taraftaki ekranda aralarında ilişki olup olmadığını merak ettiğimiz iki değişkeni ekraın sağ tarafına attıktan sonra Pearson kutucuğunu işaretledikten sonra OK tuşuna basabiliriz. Burada iki yönlü hipotez için iki kuyruklu (two-tailed) seçilir.

    Yrd. Doç. Dr. Sedat ŞEN 15

  • Options menüsünde ortalama ve standart sapma gibi betimleyici istatistiklerin yanında kovaryans istatistiği de elde edebiliriz. Eğer verimizde kayıp veri var ise nasıl müdahale edilmesi gerektiğini (pairwise ya da listwise) de seçebiliriz.

    Yrd. Doç. Dr. Sedat ŞEN 16

  • Options Menüsünde işaretlememize göre betimleyici istatistik değerleri elde edebiliriz. Bu tablodaki değerler sunumun başındaki hesaplamalarımız ile aynıdır.

    Yrd. Doç. Dr. Sedat ŞEN 17

  • Korelasyon analizi sonucunda elde ettiğimiz yandaki tabloda korelasyon değerinin yanında, bu değerin anlamlılığı (p-değeri), çapraz çarpımlar, kovaryans ve örneklem büyüklüğü (N) değerleri elde edilir.

    Yrd. Doç. Dr. Sedat ŞEN 18

  • Yandaki tabloda dikkat etmemiz gereken şey ise aynı değerlerin 2 kez rapor edilmesidir. Bunun sebebi A-B arasındaki her hesaplamanın B-A arasındaki hesaplamalara eşit olmasıdır. Burada tablonun alt ya da üst kısımlarından birine odaklanmak yeterlidir.

    Yrd. Doç. Dr. Sedat ŞEN 19

  • Yandaki tabloya göre 5 değere sahip reklam ve 5 değere sahip ürün değişkenleri arasındaki korelasyon değeri 0.871 olarak hesaplanmıştır. Sıfır hipotezini reddedemeyeceğimizi söyleyen 0.054 p-değerine göre anlamlı bir ilişki bulunmamaktadır. Ayrıca kovaryans değeri 4.25 olarak bulunmuştur. Bu değerleri sunumun başında SPSS kullanmadan hesaplamıştık. Burada bir değişkenin kendi ile olan kovaryansı varyanstır ve daha önce hesapladığımız (2.8 ve 8.5) varyans değerleri ile aynıdır.

    Yrd. Doç. Dr. Sedat ŞEN 20

  • Yrd. Doç. Dr. Sedat ŞEN 21

  • Yrd. Doç. Dr. Sedat ŞEN 22

  • İki nicel değişken arasındaki ilişkiyi göstermek için Pearson korelasyon katsayısını hesaplayabiliriz.

    Aşağıdaki tabloda kitap okuma sayısı ile öğrenci yaşı arasındaki korelasyon değeri (r=.069) gösterilmektedir.

    Yrd. Doç. Dr. Sedat ŞEN 23

  • Okunan kitap sayısı ile final notu arasındaki ilişki için yandaki korelasyon işlemi uygulanır.

    Yrd. Doç. Dr. Sedat ŞEN 24

  • Okunan kitap sayısı ile final sınavında alınan puan arasında 0’a yakın bir korelasyon vardır (.03).

    Yrd. Doç. Dr. Sedat ŞEN 25

  • Aynı anda bir çok değişken arasında hesaplanan ikili korelasyonlara bakabiliriz.

    Yrd. Doç. Dr. Sedat ŞEN 26

  • Yrd. Doç. Dr. Sedat ŞEN 27

  • Spearman’s sıra korelasyonu Pearson korelasyon katsayısının parametrik olmayan versiyonudur.

    Parametrik varsayımların sağlanmadığı normal olmayan verilerde kullanılır.

    Verilerin önce sıralanması daha sonra da Pearson eşitliğinin kullanılmasıyla elde edilir. İki tane sıralanmış değişken arasındaki Pearson korelasyon değeridir diyebiliriz.

    Spearman’s rho olarak da adlandırılır.

    Pearson korelasyonunda doğrusal (linear) ilişki söz konusu iken Spearman korelasyonda monotonik (monotonic) ilişkiden bahsedilir.

    Yrd. Doç. Dr. Sedat ŞEN 28

  • Matematik Fizik

    56.0 66.0

    75.0 70.0

    45.0 40.0

    71.0 60.0

    61.0 65.0

    64.0 56.0

    58.0 59.0

    80.0 77.0

    76.0 67.0

    61.0 63.0

    Yrd. Doç. Dr. Sedat ŞEN 29

    Yukarıdaki Spearman rho formülü ile yandaki 2 değişken arasındaki korelasyon değerini hesaplayabilmek için önce iki değişkendeki her puan için sıralamada kaçıncı olduklarını, sonra bu sıralamalar arasındaki farkları daha sonra da bu farkların karesini hesaplamak gerekmektedir. Bu işlemler SPSS’te otomatik olarak yapılmaktadır. SPSS ile bulmadan önce elle nasıl hesaplandığını göstereceğiz.

  • Yan tarafta bir grup öğrencinin matematik ve fizik derslerinden aldığı puanlar verilmektedir. Bu iki değişken arasında Spearman sıra korelasyonu katsayısı hesaplanacaktır.

    Yrd. Doç. Dr. Sedat ŞEN 30

  • SPSS’te Spearman korelasyonu Pearson korelasyonu ile aynı menüde yer almaktadır. Burada tek yapmanız gereken Spearman kutucuğunu seçmektir.

    Yrd. Doç. Dr. Sedat ŞEN 31

  • Hesaplamalarımızda bulduğumuz gibi Spearman sıra korelasyon katsayısı aşağıdaki SPSS tablosunda 0.669 olarak sunulmaktadır.

    Yrd. Doç. Dr. Sedat ŞEN 32

  • IQ TV

    105 6

    88 0

    99 26

    100 49

    98 27

    104 28

    96 19

    117 11

    111 5

    108 16

    Yrd. Doç. Dr. Sedat ŞEN 33

    Bireylerin IQ puanı ile haftalık TV izleme saatleri arasındaki ilişkiyi parametrik olmayan Spearman’s sıra korelasyonu ile incelemek istersek önce bu 2 değişkendeki her bir değerin kaçıncı sırada olduğunu göstermek sonra da Spearman’ın formülünü kullanarak hesaplama yapmamız gerekir. SPSS’te bunları yapmadan tek tuşla Pearson korelasyonunu hesapladığımız gibi Spearman sıra korelasyonunu da hesaplayabiliriz.

  • Aynı Pearson korelasyonda olduğu gibi Analyze>Correlate>Bivariate kısmına giriyoruz.

    Yrd. Doç. Dr. Sedat ŞEN 34

  • Açılan ekranda ilişkileri merak edilen değişkenleri Variables kısmına giriyoruz ve Correlation Coefficients kısmında Spearman kutucuğunu seçiyoruz.

    Yrd. Doç. Dr. Sedat ŞEN 35

  • Tabloda görüldüğü üzere Spearman’s sıra korelasyon değeri -.176 olarak hesaplanır. Bu tablo kullanılarak Pearson korelasyondakine benzer yorumlar yapılabilir.

    Yrd. Doç. Dr. Sedat ŞEN 36

  • Korelasyon neden-sonuç ilişkisini işaret etmez…

    Yrd. Doç. Dr. Sedat ŞEN 37