İlişki Ölçüleri

Preview:

DESCRIPTION

İlişki Ölçüleri. Bu bölümde biri bağımlı ve diğeri bağımsız olan iki değişken arasındaki bir ilişki olup olmadığı ve ilişkinin yönü ve kuvveti incelenecektir. Bağımlı ve Bağımsız Değişkenler Sürekli Olduğunda İlişki Katsayısı. - PowerPoint PPT Presentation

Citation preview

İlişki Ölçüleri

Bu bölümde biri bağımlı ve diğeri bağımsız olan iki değişken arasındaki bir ilişki olup olmadığı ve ilişkinin yönü ve

kuvveti incelenecektir.

İki değişken arasındaki ilişkiler değişik yapılarda ortaya çıkabilir. Örneğin bazı ilişkiler doğrusal

iken bazıları doğrusal değildir.

Bağımlı ve Bağımsız Değişkenler Sürekli Olduğunda İlişki Katsayısı

Daha önceki derslerde iki değişken arasındaki ilişkilerin grafikler yardımı ile nasıl incelenebileceği konusu üzerinde

durulmuştu.

Sürekli ve kesikli iki değişken arasındaki ilişkinin yapısı konusunda bilgi edinebilmenin en iyi yolu

saçılım grafiklerinden yararlanmaktır.

Örnek 1:

Ağırlık-BKI düzeyi İlişkisiAğırlık

(x)

BKI

(y)

64.0 22.1

75.3 24.5

73.0 23.8

82.1 26.8

76.2 25.3

. .

. .

77.6 28.6

Hizmet edilen hasta sayısı ile birim başına yemek maliyeti ilişkisi

Hasta Sayısı

Maliyet ($)

30 1.15 35 1.10 40 0.98 45 1.01 50 0.97 55 0.90 60 0.89 65 0.80 70 0.85 75 0.78 80 0.70

HİZMET EDİLEN KİŞİ SAYISI

9080706050403020

BİR

İM B

AŞI

NA

YE

ME

K M

AL

İYE

Tİ (

$)

1,2

1,1

1,0

,9

,8

,7

,6

Örnek 2:

İki değişkene ilişkin doğrusal ilişkilerde eğer bir değişkenin değerleri artarken diğer değişkenin

değerleri de artıyorsa ya da bir değişkenin değerleri azalırken diğer değişkenin değerleri de

azalıyorsa, değişkenler arasında pozitif ilişki vardır.

Pozitif Zayıf İlişki

Pozitif Kuvvetli İlişki

Pozitif Tam İlişki

POZİTİF ZAYIF İLİŞKİ

P O Z İ T İ F Z A Y I F İ L İ Ş K İ

2624222018161412108

30

20

10

0

POZİTİF KUVVETLİ İLİŞKİ

P O Z İ T İ F K U V V E T L İ İ L İ Ş K İ

2624222018161412108

30

20

10

0

POZİTİF TAM İLİŞKİ

P O Z İ T İF T A M İ L İ Ş K İ

2624222018161412108

26

24

22

20

18

16

14

12

10

8

İki değişkene ilişkin doğrusal ilişkilerde eğer bir değişkenin değerleri artarken diğer değişkenin

değerleri de azalıyorsa ya da bir değişkenin değerleri azalırken diğer değişkenin değerleri de

artıyorsa, değişkenler arasında negatif ilişki vardır.

Negatif Zayıf İlişki

Negatif Kuvvetli İlişki

Negatif Tam İlişki

NEGATİF ZAYIF İLİŞKİ

N E G A T İ F Z A Y I F İ L İ Ş K İ

2624222018161412108

30

20

10

0

NEGATİF KUVVETLİ İLİŞKİ

N E G A T İ F Z A Y I F İ L İ Ş K İ

2624222018161412108

20

10

0

-10

NEGATİF KUVVETLİ İLİŞKİ

NEGATİF TAM İLİŞKİ

N E G A T İ F T A M İ L İ Ş K İ

2624222018161412108

16

14

12

10

8

6

4

2

0

-2

İLİŞKİSİZLİK

İ L İ Ş K İ Y O K

2624222018161412108

30

20

10

0

Pearson İlişki (Korelasyon) Katsayısı (r)

Ölçümle belirtilen iki değişken arasındaki doğrusal ilişkinin kuvveti (derecesi) ve yönü hakkında bilgi

verir.

arasında değişir.

İlişki artar

0-1 +1

İlişki Azalır

11 r

r İlişkinin derecesi

0.90 to 1.00 Çok kuvvetli

0.70 to 0.89 Kuvvetli

0.50 to 0.69 Orta

0.30 to 0.49 Düşük

0.00 to 0.29 Zayıf

İlişkiler aşağıdaki gibi nitelendirilebilir.

r’nin Hesaplanması

n

yy

n

xx

n

yxyx

rn

iin

ii

n

iin

ii

n

i

n

i

n

iii

ii

1

2

1

21

2

1

2

1

1 1

)()(

r’nin Anlamlılığı

Korelasyon katsayısının (r) anlamlı olup olmadığı (sıfırdan farklı olup olmadığı) t dağılımı yardımı ile test edilebilir. 2

1 2

nr

rt

Karşılaştırma

• Hesapla bulunan t istatistiği, belirlenen yanılma düzeyinde n-2 serbestlik dereceli t tablo istatistiği ile karşılaştırılır.

• tHesap>tTablo ise iki değişken arasındaki ilişkinin sıfırdan farklı olduğu söylenir.

Ağırlık-BKI İlişkisi

Ağırlık

(x)

BKI

(y)

64.0 22.1

75.3 24.5

73.0 23.8

82.1 26.8

76.2 25.3

. .

. .

77.6 28.6

Örnek 1: (devam)

Ağırlık-BKI İlişkisi

83.0

15

)10.373(03.9337

15

)20.1082(70.78509

15

)10.373()20.1082(85.27047

22

r

1,0000 0,83

0,83 1,0000

İLİŞKİ( KORELASYON) MATRİSİ

AĞIRLIK BKI

AĞIRLIK

BKI

Anlamlılığın Test Edilmesi

1. Hipotezlerin Kurulması. H0: İki değişken arasında ilişki yoktur (=0).

H1: İki değişken arasında pozitif ilişki vardır (>0)

2. Test istatistiğinin elde edilmesi.

3. Yanılma düzeyi alfa=0.05 alınmıştır.

4. Karar için: Sd=n-2=15-2=13’tür.

13 serbestlik dereceli tek yönlü t tablo istatistiği 1.77 olarak bulunur.

Karar:tHesap=5.39>tTablo=1.77

olduğu için H0 hipotezi reddedilir ve r’nin sıfırdan büyük bir değer olduğu söylenir (p<0.05).

Açıklayıcılık Katsayısı (R2)

Açıklayıcılık (belirtme) katsayısı (R2), değişkenleri bağımlı-bağımsız değişken

olarak düşündüğümüzde bağımlı değişkendeki toplam değişimin yüzde kaçının

bağımsız değişken tarafından açıklanabildiğini belirtir.

İki değişken arasında doğrusal ilişki olması durumunda, korelasyon katsayısının karesi

açıklayıcılık katsayısına eşittir.

R2=r2

R2 değeri 0 ile +1 arasında değişir. R2 değerinin 1’e yaklaşması, bağımlı değişkendeki

değişimin büyük bir bölümünün bağımsız değişken tarafından açıklandığını gösterir.

Örneğimiz için R2

R2=r2=0.832=0.69

Buna göre ağırlık değişkeni, beden kitle indeksindeki değişimin % 69’unu

açıklamaktadır. Beden kitle indeksindeki değişimin % 31’i (1-0.69) dikkate alınmayan

başka değişkenlerce açıklanmaktadır.

Diğer Korelasyon Katsayıları

• Spearman Sıra Korelasyon Katsayısı (rs)

• Phi katsayısı

Spearman Sıra Korelasyon Katsayısı (rs)

• Pearson korelasyon katsayısının parametrik olmayan karşılığıdır.

• Değişkenlerin biri ya da her ikisinin normal dağılmadığı durumlarda kullanılabileceği gibi doğrudan sıralı (ordinal) olarak elde edilen ya da belli bir kritere göre sıralanmış olan iki değişkenin ilişki miktarını belirlemek amacı ile de kullanılır.

rs’nin hesaplanması ve anlamlılığı için t istatistiğinin bulunması

’nin hesaplanması t istatistiği

7-9 yaş çocuklarda günlük içtikleri süt miktarı ile serum kalsiyum düzeyleri

arasındaki ilişkinin incelenmesi

Örnek 3:

Süt miktarı

(bardak)

(x)

Serum kalsiyum

düzeyi

(mg/dL)

(y)

Sıra Süt mik.

(x)

Sıra

Serum kalsiyum

düzeyi

(y)

d

3 8 5 3.5 1,53 8.6 5 6 -15 9 7.5 7 0.56 10.5 9 9 05 9.2 7.5 8 -0.57 11 10 10 02 7.5 2.5 2 0.52 8 2.5 3.5 -1,03 8.3 5 5 01 7 1 1 0

5d2

α=0.05, n=10 serbestlik dereceli tek yönlü t tablo değeri 1.81’dir. 9.69>1.81 olduğu için günlük içilen süt miktarı ile serum kalsiyum düzeyleri arasında pozitif bir ilişki vardır.

H0: İki değişken arasında ilişki yoktur (ρS=0).

H1: İki değişken arasında pozitif ilişki vardır (ρS>0).

Phi Katsayısı

• 4 gözlü çapraz tablolarda uygulanır.

• Pearson korelasyon katsayısı (r) gibi yorumlanır.

• Ki-kare istatistiği anlamlı ise Phi katsayısı da anlamlıdır. n

2

Beslenme durumuna göre okuldaki başarı dağılımı

Okuldaki Başarı Beslenme Durumu

Başarılı Başarısız Toplam

Yeterli 21 20 41 Yetersiz 13 22 35 Toplam 34 42 76

2 =1.51 (P>0.05)

14.076

51.1

Örnek 4: Aşağıda ilkokul çağındaki çocukların, beslenme durumlarına göre okuldaki başarı durumları verilmiştir.

Beslenme durumuna göre okuldaki başarı dağılımı

Okuldaki Başarı Beslenme Durumu

Başarılı Başarısız Toplam

Yeterli 210 200 410 Yetersiz 130 220 350 Toplam 340 420 760

2 =15.13 (P<0.05)

14.0760

13.15

Aynı soruda bireylerin dağılımı aşağıdaki gibi olsaydı;

R E G R E S Y ONÇ Ö Z Ü M L E M E S İ

Dr. R. ALPAR

REGRESYON ÇÖZÜMLEMESİ

İki değişken arasındaki korelasyon katsayısı yeterince büyükse, kolay elde edilen bir x değişkeni değeri yardımıyla elde edilmesi zor olan bir y değişkeni değeri kestirilebilir. Bu kestirim regresyon çözümlemesi yardımıyla yapılır.

REGRESYON

a) Basit doğrusal regresyon

b) Çoklu doğrusal regresyon

BASİT DOĞRUSAL REGRESYON

Bir bağımlı bir bağımsız değişkenin olduğu doğrusal regresyon çözümlemesine

basit doğrusal regresyon çözümlemesi denir.

Kişi no GİSS (x) SKB(y)

1 4 12

2 11 14

3 8 11

4 15 15

5 5 11

6 16 14

7 20 15

8 9 13

9 2 10

Günlük İçilen Sigara Sayısı (GİSS)-Sistolik Kan Basıncı (SKB) İlişkisi

GÜNLÜK İÇİLEN SİGARA SAYISI (X)

20151050

SİS

TO

LİK

KA

N B

AS

INC

I (Y

)

16

15

14

13

12

11

10

9

Örnek 5:

y ve x gibi iki değişken arasındaki doğrusal ilişki

y=b0+b1x

ile verilir.

Değişken AdlarıRegresyon çözümlemesinde:

x değişkeni: genellikle bağımsız değişken ya da etkileyen değişken olarak

adlandırılır ve x ile gösterilir.

y değişkeni: x değişkenine bağlı olarak değiştiği düşünüldüğü için bağımlı değişken, açıklanan değişken ya da etkilenen değişken gibi adlar alır.

b0 ve b1 Katsayılarının Tanımı

• b0 : Regresyon doğrusunun y eksinini kestiği nokta olup kesim noktası ya da sabit olarak adlandırılır.

• b1: Regresyon katsayısıdır ve x’de bir birimlik değişme olduğunda y’de meydana gelecek ortalama değişlik miktarını verir.

b0 ve b1’in Bulunması

n

i

n

ii

i

n

i

n

i

n

iii

ii

n

xx

n

yxyx

b

1

1

2

2

1

1 1

1

)(xbyb 10

ÖRNEK 5:(devam)Günlük

içilen sigara sayısı(x)

Sistolik kan basıncı(y)

4 1211 148 11

15 155 11

16 1420 159 132 10

GÜNLÜK İÇİLEN SİGARA SAYISI (X)

20151050

SİS

TO

LİK

KA

N B

AS

INC

I (Y

)

16

15

14

13

12

11

10

9

b0= 10.004

b1= 0.277

Değişken Katsayı Standart hata

t p

Sabit 10.004 0.574 17.425 0.000

x 0.277 0.050 5.561 0.001

SONUÇLARIN SUNULMASI

KATSAYILARA İLİŞKİN İSTATİSTİKLER

r=0.903 R2=0.9032=0.815

DK KT Sd KO F PToplam 27.556 8

Regresyon 22.469 1 22.469 30.923 0.001

Artık 5.086 7 5.086

VARYANS ANALİZİ TABLOSU

Regresyon Doğrusunun Çizimi

*

*

ÇOKLU DOĞRUSAL REGRESYON ÇÖZÜMLEMESİ

• Amaç:• Kolay elde edilebilir bağımsız değişkenler

yardımıyla zor elde edilen bağımlı değişken değerini kestirmek

• Bağımsız değişkenlerden hangisi ya da hangilerinin bağımlı değişkeni daha çok etkilediğini belirlemek

Çoklu Doğrusal Regresyon Modeli

pp xbxbxbxbby .....ˆ 3322110

Değişkenlerin Tanımı

• Bağımlı değişken sürekli ya da kesikli sayısal veri tipinde olmalıdır.

• Bağımsız değişkenler sürekli kesikli ya da nitelik veri tipinde olabilir.

• Nitelik bağımsız değişkenler olduğunda göstermelik (dummy) değişkenler oluşturulur.

Gözlem Sayısı

• Gözlem sayısı (n), bağımsız değişken sayısının en az 10 katı olmalıdır.

• İdeali ise, gözlem sayısının bağımsız değişken sayısının 20 katı olmasıdır.

• Bazı çalışmalarda sayı 40 katına kadar çıkmaktadır.

Uyarılar

• Bağımsız değişkenler arasındaki korelasyon katsayıları yüksek olmamalıdır.Yüksek ilişki çoklubağlantıya neden olur.

• Büyük R2 ya da F istatistiğinin anlamlı olması modelin yeterliği ve geçerliği konusunda ayrıntılı bilgi vermez.

• Artıkların incelenmesi gereklidir.

Hipertansiyon hastası olan 120 kişiye ilişkin kan basıncını etkileyen faktörlerin incelenmesi

y: Ortalama artelyel kan basıncı (mm Hg)x1: Yaş (yıl)

x2: Ağırlık (kg)

x3: Vücut Yüzeyi Alanı (m2)

x4: Yüksek tansiyon hikayesi Süresi (yıl)

x5: Bazal kalp atım hızı (atış/dk)

x6: Stres ölçüsü

Örnek 6:

Çocuğun Doğum Ağırlığı (y)

Gebelik haftası (x1)

Annenin sigara içme durumu (x2)

y (gr) x1 x2

3940 38 13130 38 02420 36 12450 34 12740 38 12841 36 0

. . .3222 39 0

Örnek 7:

Recommended