32
L/O/G/O Uygun Analiz Türünün Seçilmesi

Veri analizi sunu

Embed Size (px)

Citation preview

Page 1: Veri analizi sunu

L/O/G/O

Uygun Analiz Türünün SeçilmesiUygun Analiz Türünün Seçilmesi

Page 2: Veri analizi sunu

Parametrik-Parametrik Olmayan TestlerParametrik-Parametrik Olmayan Testler

T-testi

Varyasyon Analizi

Regresyon Analizi

Korelasyon Analizi

Wicoxon Testi

Kruskal Wallis Testi

Man Witney U Testi

Binom Testi

Friedman Testi

Parametrik TestlerParametrik TestlerParametrik olmayan testlerParametrik olmayan testler

Ki kare Testi

Parametrik olmayan Korelasyon

Page 3: Veri analizi sunu

Parametrik TestlerParametrik Testler

• Ölçümle değer alınmış ve süreklilik gösteren ölçümlere denir.• Bir testte ortalama, varyans, oran vb. gibi ölçüler kullanılıyorsa

bu test parametrik bir testtir.• Bu testte ölçümle belirtilen karakterler vardır. Örneğin: uzunluk,

ağırlık, miktar, yaş, kolesterol miktarı,kopma basıncı vb. • Parametrik testlerin hemen hemen hepsinin uygulanabilmesi

için ise, en azından verilerin normal dağılıma uyması, varyansların homojen olması ve her testte farklı olmak üzere başka koşulların da sağlanması gerekir.

• Parametrik testler, nonparametrik testlere göre daha güçlü ve daha esnektir. 

Page 4: Veri analizi sunu

Parametrik Test varsayımlarıParametrik Test varsayımları

• Örneklemin seçildiği evrenle ilgili;– Normal dağılıma sahip olmalı.– Varyanslar homojen olmalı.

• Örneklemle ilgili;– Denekler evrenden rastgele seçilmeli.– Denekler birbirinden bağımsız olmalı.

Page 5: Veri analizi sunu

Parametrik olmayan(Nonparametik) TestlerParametrik olmayan(Nonparametik) Testler

• Parametrik olmayan testler , genellikle iki ana kütle dağılımının orta noktalarının eşitliğini kontrol eden testler olarak bilinirler ve bağımsız örneklerin elde edildiği iki ana kütlenin  karşılaştırılmasını esas alırlar.

• Ölçü yerine sıralama, sayma, işaretleme gibi işlemlerin kullanıldığı testtir.

• Bu testte de sayımla belirtilen karakterler kullanılır. Örneğin: saç rengi, cinsiyet, meslek, iyileşme..

• Bir testin uygulanabilmesi için gerekli koşulların ne olduğu veya koşulların sağlanıp sağlanamadığı bilinmiyorsa verilerin analizinde nonparametrik testler kullanılmalıdır.

Page 6: Veri analizi sunu

L/O/G/O

Parametrik TestlerParametrik Testler

Page 7: Veri analizi sunu

T- TESTİT- TESTİ

• T testi, hipotez testlerinde en yaygın olarak kullanılan yöntemdir. t testi ile iki grubun ortalamaları karşılaştırılarak, aradaki farkın rastlantısal mı, yoksa istatistiksel olarak anlamlı mı olduğuna karar verilir. 

• Üç tür t testi bulunmaktadır;– Tek grup "t"-Testi (one-sample test)– Bağımsız iki grup arası farkların testi (Independest

Samples "t" test)– Eşleştirilmiş iki grup arasındaki farkların testi

(Paired-Samples "t" testi)

Page 8: Veri analizi sunu

Tek grup "t"-Testi (one-sample test)Tek grup "t"-Testi (one-sample test)

• Bu test genellikle herhangi bir konuda belirli öngörülerde bulunulduğunda bu öngörünün doğruluk derecesini test etmek amacıyla uygulanır.

Örnek: - A okulunda çalışan 100 personelin yaş ortalamasının 37 olduğu biliniyor. Rastgele seçilen 10 kişilik örneklemin yaş ortalaması 37'den farklı mıdır? - Bir üniversitede okuyan öğrencilere günlük harcamalarının ne kadar olduğu soruluyor. Acaba öğrencilerin günlük harcamalarının ortalaması (öngörülen) 10 TL.den farklı mıdır?

Page 9: Veri analizi sunu

Bağımsız iki grup arası farkların testi (Independest Samples "t" test)

Bağımsız iki grup arası farkların testi (Independest Samples "t" test)

• Bir araştırmada çoğu kez farklı ana kütleden elde edilen gruplar arasında karşılaştırmalar yapmak gerekir.

Örnekler: - Evli ve bekar öğretmenlerin aylık harcamaları arasında anlamlı bir farklılık var mıdır? - Yönetici ve öğretmenlerin okullardaki çalışma ortamına ilişkin görüşleri arasında anlamlı bir farklılık var mıdır? - Yerli ve yabancı turistlerin müşteri tatminine ilişkin görüşleri arasında anlamlı bir farklılık var mıdır?

Page 10: Veri analizi sunu

Eşleştirilmiş iki grup arasındaki farkların testi (Paired-Samples "t" testi)

Eşleştirilmiş iki grup arasındaki farkların testi (Paired-Samples "t" testi)

• Bağımsız iki grup için farkların testi konusu incelenirken grupların birbirlerinden bağımsız evrenlerden geldiği varsayımı kabul edilmekteydi. Ancak özellikle kontrollü ve deneysel çalışmalarda aynı deneklerin farklı durumlarda nasıl davrandıklarının incelenmesine gerek duyulabilir. Amaç farklı iki koşulda elde edilen sonuçların farklı olup olmadığını araştırmaktır.

Page 11: Veri analizi sunu

VARYANS ANALİZİ(ANOVA)VARYANS ANALİZİ(ANOVA)

• İki farklı grup arasında karşılaştırma yapmamız gerektiğinde t-testini kullandık. Eğer grup sayısı ikiden fazla ise… Bu durumda varyans analizini kullanacağız.

• Varyans Analiz yöntemleri:– Bağımsız Örneklem Tek Yönlü Varyans Analizi,– Bağımsız Örneklem İki Yönlü Varyans Analizi, – İlişkili Örneklem Tek Yönlü Varyans Analizi,– İlişki Örneklem İki Yönlü Varyans Analizi – Çok Faktörlü Varyans Analizi

Page 12: Veri analizi sunu

Bağımsız Örneklem Tek Yönlü Varyans AnaliziBağımsız Örneklem Tek Yönlü Varyans Analizi

• Bağımsız örneklem tek yönlü varyans analizinde ikiden fazla grubun ortalamaları karşılaştırılır.

• Örneğin;– Evlilik hakkındaki görüşlerin medeni duruma

(evli, bekar, dul) göre farklılık gösterip göstermediğini test etmek istersek,

– Farklı eğitim düzeylerindeki kadınların kozmetik harcamaları arasında fark olup olmadığını bulmak için bu yöntem kullanılır.

Page 13: Veri analizi sunu

Bağımsız Örneklem İki Yönlü Varyans AnaliziBağımsız Örneklem İki Yönlü Varyans Analizi

• Belli bir bağımlı değişken üzerinde, birden fazla bağımsız değişkenin ortak etkisini ölçmek için kullanılır.

• Örnek:– Erkek ve kadın öğretmenlerin performansları

yaşlarına bağlı olarak farklılık gösterir mi?

Page 14: Veri analizi sunu

İlişkili Örneklem Tek Yönlü Varyans Analiziİlişkili Örneklem Tek Yönlü Varyans Analizi

• Ölçüm sayısının ikiden fazla olduğu durumlar ile ikiden fazla konuya ilişkin görüşlerin karşılaştırılmasında bu yöntem kullanılır.

• Örneğin;– bir ilacın etkilerini ölçmek için ikişer hafta arayla

yapılan dört farklı testin sonuçlarının ya da,– öğretmenlerin A, B, C eğitim yöntemlerine ilişkin

görüşlerini bu yöntemle karşılaştırabiliriz.

Page 15: Veri analizi sunu

İlişkili Örneklem İki Yönlü Varyans Analiziİlişkili Örneklem İki Yönlü Varyans Analizi

• Bir ilacın etkilerini ölçmek için ikişer ay arayla yapılan dört farklı testin sonuçlarını İlişkili Örneklem Tek Yönlü Varyans Analizi yöntemini kullanarak karşılaştırdık.

• Peki bu ilaçların etkilerinin deneklerin cinsiyetlerine göre farklılık gösterip göstermediğini İlişkili Örneklem İki Yönlü Varyans Analizi kullanarak buluruz.

Page 16: Veri analizi sunu

Çok Faktörlü Varyans AnaliziÇok Faktörlü Varyans Analizi

• Eğer birden fazla bağımlı değişkenin (performans, tatmin düzeyi, başarı notu vb.), birden fazla bağımsız değişken (cinsiyet, gelir düzeyi, mezun olunan okul vb.) göre farklılaşma durumunu aynı anda incelemeniz gerekiyorsa çok faktörlü varyans analizi yöntemini kullanabilirsiniz.

• Örnek:– Bir işletmede çalışan personelin performansları

ve tatmin düzeyleri cinsiyet ve gelir durumlarına göre farklılık göstermekte midir?

Page 17: Veri analizi sunu

REGRESYON ANALİZİREGRESYON ANALİZİ

• Bağımlı değişken ile bir veya daha çok bağımsız değişken arasındaki ilişkiyi incelemek amacıyla kullanılan bir analiz yöntemidir.

• Regresyon analizi, değişkenler arasındaki neden-sonuç ilişkisini bulmamıza imkan verir. Örneğin “yemek yeme” ile “kilo alma” arasındaki ilişki regresyon analizi ile ölçülebilir.

• Regresyon Analizi yöntemleri:– İkili regresyon– Çoklu regresyon

Page 18: Veri analizi sunu

İkili Regresyonİkili Regresyon

• İkili regresyonda araştırmacı, bağımsız değişken X hakkında sahip olduğu bilgilerden hareketle bağımlı değişken Y’yi tahmin etmeye çalışır.

• Örnek;– öğretmenlerin ders işleme yöntemlerinin

öğrenci başarısına etkileri

Page 19: Veri analizi sunu

Çoklu RegresyonÇoklu Regresyon

• Çoklu regresyonda ikili regresyondan farklı olarak bağımlı değişken üzerinde birden fazla bağımsız değişkenin toplu etkisi araştırılır.

• Örnek;– Öğrenme, Ortak Vizyon, Açık Fikirlilik ve

Koordinasyon değişkenlerinin Yenilikçi İş Davranışına etkileri

Page 20: Veri analizi sunu

KORELASYON ANALİZİKORELASYON ANALİZİ

• Korelasyon Analizinde, bir ana kütleden seçilmiş en az iki veya daha fazla örnek grup alınarak, bu gruplar arasındaki etkileşime bir katsayı yardımıyla bakılır. Bu katsayı korelasyon katsayısıdır ve r ile gösterilir.

• Korelasyon analizinin yapılacağı gruplar (bunlara değişken de diyebiliriz) arasında etkileşime bakılırken, regresyon analizinde olduğu gibi bağımlı değişken veya bağımsız değişken olma şartı aranmaz.

• Korelasyonuna bakılacak olan değişken gruplar ikiden fazla olsalar dahi ikili olarak ele alınırlar ve bu ikili değişkenlerin etkileşimi, katsayı yardımıyla yön ve kuvvet olarak tayin edilirler.

• Örnek: günlük uyku süresi ile TV izleme süresi arasındaki ilişki

*** Korelasyon, neden-sonuç ilişkisinin göstergesi değildir.

Page 21: Veri analizi sunu

Kısmi KorelasyonKısmi Korelasyon

• Kısmi korelasyonda incelenen değişkenlerle ilişkili olduğu düşünülen bir ve ya daha fazla değişkenin bu değişkenler üzerindeki etkisi kontrol altında tutulur.

• Örnek;– farklı bölgelerde bulunan okulların ortalama

başarı düzeyi ile bu bölgelerin sosyo-ekonomik durumu arasında bir ilişki

Page 22: Veri analizi sunu

L/O/G/O

Parametrik Olmayan TestlerParametrik Olmayan Testler

Page 23: Veri analizi sunu

WİLCOXON TESTİWİLCOXON TESTİ

• "Wilcoxon" testi eşleştirilmiş gruplara ilişkin farklılıkların boyutlarını da dikkate alarak iki değişkene ait dağılımın aynı olup olmadığını test etmek amacıyla geliştirilmiş bir analiz

• yöntemidir. • "Paired" eşleştirilmiş "t" testinin parametrik olmayan

karşılığıdır, n birimlik örnekten elde edilen iki gözlem grubu farkının ortancası sıfır olan toplumdan çekilmiş rasgele örnek olup olmadığını test eder.

• Bağımlı değişkenlere ilişkin veriler;– Sayısal karakterler ile ifade edilmelidir.– Sürekli veri olmalıdır.– Aralık veya oran ölçeğindedir.

Page 24: Veri analizi sunu

Wilcoxon testi uygulanabilmesi için aşağıdaki varsayımların sağlanması gereklidir:Wilcoxon testi uygulanabilmesi için aşağıdaki varsayımların sağlanması gereklidir:

• Rasgele örnekleme: Örneklem seçiminde taraf tutulmadığı sürece rasgele örneklem gerekli değildir. Ancak rasgele örnekleme elde edilmesi örneklemden elde edilen sonuçların evren için genelleştirilmesi imkanı sağlar.

• Farkların bağımsızlığı: Wilcoxon testi gözlemler arasındaki farklar bağımsız değil ise uygulanamaz.

• Medyan ile ilgili olarak evrenin simetrik olması: İdeal olarak evrenin medyanından geçirilmiş çizgi, evrenin dağılımını gösteren grafiği eşit iki kısma ayırmalıdır. Eğer evren yaklaşık simetrik ise bir grupta wilcoxon işaretli sıra testi hala uygulanabilir. Eğer evren simetriden çok uzak ise bu test uygulanmamalıdır.

Page 25: Veri analizi sunu

KRUSKAL-WALLİS H TESTİKRUSKAL-WALLİS H TESTİ

• Bu test bağımsız iki yada daha çok grubun bir bağımlı değişkene ait ortalamalar arasında anlamlı bir farklılık olup olmadığını tespit etmek için kullanılır. Bu test tek yönlü ANOVA’nın non-parametrik karşılığıdır.

• Analizde veri değerleri sıralı hale getirilir, sıra toplamları grup büyüklüğüne bölünerek sıra ortalamaları hesaplanır ve bu ortalamalar karşılaştırılır.

• Örnek: – Üç farklı sınıftaki (A,B ve C) en başarılı öğrencilerin, fen derslerine

karşı tutumları arasında anlamlı bir farklılık var mıdır?

**Bu testte ve parametrik olmayan diğer testlerde, gruplara ait ölçümlerin karşılaştırılmasında aritmetik ortalama yerine ortanca (medyan) değer esas alınır.

Page 26: Veri analizi sunu

MANN WHİTNEY U TESTİMANN WHİTNEY U TESTİ

• "Mann Whitney U" testini T testinin parametrik olmayan karşılığı olarak kabul etmek mümkündür.

• Bu test iki bağımsız grup için elde edilen puanların birbirinden anlamlı bir şekilde farklılık gösterip göstermediğini test etmek için uygulanır.

• Örnek;– “x programına katılan öğrencilerin iletişim becerileri,

böyle bir programa katılmayan öğrencilere göre anlamlı bir şekilde yüksek midir?”

Page 27: Veri analizi sunu

BİNOM TESTİBİNOM TESTİ

• Sınıflama ölçeğiyle veri toplanmış bağımlı değişken için kullanılır. Bağımlı değişken hakkındaki veriler iki düzeylidir (“binomial”; örneğin, cinsiyet için Erkek-Kadın biçiminde).

• Mevcut verilerin öngörülen bir sayıdan/yüzdeden farklı olup olmadığını test etmek için kullanılır.

• Örnek:– Demir bir para ile yazı tura atıldığında, yazı gelme olasılığı

1/2dir. Bu hipoteze dayanarak 40 defa yazı tura atılarak sonuçlar bir yere not edildiğinde, atılanların ¾’ünün yazı olması ve gözlemlenen anlamlılık derecesinin küçük (0.0027) olması durumunda, olasılığın ½ ihtimalinden uzak olması yani atılan paranın hileli olması söz konusudur.

Page 28: Veri analizi sunu

Kİ KARE UYGUNLUK TESTİKİ KARE UYGUNLUK TESTİ

• Ki – Kare uygunluk testi ile belirli bir değişkenin farklı kategorilerine ait gözlenen frekanslarının, beklenen frekanslarına uygunluğu araştırılır. Burada beklenen frekanslar birbirine eşit olabileceği gibi farklı da olabilir.

Page 29: Veri analizi sunu

Kİ-KARE BAĞIMSIZLIK TESTİKİ-KARE BAĞIMSIZLIK TESTİ

• Ki – Kare Bağımsızlık Testi iki değişken arasındaki ilişkinin istatistiksel olarak anlamlı olup olmadığını belirlemek amacıyla kullanılır.

• Bu testte diğer ilişkisel analizlerden farklı olarak ilişki kurulan değişkenlerin her ikisi de Nominal (Sınıflama) ya da Ordinal (Sıralama) ölçeklidir.

• Daha açık bir ifade “gelir düzeyi ile siyasi parti seçimi”, “eğitim düzeyi ile okunan gazete”, “iş tatmini düzeyi (evet, kısmen, hayır) ile ücret” değişkenleri arasındaki ilişkiler Ki – Kare Bağımsızlık Testi ile incelenebilir.

Page 30: Veri analizi sunu

FRİEDMAN TESTİFRİEDMAN TESTİ

• İki veya daha fazla sayıdaki eşleştirilmiş örnek kitleyi karşılaştırılmada kullanılmaktadır.

• Hatırlarsanız, eşleştirilmiş örneklem t-testini kullanarak; belirli bir değişkene ait deney öncesi ve sonrası değerlerini karşılaştırılmıştık. Ayrıca yine bu yöntemi, bir grubun ilişkili fakat farklı iki konuya ilişkin görüşlerini karşılaştırmak için kullanmıştık.

• Ölçüm sayısının ikiden fazla olduğu durumlarda ise İlişkili Örneklem Tek Yönlü Varyans Analizi yönteminden yararlanmıştık.

Page 31: Veri analizi sunu

FRİEDMAN TESTİFRİEDMAN TESTİ

• Verilerimizin parametrik olma şartlarını taşımadığı durumlarda ise bu iki test yönteminin her ikisinin de yerine Friedman Testini kullanabilirsiniz.

• Örneğin bir ilacın etkilerini ölçmek için ikişer hafta arayla yapılan dört farklı testin sonuçlarının ya da öğretmenlerin A, B, C eğitim yöntemlerine ilişkin görüşlerini Friedman Testini kullanarak karşılaştırabiliriz.

Page 32: Veri analizi sunu

PARAMETRİK OLMAYAN KORELASYON ANALİZİPARAMETRİK OLMAYAN KORELASYON ANALİZİ

• Değişkenlerden birinin ya da her ikisinin de aralıklı/oranlı olmadığı (ama sıralı olduğunun varsayıldığı) ve normal dağılmadığı durumlarda Spearman korelasyon katsayısı kullanılır.

• Değişkenlerin aldığı değerler sıraya çevrildikten sonra ilişkilendirilir.