Istatistik Ders Anlatımı

Preview:

DESCRIPTION

ist

Citation preview

İstatistik

Araştırma ve İstatistik Hakkında Ne Biliyoruz?

Konu Özeti

İstatistik Nedir? Neden İstatistik? İnsanlar istatistiği ne zamandır

kullanıyorlar? İstatistikte Bazı Temel Kavramlar İstatistiksel Verileri Tasnif Etme Korelasyon Grafik Analizi

Herkes biraz istatistik bilmeli!

• Üniversite Oran(%)

• Marmara 75

• Balıkesir 85

• Gazi 74

•Niğde 100

Herkes biraz istatistik bilmeli!Hangisi Başarılı?

Üniversite Sınava giren Kazanan Oran(%)

•Marmara 60 45 75

•Balıkesir 55 47 85

•Gazi 62 46 74

•Niğde 2 2 100

Herkes biraz istatistik bilmeli!Hangisi Başarılı?

Lise Üniversiteye giren öğrenci sayısı

A 120

B 90

C 62

Herkes biraz istatistik bilmeli!

Hangisi Başarılı?

Lise Üniversiteye giren

öğrenci sayısı

Sınava giren öğrenci sayısı

Oran(%)

B 90 210 42

C 62 260 24

A 120 630 19

Herkes biraz istatistik bilmeli!Hangisi Başarılı?

Firma Kaza / yıl

A 20

B 7

Hangi firmanın otobüsleri daha çok kaza yapıyor?

Herkes biraz istatistik bilmeli!

Firma Yolcu / gün Kaza / yıl Oran(%)

A 500 20 4.0

B 120 7 5.8

Hangi firmanın otobüsleri daha çok kaza yapıyor?

Herkes biraz istatistik bilmeli!

İstatistik Nedir?

İstatistik Nedir?

• İstatistik,İstatistik, belirli amaçlar için veri toplama, belirli amaçlar için veri toplama, toplanan verileri tasnif etme, çözümleme ve toplanan verileri tasnif etme, çözümleme ve yorumlama bilimidir.yorumlama bilimidir.

• İstatistik sayısal verileri değerlendiren bir İstatistik sayısal verileri değerlendiren bir bilim dalıbilim dalı

Neden İstatistik?

Neden İstatistik?

İstatistik,İstatistik, Ne kadar?Ne kadar? Ne zaman?Ne zaman? Nerede?Nerede? Nasıl?Nasıl? Kaç tane?Kaç tane? Hangi oranda?Hangi oranda?

Sorularına yanıt ararSorularına yanıt arar

İstatistik, çevremizde olup bitenleri sayılarla ifade etmede yardımcı olur.

İnsanlar İstatistiği Ne zamandır Kullanıyorlar?

• 1445 - zar atma, şans oyunları1445 - zar atma, şans oyunları• 17.Yüzyıl ortaları, istatistik ilk kez ders 17.Yüzyıl ortaları, istatistik ilk kez ders

kitaplarına girdikitaplarına girdi

İstatistikte Bazı Temel Kavramlar

İstatistikte Bazı Temel kavramlar

• EvrenEvren▫ Gözlem alanına giren obje ya da bireylerin Gözlem alanına giren obje ya da bireylerin

tümütümü• ÖrneklemÖrneklem

▫ Bir evrenden seçilmiş daha küçük sayıdaki Bir evrenden seçilmiş daha küçük sayıdaki obje ya da bireylerin oluşturduğu grupobje ya da bireylerin oluşturduğu grup

İstatistikte Bazı Temel kavramlar

• DeğişkenDeğişken▫ Her gözleme göre farklı değerler alabilen Her gözleme göre farklı değerler alabilen

objelere, özelliklere ya da durumlara denirobjelere, özelliklere ya da durumlara denir• Değişkenler nicel ya da nitel olabilir.Değişkenler nicel ya da nitel olabilir.• Nitel verilerNitel veriler• Sayısal verilerSayısal veriler-kesikli sayısal veriler (maç kazanma syısı)-kesikli sayısal veriler (maç kazanma syısı)-sürekli sayısal veriler (boy, kilo)-sürekli sayısal veriler (boy, kilo)• Nitelik ve sayısal veriler arasındaki ilişki (boy Nitelik ve sayısal veriler arasındaki ilişki (boy

sınıflandırması)sınıflandırması)

İstatistikte Bazı Temel kavramlar• ÖlçmeÖlçme

▫ objelere ya da bireylere belirli bir değere objelere ya da bireylere belirli bir değere sahip oluş derecelerini belirtmek için sahip oluş derecelerini belirtmek için sembolik değerler verme işlemidir.sembolik değerler verme işlemidir.

▫ Değişkenler hakkında bilgi edinmek için Değişkenler hakkında bilgi edinmek için yapılıryapılır

• ÖlçümÖlçüm▫ Ölçme sonucunda elde edilen değerÖlçme sonucunda elde edilen değer

İstatistikte Bazı Temel kavramlar

• Anlamlı rakamAnlamlı rakam

X=2.8

0 1 2 3 4 5 6

X=5.0

5 cm = 5,0cm

İstatistikte Bazı Temel kavramlar

•Sayıları yuvarlamaSayıları yuvarlama

5,387123 = 5,39 = 5,4 = 55,387123 = 5,39 = 5,4 = 5

Verilerin Sınıflandırılması •2,4,4,4,6,6,8,10,12,16,18•En büyük değerden en küçük değer

çıkarılarak veri aralığı tespit edilir. İstenen sınıf sayısına bölünerek

•2-18=16/8=2 veri aralığı 2 dir. •2-4•5-7•8-10

18.04.23

23

Frekans tablosu hazırlama

BÖLGE

35 22.7 22.7 22.7

59 38.3 38.3 61.0

13 8.4 8.4 69.5

14 9.1 9.1 78.6

18 11.7 11.7 90.3

7 4.5 4.5 94.8

8 5.2 5.2 100.0

154 100.0 100.0

akdeniz

ege

ic anadolu

marmara

karadeniz

dogu anadolu

guneydogu anadolu

Total

ValidFrequency Percent Valid Percent

CumulativePercent

18.04.23

24

Merkezi Eğilim Ölçüleri

İstatistikte Bazı Temel kavramlar

•Aritmetik OrtalamaAritmetik Ortalama•Aralık (range)Aralık (range)•SapmaSapma•Standart sapma Standart sapma •Ölçümlerin dağılımı ve standart Ölçümlerin dağılımı ve standart

sapma ile ilişkisisapma ile ilişkisi

İstatistikte Bazı Temel kavramlar

RangeDeğişken

İstatistikte Bazı Temel kavramlar

d1

Aritmetik ortalama

Sapma

d2

X= değerlerin toplamı/değer sayısı

Ağırlıklı ortalama

•İki eşit gurubun ortalamalarının ortalamasıdır.

• Geometrik ortalama

18.04.23

29

Standart sapma: •Bir dizi ölçümün gösterdiği değişimin en

güvenilir ölçüsüdür.

•Dağılım fazlaysa standart sapma büyük, dağılım dar alanda ise küçüktür.

•Standart Sapma istatistiksel analizde büyük önemi olan bir dağılma ölçüsüdür. "Kareli Ortalama Sapma" adı da verilen bu ölçü "değişkenlerin aritmetik ortalamadan sapmalarının kareli ortalaması"dır

Standart sapma: • Standart sapma /bütün elemanların

ortalamadan olan farklarının karelerinin toplamanının eleman sayısına bölümünün kareköküdür. şöyleki : 10,20,30 için ortalama 20 dir.

[ (10-20)nin karesi + (20-20)nin karesi + (30-20)nin karesi ] / 3(yani eleman sayisi)

ve yukarıdaki ifadenin karekökü..

ortalama değer

Ortanca (medyan)

•50. yüzdeliğe ortanca denir. Denek sayısı tek sayılı değer ise n+1/2

•Çift ise n/2 nci ile n+2/2 nci değeri /2 dir.•Veriler büyükten küçüğe doğru sıralanır

ortadaki iki değerin aritmetik ortalaması alınır

•5,5,6,6,7,9,9, 7+1/2 •5,5,6,6,7,9,9,10 8/2=4,

8+2/4=5•6+7=13/2=6,5

18.04.23

32

Tepe değer (mod)

•Dağılımda en fazla tekrarlanan değerdir. •Frekansı en fazla olan sınıfın değeridir. •5,5,6,6,6,7,9,9,10

18.04.23

33

Ölçme Sonucunun Gösterilmesi X = 5,8 ± 0,25

X = 58 ± 0,2

X = 58.3 ± 2

Yanlış Gösterim

X = 58.3 ± 0.2 Doğru Gösterim

İstatistiksel Verileri Tasnif Etme

İstatistiksel Verileri Tasnif Etme

• İstatistiksel verileri anlamlı hale İstatistiksel verileri anlamlı hale getirmenin 5 ayrı yolu:getirmenin 5 ayrı yolu:

1. Sözel ifadelerle açıklama

2. Tablolar halinde düzenleme

3. Grafikle gösterme

4. Verileri değerlendirerek istatistiksel ölçüler bulma

5. Bu yöntemlerde birkaçını birlikte uygulama

İstatistiksel Verileri Tasnif Etme

Verileri sözel ifadelerle açıklama

Verileri tablolar halinde düzenleme

▫ Frekans tablosu

Denekler ağırlık( kg)

1 52,5

2 68,0

3 75,8

4 89,7

İstatistiksel Verileri Tasnif Etme

Verileri tablolar halinde düzenleme

▫ Frekans tablosuPuan Frekans Yüzde

50-60 1 25

61-70 1 25

71-80 1 25

81-90 1 25

İstatistiksel Verileri Tasnif Etme

Verilerin grafikle gösterilmesi

▫ Çizgi grafiği

▫ Çubuk grafik (Histogram)

▫ Pasta grafiği

İstatistiksel Verileri Tasnif Etme

Çizgi grafiği

İstatistiksel Verileri Tasnif Etme

Fre

kan

s

Puan

2

46

8

1012

30 40 50 60 70 80 9040

Çubuk Grafik

İstatistiksel Verileri Tasnif Etme

Fre

kan

s

Puan

3

45

6

78

30 40 50 60 70 80 9040

Çubuk Grafik

İstatistiksel Verileri Tasnif Etme

0

5

10

15

20

25

2000 2001 2002

TÜRKÇE

SOSYAL

MATEMATİK

FEN

Çö

züle

n n

et s

oru

say

ısı

Yıllar

Pasta grafiği

İstatistiksel Verileri Tasnif Etme

36%

64%

Genel lise Meslek lisesi

Pasta grafiği, bir bütünün parçalarını karşılaştırmada kullanılır

2003 Üniversiteye yerleşme2003 Üniversiteye yerleşme

60%19%

10%

11%

Yerleşemeyen

Açık Öğr

Önlisans

Lisans

İstatistiksel Verileri Tasnif Etme

Doğru Grafik Seçme

35%

65%

Genel Lise Meslek Lisesi

3565

0

50

100

Ge

ne

lL

ise

Me

sle

kL

ise

si

AB Ülkelerinde Genel Lise Meslek Lisesi Oranları

İkisi de olabilir. Birincisi daha uygun

Doğru Grafik Seçme

4,6

9,4

8,3

6,5

Dünya

Avrupa 15'ler

Doğu Avrupa

Türkiye

6,5

8,39,4

4,6

0

2

4

6

8

10

Dün

ya

Avr

upa

15'le

r

Doğ

uA

vrup

a

Tür

kiye

Ülkelere Göre Eğitim Yaşı

Doğru Yanlış

Doğru Grafik Seçme

Yıllara göre okul yaşı

2,73,2

3,8

4,8

6,8

0

2

4

6

8

1975 1980 1985 1990 2000

2,7

3,2

3,8

4,8

6,8

1975

1980

1985

1990

2000

Doğru Yanlış

ödev

•Bir grup sporcunun ağırlık değerleri aşağıda verilmiştir.

•55, 56, 60, 65, 65, 67, 68, 70, 75, 77, •80, 82, 84,86, 88, 90, 92, 95, 97, 100

•n=20

18.04.23

49

İstatistiksel verileri açıklamada daima en etkili olanı kullanılmalıdır

Türkiye, kızların okullaşma oranında İran ve Mısır’dan da sonra geliyor

69 70

45

0

20

40

60

80

İran Mısır Türkiye

Kızların okullaşma oranı ve Türkiye

İki gurubun sınıflandırması

•Sporcuların kuvvet değerleri•Erkek: 10,10,20,20,20,30,30,30,50,40•Bayan: 5,5,10,20,20,20,30,30,40,40,

18.04.23

52

Veri sınıflandırması Erkek: 10,10,20,20,20,30,30,30,50,40

Bayan: 5,5,10,20,20,20,30,30,40,40 Veri aralıkları Bayan

F %

Erkek

F %

5-10

11-15

16-20

21-25

26-30

31-35

36-40

41-45

46-50

18.04.23

53

Basit tablolaştırma

Değişkenler N X ss min max

Erkek 10 26,00 12,64 10 50

Bayan 10 22,00 12,95 5 40

18.04.23

54

yada

Değişkenler N X ± SS(kg) Min (kg) Max(kg)

Erkek 10 26,00 ±12,64 10 50

Bayan 10 22,00 ±12,95 5 40

18.04.23

55

Grafik seçenekleri

kuvvet değerleri

20

21

22

23

24

25

26

27

erkek bayan

Seri 1

18.04.23

56

NORMAL DAĞILIM NEDIR

▫ İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir.

▫ Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır.

▫ Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması gerekir.

• Standart sapması• Frekans eğrisi çan şeklinde olan

simetrik dağılımdır. • Normal dağılım simetrik olduğu

için, normal dağılım gösteren değişkenlerin ortalama, ortanca ve modları eşittir

Normal dağılım,

• Dağılım şekli ölçütleri :  Çarpıklık –1 ve +1 arasında yer alır.

• Denekler ortalamadan daha büyük değerlerde toplanıyorsa, negatif basık ya da soldan basık,

• Küçük değerlerde toplanıyorsa pozitif basık ya da sağdan basık dağılımdan söz edilir.

Dağılım özelliğinin önemi nedir

• Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır.

• Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir

NORMAL DAĞILIMIN KRİTERLERİ • Dağılımın normal olup olmadığı grafik

ve istatistik analiz yöntemleri ile anlaşılır.

• Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir.

• Ama bu izlenimin istatistik yöntemlerle de test edilmesi gerekir. Shapiro-Wilks (n<30) ve Lilliefors (n>30) kolmagorw simirnov. Yada shefi testleri bu amaçla sıklıkla kullanılan testlerdir. Bu testlerde p değeri <0.05 ise dağılımın normal olmadığı sonucuna varılır.

•Örneklem büyüklüğü arttıkça, deneklerin dağılımı ve ortalamanın örneklem dağılımı normal dağılıma yaklaşır.

•Genellikle bir örneklemde 30 ya da daha fazla sayıda denek varsa, evren normal dağılım göstermiyorsa bile, ortalamanın örneklem dağılımının normal olduğu varsayılabilir

Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir :

1.      Verilere dönüşüm uygulayarak, onların normal dağılıma uymalarını sağlamak.

2.      Varolan verilere parametrik olmayan bir test uygulamak

KESTİRİM

• Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir. Evren parametrelerinin kestirilmesi için ya güven aralığı ve sınırları ya da hipotez testleri kullanılır

• Güven aralığı ve güven sınırları : Belirli bir olasılıkla, bilinmeyen evren değerini içeren değerler aralığıdır.

• Sıklıkla %95, bazen de %90 ve %99 güven sınırları kullanılmaktadır.

Hipotez testleri :

• Farklılık olmadığının varsayıldığı hipoteze, yokluk hipotezi, farksızlık hipotezi, sıfır hipotezi, başlangıç hipotezi adı verilir ve Ho ile gösterilir.

• H1 ile gösterilen alternatif hipotez  adı verilen hipotez ise, Ho hipotezinin tam tersidir.

P değeri ve yanılma düzeyi  :

• Ho hipotezinin reddedilmesi için hesaplanan olasılığın %5 ya da daha az olması genellikle kabul edilen sınırdır; yani Ho hipotezinin doğruluğu için hesaplanan olasılık %5 ya da daha küçükse, bu hipotezin kabul edilemeyeceği yargısına varılır

• Parametrik ve nonparametrik testler : Istatistiksel analiz yapılmadan önce, verilerin kategorik (nominal, ordinal) ya da sürekli (aralıklı, oransal) olup olmadığına bakılmalıdır.

• Kategorik verilerde parametrik olmayan isatistikler kullanılırken, sürekli verilerde ise parametrik istatistikler kullanılır

Testler

Parametrik Parametrik olmayan

İki ortalama arasındaki farkın anlamlılık testi t. test

Mann-Witney U testi

Tek yönlü varyans analizi (f testi) Kruskal-Wallis varyans analizi

İki eş arasındaki farkın anlamlılık testi (t test)

Wilcoxon eşleştirilmiş iki örnek testi

Tekrarlı ölçümlerde varyans analizi (f testi)

4 gözlü Ki-Kare testi

Bağımlı örneklerde iki yüzde rasındaki farkın anlamlılk testi ( z testi)

Bağımlı örneklerde ki-kare testi (McNemer testi)

18.04.23

71

Bağımlı gurup- bağımsız gurup kavramı •Bağımlı gurup: bir gözlem (denek)

üzerinde birden çok gözlem yapıldığında guruplar bağımlı olur

•Bağımsız gurup: bir gurupta bulunan gözlem (birey ) diğer gurpta bulunmuyorsa gurup bağımsız olur.

18.04.23

72

TESTLER

18.04.23

73

BAĞIMSIZ İKİ GURUBUN KARŞILAŞTIRILMASI •İki ortalama arasındaki farkın anlamlılık testi

•T. Testi •Gerekli koşullar1.Karşılaştırılacak iki gurup vardır2. Guruplar birbirinden bağımsızdır3. Veriler sürekli veri gurubundadır4: evren dağılımları normal dağılım gösterir5. Evren varyansları eşitti.

18.04.23

74

Mann-Witney U testi

•İki ortalama arasındaki farkın anlamlılık testinin nonparametrik karşılığıdır.

•Parametrik koşulları sağlanmadığı durumda kullanılır

18.04.23

75

Bağımsız ikiden çok gurubun karşılaştırılması •Tek yönlü varyans analizi •İkiden çok bağımsız gurup olduğunda ve

parametrik koşullar sağlandığında uygulanır.

•Nanparametdrik karşılığı Kruscal-Wallis varyans analizidir.

18.04.23

76

Varyans analizinde farkın kaynaklandığı gurubu belirleme •Varyans analizinde guruplar arasındaki

farkın hangi gurup yada guruplardan kaynaklandığını belirlemede

•1. duncan yöntemi•Tukey HSD yöntemi•Dunnet yöntemi•Student nevman-Keuls Yöntemi kullanılır

18.04.23

77

BAĞIMLI İKİ GURUBUN KARŞILAŞTIRILMASI •İKİ EŞ ARASINDAKİ FARKIN

ANLAMLILIK TESTİSAYFA 149………….

18.04.23

78

Korelasyon

• Korelasyon: iki değişken arasında bağıntı Korelasyon: iki değişken arasında bağıntı olup olmadığını araştırmaolup olmadığını araştırma

• Korelasyon katsayısı – r -

• Regrasyon analizi: bağıntının türünü : bağıntının türünü bulma bulma

Korelasyon

Korelasyon

Matematik Notları

Fiz

ik N

otl

arı

Korelasyon

Kişi başına gelir

Ort

alam

a ö

r

Korelasyon kararı için bir-kaç veri yeter mi?

Ülke nüfusu

Ort

alam

a ö

r

Korelasyon kararı için bir-kaç veri yeter mi?

Ülke nüfusu

Ort

alam

a ö

r

Korelasyon var mı?

Matematik Notları

Res

im N

otl

arı

Korelasyon var mı?

Frekans r*5 0,878

10 0,63215 0,51420 0,44430 0,36140 0,312

Korelasyon katsayısı r = 1 ise bağıntı var, r = 0 ise yok.

Grafik Analizi

• Basit korelasyon işlemlerinde kullanılır.Basit korelasyon işlemlerinde kullanılır.

• Grafik çizimi işlem sırası:Grafik çizimi işlem sırası:

▫ Eksenlerin belirlenmesi

▫ Uygun ölçek seçimi

▫ Verilerin yerleştirilmesi

▫ Lineer grafik elde edilmesi

▫ Eğim bulunması

Grafik Analizi

Eksenlerin belirlenmesi

Serbest değişken (birim)

Ba

ğlı

değ

işke

n(b

irim

)

Ölçek Seçimi

Hacim

tle

Her iki ölçek uygun değil

Ölçek Seçimi

Hacim

tle

Y ölçeği uygun değil

Ölçek Seçimi

X ölçeği uygun değil

Hacim

tle

Ölçek Seçimi

Hacim

tle

Uygun ölçek seçimi

Doğru çizimi

Hacim

tle

Doğru çizim

Yanlış çizim

Doğru çizimi

Hacim

tle

Yanlış çizim

Yanlış çizim

Doğru çizim

Eğim Bulunması

Zaman

Hız

Eğim= Hız/zaman = Tan!

Dikkat!

Kaynaklar

• Fiziksel Ölçmeler ve Değerlendirmesi, İ.Eşme• İstatistik Yöntemler ve Uygulaması, H.Arıcı

Teşekkürler

Recommended