14
Statistika 2016/17 Neparametarski statistički testovi

Statistika - Економски факултет у ... · Broj uzoraka Odnos uzoraka Merna skala (minimum) Neparametarski test 1 - Nominalna Hi-kvadrat test značajnosti proporcije

Embed Size (px)

Citation preview

Statistika

2016/17

Neparametarski statistički testovi

Šire područje primene (manji broj pretpostavki i manje detaljne pretpostavke). Jednostavna procedura za male uzorke. Polazna obeležja ne moraju biti numerička. Istraživanje problema koji se ne odnose samo na parametre populacije.

Kada se primene na podatke koji ispunjavaju uslove za primenu parametarskih metoda, rasipa se kvalitet informacija. Sa povećanjem veličine uzorka postupak se komplikuje.

Prednosti i nedostaci neparametarskih testova

Broj uzoraka

Odnos uzoraka Merna skala

(minimum) Neparametarski test

1 -

Nominalna Hi-kvadrat test značajnosti proporcije

Intervalna Wilcoxon-ov test ranga sa znakom*

Ordinalna Kolmogorov - Smirnov

2

Nezavisni Ordinalna Test na osnovu sume rangova*

Ordinalna Test na osnovu medijane*

Zavisni (usklađeni

parovi)

Ordinalna Test na osnovu predznaka

Intervalna Wilcoxon-ov test ranga sa znakom

Nominalna Hi-kvadrat test nezavisnosti obeležja

Nominalna Hi-kvadrat test homogenosti skupa

>2

Nezavisni Ordinalna Kruskal-Valisov test*

Ordinalna Prošireni test na osnovu medijane*

Zavisni (usklađene k-

torke)

Nominalna Kohranov test

Ordinalna Friedman-ov test

* Testovi nisu predviđeni u školskoj 2016/17

Hi – kvadrat testovi

• Test značajnosti proporcije

• Test prilagođenosti empirijskog rasporeda teorijskom rasporedu

• Test nezavisnosti obeležja

• Test homogenosti skupa

Hi – kvadrat test značajnosti proporcije

H0: “Raspored frekvencija prati očekivan raspored frekvencija” H1: “Raspored frekvencija ne prati očekivan raspored frekvencija”

m

it

i

t

ii

f

ff

1)(

2)(

2

0

)(

Statistika testa:

)(t

i

i

f

f – Originalne frekvencije

– Očekivane frekvencije

Određivanje kritične oblasti:

Hi – kvadrat test nezavisnosti obeležja

H0: “Modaliteti obeležja su međusobno nezavisna” H1: “Modaliteti obeležja su međusobno zavisna”

m

i

k

jt

ij

t

ijij

f

ff

1 1)(

2)(

2

0

)(

Statistika testa:

)(t

ij

ij

f

f – Originalne frekvencije

– Očekivane frekvencije

Očekivane frekvencije:

m

r

k

s

rs

m

r

rj

k

s

ist

ij

f

ff

f

1 1

11)(

Hi – kvadrat test homogenosti skupa

H0: “Populacije su homogene prema posmatranim karakteristikama” H1: “Populacije nisu homogene prema posmatranim karakteristikama”

m

i

k

jt

ij

t

ijij

f

ff

1 1)(

2)(

2

0

)(

Statistika testa:

)(t

ij

ij

f

f – Originalne frekvencije

– Očekivane frekvencije

Očekivane frekvencije:

m

r

k

s

rs

m

r

rj

k

s

ist

ij

f

ff

f

1 1

11)(

Napomene za hi – kvadrat testove

• Zbir očekivanih vrednosti jednak je zbiru originalnih vrednosti.

• Svaka očekivana vrednost treba da iznosi najmanje 5.

• Broj stepeni slobode za – test značajnosti proprocije r = m – 1.

– Test prilagođenosti teorijskom rasporedu r = m – s – 1. (s – broj parametara teorijskog rasporeda)

– Test nezavisnosti obeležja i homogenosti skupa

[tabele kontingencije] r = (m – 1)(k – 1)

Kolmogorov – Smirnov test

H0: “Empirijska funkcija rasporeda prati očekivanu teorijsku funkciju rasporeda” H1: “Empirijska funkcija rasporeda ne prati očekivanu teorijsku funkciju rasporeda”

)()(max 0 xFxFD nx

n

Statistika testa:

0F

Fn– Empirijska funkcija rasporeda

– Teorijska funkcija rasporeda 0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1

11

21

31

41

51

61

71

81

91

10

1

11

1

12

1

13

1

14

1

15

1

16

1

17

1

18

1

19

1

20

1

21

1

nD

Napomene za rangiranje podataka

• Rangiranje podataka podrazumeva dodeljivanje rednih brojeva u neopadajućem nizu podataka.

• Podacima koji imaju iste vrednosti dodeljuje se prosečan rang.

xi: 12 15 16 18 32

ri: 1 2 3 4 5

xi: 15 15 18 18 18

ri: 1,5 1,5 4 4 4

Primer 1:

Primer 2:

Wilcoxon-ov test ranga sa znakom

“Ispitivanje medijane razlike usklađenih parova prema hipotetičkoj vrednosti MH”

1. di = (xi – yi) – MH (eliminišu se podaci xi – yi = MH [smanjuje se n]), 2. Rangiraju se vrednosti |di|, 3. Rangiranim podacima vraća se znak di, 4. Izračunava se suma pozitivnih rangova.

n

i

iRW1

Za n ≥ 30 Donošenje odluke o nultoj hipotezi: na osnovu oblika hipoteze i Tablice Wilcoxon-ovog testa (n<30) Tablice Normalnog rasporeda (n≥30)

24

)12)(1(

4

)1(

nnn

nnW

Z

Test na osnovu predznaka

“Poređenje medijane razlike usklađenih parova sa 0”

S(+) = broj pozitivnih razlika xi – yi

S(–) = broj negativnih razlika xi – yi (eliminišu se podaci xi = yi [smanjuje se n])

n

SS 22

0

)1|)()((|

n

SS 22

0

))()((

za n<30

za n≥30

Donošenje odluke o nultoj hipotezi na osnovu tablice Hi – kvadrat rasporeda (r = 1)

Friedman-ov test

“Grupe podataka dolaze iz istog osnovnog skupa”

k – broj grupa, n – broj podataka po grupi, Tj – suma rangova u grupi j, [Ako se u radnoj tabeli ispituju razlike između kolona, podaci se rangiraju nezavisno unutar svakog reda]

)1(3)1(

12

1

2

knTknk

Qk

j

jF

Donošenje odluke o nultoj hipotezi na osnovu: Tablice Fridmenovog testa Tablice Hi – kvadrat rasporeda (r = k – 1)

Kohranov test

“Tretmani su podjednako efektivni”

n

i

i

n

i

i

k

j

j

k

j

j

K

LLk

GGkk

R

1

2

1

2

11

2)1(

xij = 1, ako je tretman uspešan; inače xij = 0.

k – broj tretmana, n – veličina uzorka, Gj – ukupan broj uspešnih tretmana u grupi j, Li – ukupan broj uspešnih tretmana u elementu uzorka i.

Donošenje odluke o nultoj hipotezi na osnovu tablice Hi – kvadrat rasporeda (r = k –1)