9
16/11/2018 1 ANOVA Novembar 2018 Novembar 2018 Istraživanje tržišta Ekonomski fakultet , Beograd 2 Analiza varijanse (ANOVA) Analiza varijanse sa jednim faktorom Proširena ANOVA tabela Novembar 2018 Istraživanje tržišta Ekonomski fakultet , Beograd 3 Analiza varijanse sa jednim faktorom Decembar 2012 Istraživanje tržišta Ekonomski fakultet , Beograd 4 Tehnike za analizu podataka Univarijacione tehnike Multivarijacione tehnike Posmatra se samo jedna promenljiva Posmatra se više promenljivih istovremeno

ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

  • Upload
    others

  • View
    23

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

1

ANOVA

• Novembar 2018

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

2

Analiza varijanse (ANOVA)

• Analiza varijanse sa jednim faktorom• Proširena ANOVA tabela

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

3

Analiza varijanse sa jednim faktorom

Decembar 2012 Istraživanje tržištaEkonomski fakultet, Beograd

4

Tehnike za analizu podataka

Univarijacione tehnike

Multivarijacione tehnike

Posmatra se samo jedna promenljiva

Posmatra se više promenljivih istovremeno

Page 2: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

2

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

5

Univarijacione tehnike za analizu podataka

Neparametarske statističke tehnike

Parametarske statističke tehnike

Podaci su nemetrički (nominalna i ordinalna skala)

Podaci su metrički (intervalna i skala odnosa)

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

6

Parametarske statističke tehnike

- t-test- z-test

Postoji samo jedan uzorak

Postoje dva ili više uzoraka

Nezavisni uzorci

Zavisni uzorci

- t-test- z-test- ANOVA

- Upareni t-test

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

7

Koncepti eksperimentalne analize na koje se pozivamo

U istraživanjima kad kažemo faktor češće mislimo na faktor u faktorskoj analizi

• Varijabla ishoda – zavisna varijabla• “Faktori” – nezavisne varijable• Tretmani – različiti nivoi nezavisnih varijabli, t.j.

faktora• Svrha većine statističkih eksperimenata je:

1. Da se utvrdi da li različiti tretmani imaju različite efekte na varijablu ishoda, i

2. Ako imaju različite efekte, onda se želi oceniti (izmeriti) ta razlika.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

8

Analiza varijanse sa jednim

faktorom• Naziva se i jednosmerna analiza varijanse;

• Mere se efekti r tretmana jednog faktora na (jednu) varijablu ishoda

• Zatim se proverava da li postoje značajne razlike između srednjih vrednosti različitih tretmana:H0: μ1 = μ2 = μ3 = . . . = μrHa: najmanje 2 od μ1, μ2, μ3, . . . , μr su različiti

• Računa se odnos između varijanse „između-tretmana“i varijanse „unutar-tretmana“

• Ako je varijansa „između“ značajno veća nego varijansa „unutar“, odbacuje se nulta hipoteza

Page 3: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

3

Pretpostavke modelaPre početka analize se uvek formalno proverava ispunjenost pretpostavki modela:1.Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti;2.Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testom homogenosti varijanse;3.U pitanju su nezavisni slučajni uzorci.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

9 Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

10

Ukupna i srednje vrednosti grupa, kao i njihova odstupanja

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

11

Varijansa između tretmana

– Ocena varijanse „između“ tretmana se zasniva na varijaciji između srednjih vrednosti dobijenih za svaki nivo tretmana:

, t.j.:

SSb – suma kvadrata između nivoa tretmana – srednja vrednost za tretman p– ukupna srednja vrednost

np – broj opservacija za tretman pr – ukupan broj tretmana

SSb = np X p − X ( )2

p =1

r

pXX €

MSSb =SSbr −1

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

12

Varijansa unutar tretmana

– Ocena varijanse „unutar“ tretmana se zasniva na varijaciji u okviru svakog nivoa tretmana (“neobjašnjena”):

, t.j.:

SSw – suma kvadrata unutar tretmana – srednja vrednost za tretman p– realizacija i za nivo tretmana p

np – ukupan broj opservacija za tretman pr – ukupan broj tretmanaN – ukupna veličina uzorka

pXipX€

SSw = xip − X p( )2

p =1

r

∑i=1

n p

MSSw =SSwN − r

Page 4: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

4

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

13

Ukupna, objašnjena i neobjašnjena varijansa

• Varijansa između tretmana se naziva i varijansom “objašnjenom” nivoom tretmana

• Varijansa unutar tretmana se naziva i varijansom “neobjašnjenom” nivoom tretmana

• Ukupna (totalna) varijacija ili totalna suma kvadrata je:

wbt SSSSSS +=

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

14

ANOVA tabela

SSb = np X p − X ( )2

p =1

r

MSSb =SSbr −1

MSSbMSSw

SSw = xip − X p( )2

p =1

r

∑i=1

k

MSSw =SSwN − r

SSt = xip − X ( )2

p =1

r

∑i=1

k

Izvor varijacije

Varijacija, suma kvadrata (SS)

St. slo-bode (df)

Ocena varijanse (MSS) F-odnos

Objašnje-na varijacija

r – 1

Neobjaš-njena varijacija

N – r

Ukupno N – 1

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

15

F-statistika

• Ako bi nulta hipoteza bila istinita (nivoi tretmana nemaju značajan efekat) onda bi F-odnos trebalo da bude blizu 1; u suprotnom F-odnos ima veće vrednosti

• Čita se vrednost iz tablica F-rasporeda za (r-1) i (N-r) stepeni slobode

• Na osnovu toga se zaključuje da li postoji razlika uslovljena nivoom tretmana i za koji nivo značajnosti ova razlika postoji

F =MSSbMSSw

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

16

Jačina povezanostir - deskriptivni statistički pokazatelj, mera jačine

povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka :

– Vrednost r na bazi uzorka teži da bude pristrasna naviše, pa je bolje koristiti :

t

b

SSSS

=r

ˆ ω 2 =SSb − (r −1)MSSw

SSt + MSSw

Page 5: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

5

Primer: Koliko sati učiš nedeljno?

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

17

Primer: Koliko sati učiš nedeljno? –Provera pretpostavki modela

Pre početka analize se uvek formalno proverava ispunjenost pretpostavki modela:1.Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti;2.Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testom homogenosti varijanse;

3.U pitanju su nezavisni slučajni uzorci.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

18

Primer: Koliko sati učiš nedeljno? –Test homogenosti varijanse

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

19

p=0,027 < α=0,05 è odbacujemo nultu hipotezu

Nulta hipoteza je da su varijanse reziduala različitihgrupa jednake, t.j. da postoji homoskedastičnost, ilihomogenost varijansi, putem Levinovog testa:

Respecifikacija varijabli putem logaritamske transformacije!

Primer: Koliko sati učiš nedeljno? –Logaritmovani podaci

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

20

Page 6: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

6

Primer: Koliko sati učiš nedeljno? –Ponovljeni test homogenosti varijanse

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

21

➔Ne odbacujemo nultu hipotezu - na logaritmovanim podacima varijanse se statistički ne razlikuju varijanse

➔Možemo nastaviti analizu proverom ispunjenosti uslova normalnosti.

Kolmogorov-Smirnovljev test normalnosti

• Koristi se za testiranje hipoteze o normalnosti raspodele

• Nulta hipoteza je da varijabla prati normalan raspored, a alternativna je da ne prati

• Dakle, nastavićemo sa daljom analizom samo ako test pokaže da se ne odbacuje nulta hipoteza.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

22

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

23

• Sve tri p-vrednosti su veće od 0,05, pa ne odbacujemo nultu hipotezu o normalnosti rasporele!

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

24

Ukupna i srednje vrednosti grupa, kao i njihova odstupanja

Page 7: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

7

Primer: Koliko sati učiš nedeljno? –ANOVA izlazna tabela

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

25

➔Na nivou značajnosti od 5% ne bismo odbacili Ho; ➔Na nivou značajnosti od 10% bismo odbacili Ho i zaključili

bismo da postoje razlike po godinama u odnosu na vreme provedeno u učenju tokom semestra.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

26

Analiza varijanse sa više faktora

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

27

Proširena ANOVA tabela

• U ovom modelu postoji više varijabli tretmana (faktora)– Dodavanjem nove varijable tretmana tipično se povećava

objašnjeni varijabilitet– Druga varijabla tretmana se naziva blok-varijabla, jer se

formira jedan ili više blokova– Takođe je moguće da se uključi više varijabli tretmana

• Interakcija– Efekat interakcije znači da uticaj jednog tretmana neće biti

isti za svaki nivo onog drugog tretmana– Hipoteza o tome da nema interakcije se može testirati

korišćenjem ANOVA tabele

Primer dvofaktorske analize: Koliko sati učiš nedeljno?

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

28

Page 8: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

8

• Putem dvofaktorske analize varijanse u ovom primeru možemo testirati sledeće hipoteze:

H0: ne postoji razlika među polovima u odnosu na broj časova provedenih u učenju,

Ha: postoji razlika među polovima u odnosu na broj časova provedenih u učenju;

H0: korišćenje Fejsbuka ne utiče na broj časova provedenih u učenju,

Ha: korišćenje Fejsbuka utiče na broj časova provedenih u učenju;

H0: nema interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju,

Ha: postoji interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

29

Levinov test jednakosti varijansi reziduala

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

30

p=0,021 < α=0,05 è odbacujemo nultu hipotezuRespecifikacija varijabli putem logaritamske transformacije!

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

31

Respecifikovane varijable (logaritmovanje) Ponovljeni test homogenosti varijanse

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

32

➔Ne odbacujemo nultu hipotezu - na logaritmovanim podacima varijanse se statistilčki ne razlikuju.

Page 9: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

9

• Hipoteze koje testiramo:H0: ne postoji razlika među polovima u odnosu na broj

časova provedenih u učenju,Ha: postoji razlika među polovima u odnosu na broj

časova provedenih u učenju;H0: korišćenje Fejsbuka ne utiče na broj časova

provedenih u učenju,Ha: korišćenje Fejsbuka utiče na broj časova provedenih

u učenju;H0: nema interakcije između pola i korišćenja Fejsbuka u

odnosu na broj časova provedenih u učenju,Ha: postoji interakcije između pola i korišćenja Fejsbuka u

odnosu na broj časova provedenih u učenju.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

33 Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

34

Koje od navedenih hipoteza ćemo odbaciti, a koje nećemo?