9
07/12/2017 1 ANOVA Novembar 2017 Novembar 2017 Istraživanje tržišta Ekonomski fakultet , Beograd 2 Analiza varijanse (ANOVA) Analiza varijanse sa jednim faktorom Proširena ANOVA tabela Novembar 2017 Istraživanje tržišta Ekonomski fakultet , Beograd 3 Analiza varijanse sa jednim faktorom Decembar 2012 Istraživanje tržišta Ekonomski fakultet , Beograd 4 Tehnike za analizu podataka Univarijacione tehnike Multivarijacione tehnike Posmatra se samo jedna promenljiva Posmatra se više promenljivih istovremeno

ANOVA Analiza varijanse (ANOVA) - ekof.bg.ac.rs · b–suma kvadrata između nivoa tretmana ... •Čita se vrednost iz tablica F-rasporeda za (r-1) i ... Na nivou značajnosti od

  • Upload
    lamtruc

  • View
    251

  • Download
    4

Embed Size (px)

Citation preview

Page 1: ANOVA Analiza varijanse (ANOVA) - ekof.bg.ac.rs · b–suma kvadrata između nivoa tretmana ... •Čita se vrednost iz tablica F-rasporeda za (r-1) i ... Na nivou značajnosti od

07/12/2017

1

ANOVA

• Novembar 2017

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

2

Analiza varijanse (ANOVA)

• Analiza varijanse sa jednim faktorom• Proširena ANOVA tabela

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

3

Analiza varijanse sa jednim faktorom

Decembar 2012 Istraživanje tržištaEkonomski fakultet, Beograd

4

Tehnike za analizu podataka

Univarijacione tehnike

Multivarijacione tehnike

Posmatra se samo jedna promenljiva

Posmatra se više promenljivih istovremeno

Page 2: ANOVA Analiza varijanse (ANOVA) - ekof.bg.ac.rs · b–suma kvadrata između nivoa tretmana ... •Čita se vrednost iz tablica F-rasporeda za (r-1) i ... Na nivou značajnosti od

07/12/2017

2

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

5

Univarijacione tehnike za analizu podataka

Neparametarske statističke tehnike

Parametarske statističke tehnike

Podaci su nemetrički (nominalna i ordinalna skala)

Podaci su metrički (intervalna i skala odnosa)

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

6

Parametarske statističke tehnike

- t-test- z-test

Postoji samo jedan uzorak

Postoje dva ili više uzoraka

Nezavisni uzorci

Zavisni uzorci

- t-test- z-test- ANOVA

- Upareni t-test

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

7

Koncepti eksperimentalne analize na koje se pozivamo

U istraživanjima kad kažemo faktor češće mislimo na faktor u faktorskoj analizi

• Varijabla ishoda – zavisna varijabla• “Faktori” – nezavisne varijable• Tretmani – različiti nivoi nezavisnih varijabli, t.j.

faktora• Svrha većine statističkih eksperimenata je:

1. Da se utvrdi da li različiti tretmani imaju različite efekte na varijablu ishoda, i

2. Ako imaju različite efekte, onda se želi oceniti (izmeriti) ta razlika.

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

8

Analiza varijanse sa jednim faktorom

• Naziva se i jednosmerna analiza varijanse;• Mere se efekti r tretmana jednog faktora na (jednu)

varijablu ishoda• Zatim se proverava da li postoje značajne razlike

između srednjih vrednosti različitih tretmana:H0: μ1 = μ2 = μ3 = . . . = μrHa: najmanje 2 od μ1, μ2, μ3, . . . , μr su različiti

• Računa se odnos između varijanse „između-tretmana“i varijanse „unutar-tretmana“

• Ako je varijansa „između“ značajno veća nego varijansa „unutar“, odbacuje se nulta hipoteza

Page 3: ANOVA Analiza varijanse (ANOVA) - ekof.bg.ac.rs · b–suma kvadrata između nivoa tretmana ... •Čita se vrednost iz tablica F-rasporeda za (r-1) i ... Na nivou značajnosti od

07/12/2017

3

Pretpostavke modelaPre početka analize se uvek formalno proverava ispunjenost pretpostavki modela:1.Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti;2.Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testom homogenosti varijanse;3.U pitanju su nezavisni slučajni uzorci.

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

9 Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

10

Ukupna i srednje vrednosti grupa, kao i njihova odstupanja

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

11

Varijansa između tretmana

– Ocena varijanse „između“ tretmana se zasniva na varijaciji između srednjih vrednosti dobijenih za svaki nivo tretmana:

, t.j.:

SSb – suma kvadrata između nivoa tretmana – srednja vrednost za tretman p– ukupna srednja vrednost

np – broj opservacija za tretman pr – ukupan broj tretmana

SSb = np X p − X ( )2

p =1

r

pXX €

MSSb =SSbr −1

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

12

Varijansa unutar tretmana

– Ocena varijanse „unutar“ tretmana se zasniva na varijaciji u okviru svakog nivoa tretmana (“neobjašnjena”):

, t.j.:

SSw – suma kvadrata unutar tretmana – srednja vrednost za tretman p– realizacija i za nivo tretmana p

np – ukupan broj opservacija za tretman pr – ukupan broj tretmanaN – ukupna veličina uzorka

pXipX€

SSw = xip − X p( )2

p =1

r

∑i=1

n p

MSSw =SSwN − r

Page 4: ANOVA Analiza varijanse (ANOVA) - ekof.bg.ac.rs · b–suma kvadrata između nivoa tretmana ... •Čita se vrednost iz tablica F-rasporeda za (r-1) i ... Na nivou značajnosti od

07/12/2017

4

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

13

Ukupna, objašnjena i neobjašnjena varijansa

• Varijansa između tretmana se naziva i varijansom “objašnjenom” nivoom tretmana

• Varijansa unutar tretmana se naziva i varijansom “neobjašnjenom” nivoom tretmana

• Ukupna (totalna) varijacija ili totalna suma kvadrata je:

wbt SSSSSS +=

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

14

ANOVA tabela

SSb = np X p − X ( )2

p =1

r

MSSb =SSbr −1

MSSbMSSw

SSw = xip − X p( )2

p =1

r

∑i=1

k

MSSw =SSwN − r

SSt = xip − X ( )2

p =1

r

∑i=1

k

Izvor varijacije

Varijacija, suma kvadrata (SS)

St. slo-bode (df)

Ocena varijanse (MSS) F-odnos

Objašnje-na varijacija

r – 1

Neobjaš-njena varijacija

N – r

Ukupno N – 1

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

15

F-statistika

• Ako bi nulta hipoteza bila istinita (nivoi tretmana nemaju značajan efekat) onda bi F-odnos trebalo da bude blizu 1; u suprotnom F-odnos ima veće vrednosti

• Čita se vrednost iz tablica F-rasporeda za (r-1) i (N-r) stepeni slobode

• Na osnovu toga se zaključuje da li postoji razlika uslovljena nivoom tretmana i za koji nivo značajnosti ova razlika postoji

F =MSSbMSSw

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

16

Jačina povezanostir - deskriptivni statistički pokazatelj, mera jačine

povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka :

– Vrednost r na bazi uzorka teži da bude pristrasna naviše, pa je bolje koristiti :

t

b

SSSS

=r

ˆ ω 2 =SSb − (r −1)MSSw

SSt + MSSw

Page 5: ANOVA Analiza varijanse (ANOVA) - ekof.bg.ac.rs · b–suma kvadrata između nivoa tretmana ... •Čita se vrednost iz tablica F-rasporeda za (r-1) i ... Na nivou značajnosti od

07/12/2017

5

Primer: Koliko sati učiš nedeljno?

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

17

Primer: Koliko sati učiš nedeljno? –Provera pretpostavki modela

Pre početka analize se uvek formalno proverava ispunjenost pretpostavki modela:1.Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti;2.Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testom homogenosti varijanse;3.U pitanju su nezavisni slučajni uzorci.

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

18

Primer: Koliko sati učiš nedeljno? –Test homogenosti varijanse

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

19

p=0,027 < α=0,05 è odbacujemo nultu hipotezu

Nulta hipoteza je da su varijanse reziduala različitih grupa jednake, t.j. da postoji homoskedastičnost, ili homogenost varijansi, putem Levinovog testa:

Respecifikacija varijabli putem logaritamske transformacije!

Primer: Koliko sati učiš nedeljno? –Logaritmovani podaci

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

20

Page 6: ANOVA Analiza varijanse (ANOVA) - ekof.bg.ac.rs · b–suma kvadrata između nivoa tretmana ... •Čita se vrednost iz tablica F-rasporeda za (r-1) i ... Na nivou značajnosti od

07/12/2017

6

Primer: Koliko sati učiš nedeljno? –Ponovljeni test homogenosti varijanse

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

21

➔ Ne odbacujemo nultu hipotezu - na logaritmovanim podacima varijanse se statistički ne razlikuju varijanse

➔ Možemo nastaviti analizu proverom ispunjenosti uslova normalnosti.

Kolmogorov-Smirnovljev test normalnosti

• Koristi se za testiranje hipoteze o normalnosti raspodele

• Nulta hipoteza je da varijabla prati normalan raspored, a alternativna je da ne prati

• Dakle, nastavićemo sa daljom analizom samo ako test pokaže da se ne odbacuje nulta hipoteza.

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

22

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

23

• Sve tri p-vrednosti su veće od 0,05, pa ne odbacujemo nultu hipotezu o normalnosti rasporele!

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

24

Ukupna i srednje vrednosti grupa, kao i njihova odstupanja

Page 7: ANOVA Analiza varijanse (ANOVA) - ekof.bg.ac.rs · b–suma kvadrata između nivoa tretmana ... •Čita se vrednost iz tablica F-rasporeda za (r-1) i ... Na nivou značajnosti od

07/12/2017

7

Primer: Koliko sati učiš nedeljno? –ANOVA izlazna tabela

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

25

➔Na nivou značajnosti od 5% ne bismo odbacili Ho; ➔Na nivou značajnosti od 10% bismo odbacili Ho i zaključili

bismo da postoje razlike po godinama u odnosu na vreme provedeno u učenju tokom semestra.

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

26

Analiza varijanse sa više faktora

Decembar 2012 Istraživanje tržištaEkonomski fakultet, Beograd

27

Tehnike za analizu podataka

Univarijacione tehnike

Multivarijacione tehnike

Posmatra se samo jedna promenljiva

Posmatra se više promenljivih istovremeno

Decembar 2012 Istraživanje tržištaEkonomski fakultet, Beograd

28

Multivarijacione tehnike

Tehnike zavisnosti

Fokus na varijablama

Fokus na objektima

- Faktorska analiza

- Analiza skupina

- Višedimen-zionalno skaliranje

Jedna zavisna varijabla

Više zavisnih varijabli

- ANOVA i ANCOVA- Višestruka regresija- Diskriminaciona anal.- Analiza združenih

efekata

- MANOVA i MANCOVA

- Kanonička korelacija

Tehnike međuzavisnosti

Page 8: ANOVA Analiza varijanse (ANOVA) - ekof.bg.ac.rs · b–suma kvadrata između nivoa tretmana ... •Čita se vrednost iz tablica F-rasporeda za (r-1) i ... Na nivou značajnosti od

07/12/2017

8

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

29

Proširena ANOVA tabela• U ovom modelu postoji više varijabli tretmana (faktora)

– Dodavanjem nove varijable tretmana tipično se povećava objašnjeni varijabilitet

– Druga varijabla tretmana se naziva blok-varijabla, jer se formira jedan ili više blokova

– Takođe je moguće da se uključi više varijabli tretmana• Interakcija

– Efekat interakcije znači da uticaj jednog tretmana neće biti isti za svaki nivo onog drugog tretmana

– Hipoteza o tome da nema interakcije se može testirati korišćenjem ANOVA tabele

Primer dvofaktorske analize: Koliko sati učiš nedeljno?

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

30

• Putem dvofaktorske analize varijanse u ovom primeru možemo testirati sledeće hipoteze:

H0: ne postoji razlika među polovima u odnosu na broj časova provedenih u učenju,

Ha: postoji razlika među polovima u odnosu na broj časova provedenih u učenju;

H0: korišćenje Fejsbuka ne utiče na broj časova provedenih u učenju,

Ha: korišćenje Fejsbuka utiče na broj časova provedenih u učenju;

H0: nema interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju,

Ha: postoji interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju.Novembar 2017 Istraživanje tržišta

Ekonomski fakultet, Beograd31

Levinov test jednakosti varijansi reziduala

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

32

p=0,021 < α=0,05 è odbacujemo nultu hipotezuRespecifikacija varijabli putem logaritamske transformacije!

Page 9: ANOVA Analiza varijanse (ANOVA) - ekof.bg.ac.rs · b–suma kvadrata između nivoa tretmana ... •Čita se vrednost iz tablica F-rasporeda za (r-1) i ... Na nivou značajnosti od

07/12/2017

9

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

33

Respecifikovane varijable (logaritmovanje) Ponovljeni test homogenosti varijanse

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

34

➔Ne odbacujemo nultu hipotezu - na logaritmovanim podacima varijanse se statistilčki ne razlikuju.

• Hipoteze koje testiramo:H0: ne postoji razlika među polovima u odnosu na broj

časova provedenih u učenju,Ha: postoji razlika među polovima u odnosu na broj

časova provedenih u učenju;H0: korišćenje Fejsbuka ne utiče na broj časova

provedenih u učenju,Ha: korišćenje Fejsbuka utiče na broj časova provedenih

u učenju;H0: nema interakcije između pola i korišćenja Fejsbuka u

odnosu na broj časova provedenih u učenju,Ha: postoji interakcije između pola i korišćenja Fejsbuka u

odnosu na broj časova provedenih u učenju.

Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

35 Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd

36

Koje od navedenih hipoteza ćemo odbaciti, a koje nećemo?