9
05/12/2019 1 1 Analiza podataka: Testiranje hipoteza – Osnovni koncepti i testovi povezanosti (3) ANOVA Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019 1 1. Analiza varijanse sa jednim faktorom 2. Proširena ANOVA tabela 2 2 3 Tehnike za analizu podataka Univarijacione tehnike Multivarijacione tehnike Posmatra se samo jedna promenljiva Posmatra se više promenljivih istovremeno Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019 3 4 Univarijacione tehnike za analizu podataka Neparametarske statističke tehnike Parametarske statističke tehnike Podaci su nemetrički (nominalna i ordinalna skala) Podaci su metrički (intervalna i skala odnosa) Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019 4

Istrazivanje trzista 12, Nov 2019 · 11/12/2019  · w–suma kvadrata unutar tretmana –srednja vrednost za tretman p ... •Čita se vrednost iz tablica F-rasporeda za (r-1) i

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

05/12/2019

1

1

Analiza podataka:Testiranje hipoteza –Osnovni koncepti itestovi povezanosti (3)ANOVA

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

1

1. Analiza varijanse sa jednim faktorom

2. Proširena ANOVA tabela

2

2

3

Tehnike za analizu podataka

Univarijacione tehnike

Multivarijacione tehnike

Posmatra se samo jedna promenljiva

Posmatra se više promenljivih istovremeno

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

3

4

Univarijacione tehnike za analizu podataka

Neparametarske statističke tehnike

Parametarske statističke tehnike

Podaci su nemetrički (nominalna i ordinalna skala)

Podaci su metrički (intervalna i skala odnosa)

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

4

05/12/2019

2

5

Parametarske statističke tehnike

- t-test- z-test

Postoji samo jedan uzorak

Postoje dva ili više uzoraka

Nezavisni uzorci

Zavisni uzorci

- t-test- z-test- ANOVA

- Upareni t-test

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

5

6

6

• Varijabla ishoda – zavisna varijabla• “Faktori” – nezavisne varijable• Tretmani – različiti nivoi nezavisnih varijabli, t.j. faktora• Svrha većine statističkih eksperimenata je:

1. Da se utvrdi da li različiti tretmani imaju različite efekte na varijablu ishoda, i

2. Ako imaju različite efekte, onda se želi oceniti (izmeriti) ta razlika.

7

U istraživanjima kadkažemo faktor češćemislimo na faktor u faktorskoj analizi

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

7

• Naziva se i jednosmerna analiza varijanse;• Mere se efekti r tretmana jednog faktora na (jednu) varijablu

ishoda• Zatim se proverava da li postoje značajne razlike između

srednjih vrednosti različitih tretmana:H0: μ1 = μ2 = μ3 = . . . = μrHa: najmanje 2 od μ1, μ2, μ3, . . . , μr su različiti

• Računa se odnos između varijanse „između-tretmana“ i varijanse „unutar-tretmana“

• Ako je varijansa „između“ značajno veća nego varijansa „unutar“, odbacuje se nulta hipoteza

8Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

8

05/12/2019

3

• Pre početka analize se uvek formalno proverava ispunjenostpretpostavki modela:§ Reziduali po grupama imaju normalnu raspodelu - proveravamo

Kolmogorov-Smirnovljevim testom normalnosti;§ Varijanse reziduala različitih grupa su jednake

(homoskedastičnost) - proveravamo Levinovim testomhomogenosti varijanse;

§ U pitanju su nezavisni slučajni uzorci.

9Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

9

10Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

10

Ocena varijanse „između“ tretmana se zasniva na varijaciji između srednjih vrednosti dobijenih za svaki nivo tretmana:

, t.j.:

SSb – suma kvadrata između nivoa tretmana – srednja vrednost za tretman p

– ukupna srednja vrednost np – broj opservacija za tretman pr – ukupan broj tretmana

11

SSb = np X p − X ( )2

p =1

r

pX

X €

MSSb =SSbr −1

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

11

Ocena varijanse „unutar“ tretmana se zasniva na varijaciji u okviru svakog nivoa tretmana (“neobjašnjena”):

, t.j.:

SSw – suma kvadrata unutar tretmana – srednja vrednost za tretman p

– realizacija i za nivo tretmana pnp – ukupan broj opservacija za tretman pr – ukupan broj tretmana

N – ukupna veličina uzorka12

pX

ipX€

SSw = xip − X p( )2

p =1

r

∑i=1

n p

MSSw =SSwN − r

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

12

05/12/2019

4

• Varijansa između tretmana se naziva i varijansom “objašnjenom” nivoom tretmana

• Varijansa unutar tretmana se naziva i varijansom “neobjašnjenom” nivoom tretmana

• Ukupna (totalna) varijacija ili totalna suma kvadrata je:

13

wbt SSSSSS +=

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

13

14

Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti;Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamoLevinovim testom homogenosti varijanse;U pitanju su nezavisni slučajni uzorci.

Izvor varijacije

Varijacija, suma kvadrata (SS)

St. slo-bode (df)

Ocena varijanse (MSS) F-odnos

Objašnjena varijacija r – 1

Neobjaš-njena varijacija

N – r

Ukupno N – 1

MSSb =SSbr −1

MSSbMSSw

SSt = xip − X ( )2

p =1

r

∑i=1

k

∑€

SSw = xip − X p( )2

p =1

r

∑i=1

k

MSSw =SSwN − r

SSb = np X p − X ( )2

p =1

r

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

14

• Ako bi nulta hipoteza bila istinita (nivoi tretmana nemaju značajan efekat) onda bi F-odnos trebalo da bude blizu 1; u suprotnom F-odnos ima veće vrednosti

• Čita se vrednost iz tablica F-rasporeda za (r-1) i (N-r) stepeni slobode

• Na osnovu toga se zaključuje da li postoji razlika uslovljena nivoom tretmana i za koji nivo značajnosti ova razlika postoji

15

F =MSSbMSSw

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

15

r - deskriptivni statistički pokazatelj, mera jačinepovezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka :

§ Vrednost r na bazi uzorka teži da bude pristrasna naviše, pa je bolje koristiti :

16

t

b

SSSS

=r

ˆ ω 2 =SSb − (r −1)MSSw

SSt + MSSwIstraživanje tržišta, Ekonomski fakultet BU Novembar 2019

r - deskriptivni statistički pokazatelj, mera jačinepovezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka :

§ Vrednost r na bazi uzorka teži da bude pristrasna naviše, pa je bolje koristiti :

16

t

b

SSSS

=r

ˆ ω 2 =SSb − (r −1)MSSw

SSt + MSSwIstraživanje tržišta, Ekonomski fakultet BU Novembar 2019

16

05/12/2019

5

17Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

17

Pre početka analize se uvek formalno proverava ispunjenostpretpostavki modela:1. Reziduali po grupama imaju normalnu raspodelu -

proveravamo Kolmogorov-Smirnovljevim testomnormalnosti;

2. Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testomhomogenosti varijanse;

3. U pitanju su nezavisni slučajni uzorci.

18Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

18

19

Nulta hipoteza je da su varijanse reziduala različitih grupa jednake, t.j. da postoji homoskedastičnost, ili homogenost varijansi, putem Levinovog testa:

Respecifikacija varijabli putem logaritamske transformacije!p=0,027 < α=0,05 è odbacujemo nultu hipotezu

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

19

20Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

20

05/12/2019

6

21

➔ Ne odbacujemo nultu hipotezu - na logaritmovanimpodacima varijanse se statistički ne razlikujuvarijanse

➔ Možemo nastaviti analizu proverom ispunjenostiuslova normalnosti.

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

21

• Koristi se za testiranje hipoteze o normalnosti raspodele• Nulta hipoteza je da varijabla prati normalan raspored, a

alternativna je da ne prati• Dakle, nastavićemo sa daljom analizom samo ako test

pokaže da se ne odbacuje nulta hipoteza.

22Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

22

23

• Sve tri p-vrednosti su veće od 0,05, pa ne odbacujemo nultu hipotezu o normalnosti rasporele!

23

24Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

24

05/12/2019

7

25

➔ Na nivou značajnosti od 5% ne bismo odbacili Ho; ➔ Na nivou značajnosti od 10% bismo odbacili Ho i zaključili

bismo da postoje razlike po godinama u odnosu na vremeprovedeno u učenju tokom semestra.

25

26

26

• U ovom modelu postoji više varijabli tretmana (faktora)§ Dodavanjem nove varijable tretmana tipično se povećava

objašnjeni varijabilitet§ Druga varijabla tretmana se naziva blok-varijabla, jer se formira

jedan ili više blokova§ Takođe je moguće da se uključi više varijabli tretmana

• Interakcija§ Efekat interakcije znači da uticaj jednog tretmana neće biti isti

za svaki nivo onog drugog tretmana§ Hipoteza o tome da nema interakcije se može testirati

korišćenjem ANOVA tabele

27Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

27

28

28

05/12/2019

8

Putem dvofaktorske analize varijanse u ovom primeru možemo testirati sledeće hipoteze:H0: ne postoji razlika među polovima u odnosu na broj

časova provedenih u učenju,Ha: postoji razlika među polovima u odnosu na broj časova

provedenih u učenju;H0: korišćenje Fejsbuka ne utiče na broj časova

provedenih u učenju,Ha: korišćenje Fejsbuka utiče na broj časova provedenih u

učenju;H0: nema interakcije između pola i korišćenja Fejsbuka u

odnosu na broj časova provedenih u učenju,Ha: postoji interakcije između pola i korišćenja Fejsbuka u

odnosu na broj časova provedenih u učenju.

29Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

29

30

p=0,021 < α=0,05 è odbacujemo nultu hipotezuRespecifikacija varijabli putem logaritamske transformacije!

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

30

31

Respecifikovane varijable (logaritmovanje)

31

32

➔ Ne odbacujemo nultu hipotezu - na logaritmovanimpodacima varijanse se statistilčki ne razlikuju.

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

32

05/12/2019

9

Hipoteze koje testiramo:H0: ne postoji razlika među polovima u odnosu na broj

časova provedenih u učenju,Ha: postoji razlika među polovima u odnosu na broj časova

provedenih u učenju;H0: korišćenje Fejsbuka ne utiče na broj časova

provedenih u učenju,Ha: korišćenje Fejsbuka utiče na broj časova provedenih u

učenju;H0: nema interakcije između pola i korišćenja Fejsbuka u

odnosu na broj časova provedenih u učenju,Ha: postoji interakcije između pola i korišćenja Fejsbuka u

odnosu na broj časova provedenih u učenju.

33Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

33

34

Koje od navedenih hipoteza ćemo odbaciti, a koje ne?

Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019

34

This is where you give credit to the ones who are part of this project.Did you like the resources on this template? Get them for free at our other websites.Presentation template by Slidesgo

Icons by Flaticon

Images & infographics by Freepik

Author introduction slide photo created by katemangostar - Freepik.com

Big image slide photo created by jcomp - Freepik.com

Text & Image slide photo created by rawpixel.com - Freepik.com

Text & Image slide photo created by Freepik

35

35

Da li imate [email protected]

36