Upload
lamtruc
View
251
Download
4
Embed Size (px)
Citation preview
07/12/2017
1
ANOVA
• Novembar 2017
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
2
Analiza varijanse (ANOVA)
• Analiza varijanse sa jednim faktorom• Proširena ANOVA tabela
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
3
Analiza varijanse sa jednim faktorom
Decembar 2012 Istraživanje tržištaEkonomski fakultet, Beograd
4
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
07/12/2017
2
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
5
Univarijacione tehnike za analizu podataka
Neparametarske statističke tehnike
Parametarske statističke tehnike
Podaci su nemetrički (nominalna i ordinalna skala)
Podaci su metrički (intervalna i skala odnosa)
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
6
Parametarske statističke tehnike
- t-test- z-test
Postoji samo jedan uzorak
Postoje dva ili više uzoraka
Nezavisni uzorci
Zavisni uzorci
- t-test- z-test- ANOVA
- Upareni t-test
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
7
Koncepti eksperimentalne analize na koje se pozivamo
U istraživanjima kad kažemo faktor češće mislimo na faktor u faktorskoj analizi
• Varijabla ishoda – zavisna varijabla• “Faktori” – nezavisne varijable• Tretmani – različiti nivoi nezavisnih varijabli, t.j.
faktora• Svrha većine statističkih eksperimenata je:
1. Da se utvrdi da li različiti tretmani imaju različite efekte na varijablu ishoda, i
2. Ako imaju različite efekte, onda se želi oceniti (izmeriti) ta razlika.
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
8
Analiza varijanse sa jednim faktorom
• Naziva se i jednosmerna analiza varijanse;• Mere se efekti r tretmana jednog faktora na (jednu)
varijablu ishoda• Zatim se proverava da li postoje značajne razlike
između srednjih vrednosti različitih tretmana:H0: μ1 = μ2 = μ3 = . . . = μrHa: najmanje 2 od μ1, μ2, μ3, . . . , μr su različiti
• Računa se odnos između varijanse „između-tretmana“i varijanse „unutar-tretmana“
• Ako je varijansa „između“ značajno veća nego varijansa „unutar“, odbacuje se nulta hipoteza
07/12/2017
3
Pretpostavke modelaPre početka analize se uvek formalno proverava ispunjenost pretpostavki modela:1.Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti;2.Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testom homogenosti varijanse;3.U pitanju su nezavisni slučajni uzorci.
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
9 Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
10
Ukupna i srednje vrednosti grupa, kao i njihova odstupanja
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
11
Varijansa između tretmana
– Ocena varijanse „između“ tretmana se zasniva na varijaciji između srednjih vrednosti dobijenih za svaki nivo tretmana:
, t.j.:
SSb – suma kvadrata između nivoa tretmana – srednja vrednost za tretman p– ukupna srednja vrednost
np – broj opservacija za tretman pr – ukupan broj tretmana
€
SSb = np X p − X ( )2
p =1
r
∑
pXX €
MSSb =SSbr −1
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
12
Varijansa unutar tretmana
– Ocena varijanse „unutar“ tretmana se zasniva na varijaciji u okviru svakog nivoa tretmana (“neobjašnjena”):
, t.j.:
SSw – suma kvadrata unutar tretmana – srednja vrednost za tretman p– realizacija i za nivo tretmana p
np – ukupan broj opservacija za tretman pr – ukupan broj tretmanaN – ukupna veličina uzorka
pXipX€
SSw = xip − X p( )2
p =1
r
∑i=1
n p
∑
€
MSSw =SSwN − r
07/12/2017
4
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
13
Ukupna, objašnjena i neobjašnjena varijansa
• Varijansa između tretmana se naziva i varijansom “objašnjenom” nivoom tretmana
• Varijansa unutar tretmana se naziva i varijansom “neobjašnjenom” nivoom tretmana
• Ukupna (totalna) varijacija ili totalna suma kvadrata je:
wbt SSSSSS +=
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
14
ANOVA tabela
€
SSb = np X p − X ( )2
p =1
r
∑
€
MSSb =SSbr −1
€
MSSbMSSw
€
SSw = xip − X p( )2
p =1
r
∑i=1
k
∑
€
MSSw =SSwN − r
€
SSt = xip − X ( )2
p =1
r
∑i=1
k
∑
Izvor varijacije
Varijacija, suma kvadrata (SS)
St. slo-bode (df)
Ocena varijanse (MSS) F-odnos
Objašnje-na varijacija
r – 1
Neobjaš-njena varijacija
N – r
Ukupno N – 1
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
15
F-statistika
• Ako bi nulta hipoteza bila istinita (nivoi tretmana nemaju značajan efekat) onda bi F-odnos trebalo da bude blizu 1; u suprotnom F-odnos ima veće vrednosti
• Čita se vrednost iz tablica F-rasporeda za (r-1) i (N-r) stepeni slobode
• Na osnovu toga se zaključuje da li postoji razlika uslovljena nivoom tretmana i za koji nivo značajnosti ova razlika postoji
€
F =MSSbMSSw
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
16
Jačina povezanostir - deskriptivni statistički pokazatelj, mera jačine
povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka :
– Vrednost r na bazi uzorka teži da bude pristrasna naviše, pa je bolje koristiti :
t
b
SSSS
=r
€
ˆ ω 2 =SSb − (r −1)MSSw
SSt + MSSw
07/12/2017
5
Primer: Koliko sati učiš nedeljno?
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
17
Primer: Koliko sati učiš nedeljno? –Provera pretpostavki modela
Pre početka analize se uvek formalno proverava ispunjenost pretpostavki modela:1.Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti;2.Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testom homogenosti varijanse;3.U pitanju su nezavisni slučajni uzorci.
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
18
Primer: Koliko sati učiš nedeljno? –Test homogenosti varijanse
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
19
p=0,027 < α=0,05 è odbacujemo nultu hipotezu
Nulta hipoteza je da su varijanse reziduala različitih grupa jednake, t.j. da postoji homoskedastičnost, ili homogenost varijansi, putem Levinovog testa:
Respecifikacija varijabli putem logaritamske transformacije!
Primer: Koliko sati učiš nedeljno? –Logaritmovani podaci
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
20
07/12/2017
6
Primer: Koliko sati učiš nedeljno? –Ponovljeni test homogenosti varijanse
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
21
➔ Ne odbacujemo nultu hipotezu - na logaritmovanim podacima varijanse se statistički ne razlikuju varijanse
➔ Možemo nastaviti analizu proverom ispunjenosti uslova normalnosti.
Kolmogorov-Smirnovljev test normalnosti
• Koristi se za testiranje hipoteze o normalnosti raspodele
• Nulta hipoteza je da varijabla prati normalan raspored, a alternativna je da ne prati
• Dakle, nastavićemo sa daljom analizom samo ako test pokaže da se ne odbacuje nulta hipoteza.
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
22
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
23
• Sve tri p-vrednosti su veće od 0,05, pa ne odbacujemo nultu hipotezu o normalnosti rasporele!
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
24
Ukupna i srednje vrednosti grupa, kao i njihova odstupanja
07/12/2017
7
Primer: Koliko sati učiš nedeljno? –ANOVA izlazna tabela
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
25
➔Na nivou značajnosti od 5% ne bismo odbacili Ho; ➔Na nivou značajnosti od 10% bismo odbacili Ho i zaključili
bismo da postoje razlike po godinama u odnosu na vreme provedeno u učenju tokom semestra.
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
26
Analiza varijanse sa više faktora
Decembar 2012 Istraživanje tržištaEkonomski fakultet, Beograd
27
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
Decembar 2012 Istraživanje tržištaEkonomski fakultet, Beograd
28
Multivarijacione tehnike
Tehnike zavisnosti
Fokus na varijablama
Fokus na objektima
- Faktorska analiza
- Analiza skupina
- Višedimen-zionalno skaliranje
Jedna zavisna varijabla
Više zavisnih varijabli
- ANOVA i ANCOVA- Višestruka regresija- Diskriminaciona anal.- Analiza združenih
efekata
- MANOVA i MANCOVA
- Kanonička korelacija
Tehnike međuzavisnosti
07/12/2017
8
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
29
Proširena ANOVA tabela• U ovom modelu postoji više varijabli tretmana (faktora)
– Dodavanjem nove varijable tretmana tipično se povećava objašnjeni varijabilitet
– Druga varijabla tretmana se naziva blok-varijabla, jer se formira jedan ili više blokova
– Takođe je moguće da se uključi više varijabli tretmana• Interakcija
– Efekat interakcije znači da uticaj jednog tretmana neće biti isti za svaki nivo onog drugog tretmana
– Hipoteza o tome da nema interakcije se može testirati korišćenjem ANOVA tabele
Primer dvofaktorske analize: Koliko sati učiš nedeljno?
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
30
• Putem dvofaktorske analize varijanse u ovom primeru možemo testirati sledeće hipoteze:
H0: ne postoji razlika među polovima u odnosu na broj časova provedenih u učenju,
Ha: postoji razlika među polovima u odnosu na broj časova provedenih u učenju;
H0: korišćenje Fejsbuka ne utiče na broj časova provedenih u učenju,
Ha: korišćenje Fejsbuka utiče na broj časova provedenih u učenju;
H0: nema interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju,
Ha: postoji interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju.Novembar 2017 Istraživanje tržišta
Ekonomski fakultet, Beograd31
Levinov test jednakosti varijansi reziduala
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
32
p=0,021 < α=0,05 è odbacujemo nultu hipotezuRespecifikacija varijabli putem logaritamske transformacije!
07/12/2017
9
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
33
Respecifikovane varijable (logaritmovanje) Ponovljeni test homogenosti varijanse
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
34
➔Ne odbacujemo nultu hipotezu - na logaritmovanim podacima varijanse se statistilčki ne razlikuju.
• Hipoteze koje testiramo:H0: ne postoji razlika među polovima u odnosu na broj
časova provedenih u učenju,Ha: postoji razlika među polovima u odnosu na broj
časova provedenih u učenju;H0: korišćenje Fejsbuka ne utiče na broj časova
provedenih u učenju,Ha: korišćenje Fejsbuka utiče na broj časova provedenih
u učenju;H0: nema interakcije između pola i korišćenja Fejsbuka u
odnosu na broj časova provedenih u učenju,Ha: postoji interakcije između pola i korišćenja Fejsbuka u
odnosu na broj časova provedenih u učenju.
Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
35 Novembar 2017 Istraživanje tržištaEkonomski fakultet, Beograd
36
Koje od navedenih hipoteza ćemo odbaciti, a koje nećemo?