Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
05/12/2019
1
1
Analiza podataka:Testiranje hipoteza –Osnovni koncepti itestovi povezanosti (3)ANOVA
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
1
1. Analiza varijanse sa jednim faktorom
2. Proširena ANOVA tabela
2
2
3
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
3
4
Univarijacione tehnike za analizu podataka
Neparametarske statističke tehnike
Parametarske statističke tehnike
Podaci su nemetrički (nominalna i ordinalna skala)
Podaci su metrički (intervalna i skala odnosa)
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
4
05/12/2019
2
5
Parametarske statističke tehnike
- t-test- z-test
Postoji samo jedan uzorak
Postoje dva ili više uzoraka
Nezavisni uzorci
Zavisni uzorci
- t-test- z-test- ANOVA
- Upareni t-test
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
5
6
6
• Varijabla ishoda – zavisna varijabla• “Faktori” – nezavisne varijable• Tretmani – različiti nivoi nezavisnih varijabli, t.j. faktora• Svrha većine statističkih eksperimenata je:
1. Da se utvrdi da li različiti tretmani imaju različite efekte na varijablu ishoda, i
2. Ako imaju različite efekte, onda se želi oceniti (izmeriti) ta razlika.
7
U istraživanjima kadkažemo faktor češćemislimo na faktor u faktorskoj analizi
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
7
• Naziva se i jednosmerna analiza varijanse;• Mere se efekti r tretmana jednog faktora na (jednu) varijablu
ishoda• Zatim se proverava da li postoje značajne razlike između
srednjih vrednosti različitih tretmana:H0: μ1 = μ2 = μ3 = . . . = μrHa: najmanje 2 od μ1, μ2, μ3, . . . , μr su različiti
• Računa se odnos između varijanse „između-tretmana“ i varijanse „unutar-tretmana“
• Ako je varijansa „između“ značajno veća nego varijansa „unutar“, odbacuje se nulta hipoteza
8Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
8
05/12/2019
3
• Pre početka analize se uvek formalno proverava ispunjenostpretpostavki modela:§ Reziduali po grupama imaju normalnu raspodelu - proveravamo
Kolmogorov-Smirnovljevim testom normalnosti;§ Varijanse reziduala različitih grupa su jednake
(homoskedastičnost) - proveravamo Levinovim testomhomogenosti varijanse;
§ U pitanju su nezavisni slučajni uzorci.
9Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
9
10Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
10
Ocena varijanse „između“ tretmana se zasniva na varijaciji između srednjih vrednosti dobijenih za svaki nivo tretmana:
, t.j.:
SSb – suma kvadrata između nivoa tretmana – srednja vrednost za tretman p
– ukupna srednja vrednost np – broj opservacija za tretman pr – ukupan broj tretmana
11
€
SSb = np X p − X ( )2
p =1
r
∑
pX
X €
MSSb =SSbr −1
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
11
Ocena varijanse „unutar“ tretmana se zasniva na varijaciji u okviru svakog nivoa tretmana (“neobjašnjena”):
, t.j.:
SSw – suma kvadrata unutar tretmana – srednja vrednost za tretman p
– realizacija i za nivo tretmana pnp – ukupan broj opservacija za tretman pr – ukupan broj tretmana
N – ukupna veličina uzorka12
pX
ipX€
SSw = xip − X p( )2
p =1
r
∑i=1
n p
∑
€
MSSw =SSwN − r
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
12
05/12/2019
4
• Varijansa između tretmana se naziva i varijansom “objašnjenom” nivoom tretmana
• Varijansa unutar tretmana se naziva i varijansom “neobjašnjenom” nivoom tretmana
• Ukupna (totalna) varijacija ili totalna suma kvadrata je:
13
wbt SSSSSS +=
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
13
14
Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti;Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamoLevinovim testom homogenosti varijanse;U pitanju su nezavisni slučajni uzorci.
Izvor varijacije
Varijacija, suma kvadrata (SS)
St. slo-bode (df)
Ocena varijanse (MSS) F-odnos
Objašnjena varijacija r – 1
Neobjaš-njena varijacija
N – r
Ukupno N – 1
€
MSSb =SSbr −1
€
MSSbMSSw
€
SSt = xip − X ( )2
p =1
r
∑i=1
k
∑€
SSw = xip − X p( )2
p =1
r
∑i=1
k
∑
€
MSSw =SSwN − r
€
SSb = np X p − X ( )2
p =1
r
∑
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
14
• Ako bi nulta hipoteza bila istinita (nivoi tretmana nemaju značajan efekat) onda bi F-odnos trebalo da bude blizu 1; u suprotnom F-odnos ima veće vrednosti
• Čita se vrednost iz tablica F-rasporeda za (r-1) i (N-r) stepeni slobode
• Na osnovu toga se zaključuje da li postoji razlika uslovljena nivoom tretmana i za koji nivo značajnosti ova razlika postoji
15
€
F =MSSbMSSw
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
15
r - deskriptivni statistički pokazatelj, mera jačinepovezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka :
§ Vrednost r na bazi uzorka teži da bude pristrasna naviše, pa je bolje koristiti :
16
t
b
SSSS
=r
€
ˆ ω 2 =SSb − (r −1)MSSw
SSt + MSSwIstraživanje tržišta, Ekonomski fakultet BU Novembar 2019
r - deskriptivni statistički pokazatelj, mera jačinepovezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka :
§ Vrednost r na bazi uzorka teži da bude pristrasna naviše, pa je bolje koristiti :
16
t
b
SSSS
=r
€
ˆ ω 2 =SSb − (r −1)MSSw
SSt + MSSwIstraživanje tržišta, Ekonomski fakultet BU Novembar 2019
16
05/12/2019
5
17Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
17
Pre početka analize se uvek formalno proverava ispunjenostpretpostavki modela:1. Reziduali po grupama imaju normalnu raspodelu -
proveravamo Kolmogorov-Smirnovljevim testomnormalnosti;
2. Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testomhomogenosti varijanse;
3. U pitanju su nezavisni slučajni uzorci.
18Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
18
19
Nulta hipoteza je da su varijanse reziduala različitih grupa jednake, t.j. da postoji homoskedastičnost, ili homogenost varijansi, putem Levinovog testa:
Respecifikacija varijabli putem logaritamske transformacije!p=0,027 < α=0,05 è odbacujemo nultu hipotezu
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
19
20Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
20
05/12/2019
6
21
➔ Ne odbacujemo nultu hipotezu - na logaritmovanimpodacima varijanse se statistički ne razlikujuvarijanse
➔ Možemo nastaviti analizu proverom ispunjenostiuslova normalnosti.
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
21
• Koristi se za testiranje hipoteze o normalnosti raspodele• Nulta hipoteza je da varijabla prati normalan raspored, a
alternativna je da ne prati• Dakle, nastavićemo sa daljom analizom samo ako test
pokaže da se ne odbacuje nulta hipoteza.
22Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
22
23
• Sve tri p-vrednosti su veće od 0,05, pa ne odbacujemo nultu hipotezu o normalnosti rasporele!
23
24Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
24
05/12/2019
7
25
➔ Na nivou značajnosti od 5% ne bismo odbacili Ho; ➔ Na nivou značajnosti od 10% bismo odbacili Ho i zaključili
bismo da postoje razlike po godinama u odnosu na vremeprovedeno u učenju tokom semestra.
25
26
26
• U ovom modelu postoji više varijabli tretmana (faktora)§ Dodavanjem nove varijable tretmana tipično se povećava
objašnjeni varijabilitet§ Druga varijabla tretmana se naziva blok-varijabla, jer se formira
jedan ili više blokova§ Takođe je moguće da se uključi više varijabli tretmana
• Interakcija§ Efekat interakcije znači da uticaj jednog tretmana neće biti isti
za svaki nivo onog drugog tretmana§ Hipoteza o tome da nema interakcije se može testirati
korišćenjem ANOVA tabele
27Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
27
28
28
05/12/2019
8
Putem dvofaktorske analize varijanse u ovom primeru možemo testirati sledeće hipoteze:H0: ne postoji razlika među polovima u odnosu na broj
časova provedenih u učenju,Ha: postoji razlika među polovima u odnosu na broj časova
provedenih u učenju;H0: korišćenje Fejsbuka ne utiče na broj časova
provedenih u učenju,Ha: korišćenje Fejsbuka utiče na broj časova provedenih u
učenju;H0: nema interakcije između pola i korišćenja Fejsbuka u
odnosu na broj časova provedenih u učenju,Ha: postoji interakcije između pola i korišćenja Fejsbuka u
odnosu na broj časova provedenih u učenju.
29Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
29
30
p=0,021 < α=0,05 è odbacujemo nultu hipotezuRespecifikacija varijabli putem logaritamske transformacije!
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
30
31
Respecifikovane varijable (logaritmovanje)
31
32
➔ Ne odbacujemo nultu hipotezu - na logaritmovanimpodacima varijanse se statistilčki ne razlikuju.
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
32
05/12/2019
9
Hipoteze koje testiramo:H0: ne postoji razlika među polovima u odnosu na broj
časova provedenih u učenju,Ha: postoji razlika među polovima u odnosu na broj časova
provedenih u učenju;H0: korišćenje Fejsbuka ne utiče na broj časova
provedenih u učenju,Ha: korišćenje Fejsbuka utiče na broj časova provedenih u
učenju;H0: nema interakcije između pola i korišćenja Fejsbuka u
odnosu na broj časova provedenih u učenju,Ha: postoji interakcije između pola i korišćenja Fejsbuka u
odnosu na broj časova provedenih u učenju.
33Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
33
34
Koje od navedenih hipoteza ćemo odbaciti, a koje ne?
Istraživanje tržišta, Ekonomski fakultet BU Novembar 2019
34
This is where you give credit to the ones who are part of this project.Did you like the resources on this template? Get them for free at our other websites.Presentation template by Slidesgo
Icons by Flaticon
Images & infographics by Freepik
Author introduction slide photo created by katemangostar - Freepik.com
Big image slide photo created by jcomp - Freepik.com
Text & Image slide photo created by rawpixel.com - Freepik.com
Text & Image slide photo created by Freepik
35
35
Da li imate [email protected]
36