Upload
harbersesa
View
70
Download
5
Embed Size (px)
DESCRIPTION
Metodologija naucno istrazivackog rada
Citation preview
1
Ekonomski fakultet u Sarajevu
II ciklus studija: master studij
Prof. dr Rabija Somun-Kapetanović
Akademska godina 2012/2013
METODOLOGIJA NAUČNO –
ISTRAŽIVAČKOG RADA II DIO
Teme:
Osnovne kvantitativne metode analize podataka: osnovne statističke metode korelaciona i regresiona analiza analiza varijanse
kvantitativne metode predviđanja.
studije slučajeva.
2
Statističke metode temeljene na zavisnosti (dependence methods)
Ova grupa metoda istražuije prisutnost ili odsutnost relacije između dva skupa, odnosno između zavisne i nezavisne varijable. Ova grupa metoda se dijeli prema broju nezavisnih varijabli, broju zavisnih varijabli, i vrsti mjerne skale nezavisne i zavisne varijable.
• Regresija
• Analiza varijanse (ANOVA)
• Diskriminantna analiza
• Kanonska korelacijska analiza
3
Statističke metode temeljene na međuzavisnosti (interdependence methods)
Ove metode se primjenjuju kada nisu eksplicitno definisani skupovi zavisnih i nezavisnih varijabli. Zadatak je istražiti zašto su varijable međusobno korelirane. U ovu grupu spadaju:
• Metoda glavnih komponenti
• Faktorska analiza
• Grupisanje podataka klaster analizom
4
Jednostavni linearni model
• Analiza osnovnih elemenata ekonometrijske regresije pomoću jednostavne linearne veze.
• Veza između konceptualnog ekonomskog modela i njegovog ekonometrijskog izraza.
• Tehnike za ocjenu ekonometrijskog modela:
– estimator (procjenitelj) metode najmanjih kvadrata.
• Provjera statističke pouzdanosti ocijenjenih modela
• Korisni indikatori za evaluaciju kvaliteta ocjena.
5
Od ekonomskog do ekonometrijskog modela
Ako se analizira evolucija posmatranog fenomena između različitih individua u vremenskom presjeku model se piše u sljedećem obliku:
gdje indeks i označava da se istražuje promjena varijable Y u funkciji varijable X između različitih individua (jedinica posmatranja, npr. zemlje, potrošači, preduzeća).
6
ii XY 10
Od ekonomskog do ekonometrijskog modela
U prethodnom dijelu smo definisali funkciju potrošnje u obliku linearne veze: C = α + ·Y
gdje je C potrošnja, Y dohodak , α nužna potrošnja, granična skladnost potrošnji.
Ako se koriste podaci vremenskih serija model se izražava sljedećom relacijom:
gdje indeks t pokazuje da se analizira evolucija varijable Y kao funkcija varijable X u toku vremenskog perioda (godina, mjeseci).
7
XY 10 +=
tt XY 10
Od ekonomskog do ekonometrijskog modela
Ukoliko se ekonomske pojave analiziraju za više posmatranih jedinica u toku odabranog vremenskog perioda, radi se o modelu sa panel podacima koji se formalizira sljedećim izrazom:
8
itit XY 10
Od ekonomskog do ekonometrijskog modela
Svi faktori koji nisu (eksplicitno) uključeni u model se mogu grupisati u teorijskom modelu sintetičkim izrazom koji predstavlja stohastički član ili grešku koji se označava kao:
– t za model sa podacima vremenske serije,
– i za model u vremenskom presjeku
– it za model sa panel podacima
Ovaj izraz predstavlja grešku specifikacije modela zbog neuključivanja u model nekih eksplikativnih faktora i istovremeno uzima u obzir greške mjerenja podataka.
9
Od ekonomskog do ekonometrijskog modela
Uvođenje ovog člana omogućava da se pređe sa teorijskog na ekonometrijski model i za vremensku seriju izraz je:
Yt zavisna varijabla koja se objašnjava tj. endogena , Xt nezavisna varijabla kojom se objašnjava tj. Egzogena
je regresiona prava, 0 konstantna, 1 nagib, a stohastički član ili greška koja predstavlja razlike između teorijskog i ekonometrijskog modela.
Zadatak je ocjeniti parametre 0 i 1 .
Nije moguće poznavati njihove prave vrijednosti.
10
ttt XY 10
tX10
Parametri i pretpostavke o osobinama stohastičnosti modela
a) , normalnost
b) , očekivana vrijednost greške je jednaka nuli
c) , konstantna varijansa – homoskedastičnost
d) za svako i, j; ij; , nepostojanje autokorelacije
e) nezavisnost greške od egzogene varijable j.
11
n.1,2,...,i ,10 iii xy
),0(~ 2 Ni
0)( iE
22 )( iE
0),( jiE
0),( ji XE
Osobine procjenitelja
Da bi se ocijenile vrijednosti parametara regresionog modela potrebno je odabrati formulu (procjenitelj, estimator) kojim će se doći do njihove najbolje procjene.
Procjenitelji trebaju imati sljedeće osobine:
1. Nepristrasnost
2. Konzistentnost
3. Efikasnost
4. Najbolja linearna nepristrasnost
12
Metod najmanjih kvadrata i kriterij izbora regresione prave
Vidjeti detaljno u knjizi:
Somun-Kapetanović, R.: Statistika u ekonomiji i menadžmentu, Sarajevo, Ekonomski fakultet, 2006. str. 111 – 145.
13
Regresiona i korelaciona analiza
• Zadatak regresione analize je istraživanje analitičkog oblika veze između pojava kojem se najviše približavaju promjene analiziranih pojava.
• Zadatak korelacione analize je utvrđivanje stepena i smjera povezanosti pojava.
14
Metod jednostavne regresije
Analiza slučaja 1.
Cilj:
• izračunati koeficijent korelacije i testirati signifikantnost u odnosu na 0.
• ocijeniti parametre modela jednostavne linearne regresije i seriju reziduala
• ocijeniti rezidualnu varijansu i varijansu i standardnu grešku dobivenih parametara.
15
Bourbonnais R., (2008): Exercice pedagogiques d'econometrie, Economica, Paris, str.14.
Podaci za varijable Yt , Xt
16
t Y X
1 20 54
2 19 53
3 21 59
4 21 66
5 23 63
6 20 62
7 25 65
8 24 60
9 28 59
10 27 65
11 31 70
12 33 65
Ocjena modela
Ocijenićemo relaciju
b0 i b1 parametri modela koje treba ocijeniti i koji se još nazivaju regresioni koeficijenti, n broj podataka, et rezidual.
17
ttt xy 10
nteXbby ttt ,...,1=,++= 10
Pitanja:
P.1. Nacrtati grafikon i izračunati koeficijent korelacije. Da li je koeficijent korelacije značajno različit od 0?
P.2. Objasniti značenje slučajnog člana, ocijeniti parametre b0 i b1 i kompletirati seriju reziduala.
P.3. Ocijeniti neobjašnjenu (rezidualnu) varijansu i standardne greške koeficijenata b0 i b1 .
18
Odgovori: P.1.
• Grafička prezentacija: oblak rasipanja Y u funkciji X (Excel u prilogu)
• Grafikon ukazuje na pozitivnu korelaciju varijabli
• Koeficijent jednostavne linearne korelacije je dat sljedećim izrazom:
19
n
t
t
n
t
t
t
n
t
t
yx
yx
yyxx
yyxxyxCOV
r
1
2
1
2
1,
)-()-(
)-()-(),(
62,067,23025,274
00,157.
1
2
1
2
1
2
1
2
1 1 1
.
n
t
n
t
tt
n
t
n
t
tt
n
t
n
t
n
t
tttt
yynxxn
yxyxn
Odgovori: P.1.
• rx,y= 0,62
• Test hipoteze na je sljedeći
• Za ovaj test potrebno je primjeniti t statistiku
• Ako je t * > tn-2 tj. t izračunato veće od tablične vrijednosti t za nivo % i (n – 2) stepena slobode odbacuje se H0 što znači da je teorijski koeficijent korelacije značajno različit od 0.
• Ako je broj stepeni slobode veći od 30 tada se Studentova distribucija može aproksimirati normalnom distribucijom.
20
yx , 0:;0: ,1,0 yxyx HH
2
)1( 2
,
,*
n
r
rt
yx
yx
Odgovori: P.1.
Veza se u opštem slučaju smatra signifikantnom ako je rizik da će se pogriješiti manji od 5% afirmišući da je koeficijent korelacije različit od 0.
t * = 2,52 > t 0,0512-2= 2,228
Odbacujemo H0 koeficijent korelacije ρx,y je značajno različit od nule na nivou rizika 5%.
21
Odgovori: P.2.
Estimator MNK, pouzdan i konvergentan je jednak
22
21
),(
X
YXCovb
572,0
)(
)()(
1
2
1
1
n
t
t
n
t
tt
xx
yyxx
b
017,118,61572,03,2410 xbyb
ttt xxbby 572,0017,11ˆ10
ttt yye ˆ
Odgovori: P.3.
Varijanse ocijenjenih parametara su:
Standardne greške ocijenjenih parametara su:
23
079,14212
79,140
2ˆ 1
2
2
n
en
t
t
92,19625,274
82,61
12
1079,14
)(
1ˆˆ
1
2
222
0
n
t
t
b
xx
x
n
0513,025,274
079,14
)(
ˆˆ
1
2
22
1
n
t
t
b
xx
03,14ˆ bo226.0ˆ1 b
Primjena Excela
24
Primjena Excela
25
Primjena Excela
26
Nastavak Analize slučaja 1
Ciljevi:
• statistički testovi
• Studentov test za parametre (jednostrani i dvostrani)
• račun kritične vjerovatnoće
• test analize varijanse
• interval povjerenja parametara i objašnjenje varijanse
• Interval predviđanja
27
Testiranje hipoteza, slučaj 1.
P.1. Testirati na nivou 5% hipotezu:
Zašto je ova hipoteza značajna za testiranje ? Dajte kritičnu vjerovatnoću testa.
Odredite interval povjerenja za koeficjent β1 sa pouzdanošću 95%.
P.2. Testirati sljedeće hipoteze uz α =5%:
i dajte kritične vjerovatnoće testa.
28
0:;0: 1110 HH
5,0:;5,0: 1110 HH
P.3. Izračunati: • Ukupan zbir kvadrata odstupanja TSS (total sum of square):
• Neobjašnjeno odstupanje kvadrata ili zbir kvadrata rezidualnih odstupanja RSS (residual sum of square):
• Zbir kvadrata objašnjenih odstupanja ESS (estimated sum of square), objašnjeno odstupanje:
• Izračunati koeficijent determinacije R2 i kompletirati tabelu analize varijanse. Testirati uz α=5% sljedeće hipoteze:
• Šta možete zaključiti?
29
n
t
t yy1
2)(
n
t
tt
n
t
t yye1
2
1
2 )ˆ(
n
t
t yy1
2)ˆ(
0)-ˆ(:1
2
0
n
t
t yyH 0)-ˆ(:1
2
1
n
t
t yyH
Odgovori:
P.1.
Prema
Odbacuje se H0 nepoznati teorijski koeficijent je značajno različit od 0.
30
0:,0: 1110 HH
2-n11 t~
ˆ1b
b
21
10 ~ˆ
0)0(:
1
n
b
tb
H
> 53,2=226.0
572,0=
ˆ=*
1
1
b
bt
228,205,0
10 t
Odgovori
Interval povjerenja je:
Nepoznati koeficjent β1 ima 95% vjerovatnoće da se nađe u tom intervalu.
Konstatujemo da je nula van tog intervala što je u saglasnosti sa prethodnom hipotezom i donesenom odlukom.
31
08,1;07,0
226,0228,2572,0
ˆ
ˆ
1
1
2/
211
2/
211
1
1
bn
n
b
tb
tb
Odgovori:
P.2.
Ne može se odbaciti nulta hipoteza to znači da nije značajno različit od 0,5
32
5,0: 10 H 5,0: 11 H
t test⇒)5,0=( 10 H2
1 ~ˆ
5,0
1
n
b
tb
32,0226,0
5,0572,0
ˆ
5,0*
1
1
b
bt
228,232,0* 05,0
10 tt
1
P. 3.
Ukupan zbir kvadrata odstupanja:
Rezidualni zbir kvadrata odstupanja:
Objašnjeni zbir kvadrata odstupanja:
Koeficijent determinacije:
33
67,230)(1
2
n
t
t yy
79,1401
2
n
t
te
88.89)ˆ( 2
1
yyn
t
t
389,0
)(
1
)(
)ˆ(
1
2
1
2
1
2
1
2
2
n
t
t
n
t
t
n
t
t
n
t
t
yy
e
yy
yy
R
389,0)62,0( 22
,
2 yxrR
P. 3.
Tabela: Analiza varijanse
34
STEPENI
SLOBODE
ZBIR
KVADRATA
SREDINA
KVADRATA
REGRESIJA 1 89,88 89,88
REZIDUAL 10 140,79 14,08
UKUPNO 11 230,67
Odgovori
Kako odrediti stepene slobode? Stepen slobode je jednak broju parametara koji se mogu slobodno izabrati poslije realizacije statističke ocjene.
Npr. ako je raspoloživ uzorak od 6 podataka i ako se
poznaje aritmetička sredina uzorka tada se slobodno može odabrati 5 podataka a šesti će se izračunati iz aritmetičke sredine: broj stepeni slobode je dakle (n -1).
35
Odgovori
Za ukupan zbir kvadrata odstupanja poznata je aritmetička sredina od Y što znači gubitak jednog stepena slobode tj. (n-1).
Za rezidualnu sumu kvadrata odstupanja potrebno je poznavati dva parametra :
što znači gubitak 2 stepena slobode (n-2).
Za objašnjenu sumu kvadrata odstupanja potrebno je poznavati b1 da bi se izračunala ESS: i
odakle slijedi broj stepeni slobode jednak je 1.
36
10 bib )( 10 ttt xbbye
tt xbby .ˆ10 xbby .10
)()ˆ( 1 xxbyy tt
Testiranje
F test
Ako je odbacuje se H0 što znači da je objašnjena suma kvadrata odstupanja značajno različita od 0.
Varijabla Xt objašnjava varijablu Yt .
Kritična vjerovatnoća (rizik da se pogrešno odbaci H0 je data vrijednošću vjerovatnoće α takođe
Odbacujemo nultu hipotezu jer je rizik manji od 5%.
37
0)(: 2
1
0
yyHn
t
t 0)(: 2
1
1
yyHn
t
t
38,610/79,140
1/88,89
2/)ˆ(
1/)(
*
1
2
1
2
n
t
tt
n
t
t
nyy
yy
F
05,0
2,1
*
nFF
96,410,1 c
F 03,0c
Analiza slučaja 2.
Cilj: Statistički testovi i poređenje koeficijenata regresije
Interesuje nas veza između ocjene iz ekonometrije i ocjene iz statistike dobivene prethodne godine za određenu grupu studenata
Model za ocjenu je
ocjena iz ekonometrije za individuu i
ocjena dobivena iz statistike prethodne godine za individuu i
parametri za ocjenu
stohastički član, greška koja zadovoljava klasične hipoteze.
38
iii xy 10
iy
ix
10 i
t
Rezultati ocjene modela
Uzet je uzorak 97 studenata i to 54 mladića i 43 djevojke.
39
Model 1 za mladiće Model 2 za djevojke
iii exy 3,381,0 ,1
)12,2(
54n
84,02 R
iii exy 5,109,1 ,1
)20,3(
43n
87,02 R
Pitanja:
P.1. Obrazložite postupak
P.2. Postoji li statistički značajna relacija između ocjene iz statistike i ocjene iz ekonometrije? Odredite kritičnu vjerovatnoću testa i komentarišite rezultat.
P.3. Za dva modela testirati
Odrediti kritičnu vjerovatnoću testa.
40
1:;1: 1110 HH
Odgovori - Rješenja
P.1. Modeli su specificirani u vremenskom presjeku jer su podaci prikupljeni u trenutku t za 97 individua (jedinica posmatranja). Uzorak je podijeljen na 2 podskupa (mladići i djevojke) i ocijenjena su 2 modela jer se pretpostavlja da su parametri 2 modela različiti.
P.2.
Za model 1.
Pošto je broj stepeni slobode veći od 30 Studentova distribucija se može aproksimirati normalnom. Odbacuje se nulta hipoteza što znači da postoji veza između ocjene iz ekonometrije i ocjene iz statistike u prethodnoj godini za mladiće.
41
0:;0: 1110 HH
96,112,2ˆ
* 05,0
521
1
tb
tb
Odgovori - Rješenja
Kritična vjerovatnoća c se dobija kao , c =0,039
Postoji rizik od 3,9% da će se napraviti greška ako se odbaci H0. Nulta hipoteza se odbacuje jer je rizik greške manji od 5%.
Za drugi model
Odbacuje se H0 kao što znači da postoji veza između ocjene iz ekonometrije i ocjene iz statistike u prethodnoj godini za djevojke.
Kritična vjerovatnoća c : odnosno c = 0,0026.
Postoji 0,26% rizika da će se pogriješiti ako se odbaci H0 .
U oba modela je pokazana statistički značajna veza i za drugi model relacija je jača jer je kritična vjerovatnoća manja.
42
12,252 c
t
96,120,3ˆ
* 05,0
411
1
tb
tb
20,341 c
t
Primjena Excela
43
Odgovori - Rješenja
P.3. Treba izračunati standardnu grešku za svaki od koeficjenata
Za model 1:
Za model 2:
44
*
11*
1
1
1
1ˆ
ˆb
b
b
bt
bbt
382,012,2
81,0ˆ
1b
340,020,3
09,1ˆ
2b
Odgovori - Rješenja
Dvostrani test
Za količnik
Za prvi model
Pošto je empirijska vrijednost negativna, nalazimo se u negativnom dijelu kritičnog regiona i vrijednost je
Prihvatamo H0 , teorijski koeficijent nije značajno različit od 1.
Kritična vjerovatnoća odnosno c =0,62.
Postoji 62% rizika da će se pogriješiti ako se odbaci H0 i zbog toga se ne odbacuje.
45
1: 10 H 1: 11 H
)1( 10 H 21 ~ˆ
1
1
n
b
tb
497,0382,0
181,0
ˆ
1*
1
1
b
bt
.497,096,105,0
53 t
1
497,053 c
t
Odgovori-Rješenja
Za drugi model:
H0 se prihvata, nije značajno različit od 1.
Kritična vjerovatnoća , c =0,79
79% rizik greške ako se odbaci H0 . Zbog toga prihvatamo H0
46
96,1264,034,0
109,1
ˆ
1* 05,005,0
411
1
ttb
tb
1
264,041 c
t
Model multiple regresije
Treba ocijeniti sljedeći model
zavisna varijabla
eksplikativne varijable čije su vrijednosti poznate
za period od 10 godina.
47
tttt xxy ,22,110
ty
tt xix ,2,1
Analiza slučaja 3. : Model multiple regresije
Tabela:
48
ttt xixy ,2,1,
t
1 12 7 48
2 21 9 40
3 24 11 18
4 24 12 28
5 13 7 40
6 17 9 32
7 21 12 31
8 26 14 24
9 31 19 22
10 30 21 25
tytx ,1 tx ,2
Analiza slučaja 3. : Model multiple regresije
P.1. Ocijeniti regresioni model.
P.2. Testirati sljedeće hipoteze uz nivo pouzdanosti 95%.
i odrediti kritičnu vjerovatnoću testa.
Komentarisati dobivene rezultate.
49
0:;0: 2110 HH
0:;0: 2120 HH
Primjena Excela
50
Primjena Excela
51
Primjena Excela
52
Odgovori - Rješenja
P.1. Ocijenjeni regresioni model je :
53
tt ebby 21 256,0902,087,18
Odgovori-rješenja
P.2.
i nepoznati koeficijent β1 je značajno različit od 0.
Kritična vjerovatnoća testa
Postoji 3,2 šansi na hiljadu da pogriješimo ako odbacimo H0, odbacujemo je jer je rizik da ćemo pogriješiti manji od 5%.
54
1
1
110
~ˆ
0
~ˆ
0:;0:
kn
b
i
kn
b
ii
tb
tb
HH
i
i
36,2
37,4206,0
902,0
ˆ
05.0
1
1*
1
1
kn
b
b
t
bt
0
05,0
7
*
1Hseodbacujettb
0032,037,47 ctjtc
Odgovori - rješenja
nalazimo se lijevo od kritične oblasti za H0
odbacuje se H0 .
Nepoznati parametar β2 je različit od nule.
Kritična vjerovatnoća
Postoji 4,3% rizika da ćemo pogriješiti ako odbacimo nultu hipotezu. Odbacujemo je jer je rizik da ćemo pogriješiti manji od 5%.
55
46,2104,0
256,0
ˆ
0:0:
2
2
2*
2120
b
b
bt
HH
36,246,2 05,0
7
*
2 ttb
043,0,46,27 cc
t
Odgovori-rješenja
Interval povjerenja je:
Koeficjent β1 ima 95% vjerovatnoće da se nađe u ovom intervalu. Nula je izvan ovog intervala što potvrđuje prethodni test .
56
2/
211
1ˆ
n
b
tb
.38,1;43,0206,0306,2902,0ˆ11
2/
21 1
bntb
Nastavak analize slučaja 3. : Predviđanje
Cilj: analiza varijanse, računanje koeficijenta multiple korelacije, korigovanog koeficijenta determinacije. Predviđanje i interval.
Uzeti podatke i rezultate iz vježbe 4. multipla regresija.
– P.2. Kompletirati tabelu analize varijanse
– P.3. Izračunati r,
– P.4.Testirati značajnost regresije uz rizik od 5%
– P.5. Izračunati predviđene vrijednosti Yt i interval sa 95% značajnosti za periode 11 i 12 znajući sljedeće vrijednosti:
57
RR___
,
2
Period
11 24 21
12 12 30
tx ,1 tx ,2
Odgovori: P.1.
TSS:
RSS:
ESS:
58
n
t
n
t
t
n
t
t yyyyyy1 1
2
1
2 )ˆ()ˆ()(
n
t
t
n
t
t
n
t
tt
n
t
t
yy
eyy
yy
1
2
1
2
1
2
1
2
43,345)ˆ(
47,31)ˆ(
9,376)(
Analiza varijanse
Broj stepeni slobode objašnjenog zbira kvadrata odstupanja (ESS) je jednak k kada imamo k eksplikativnih varijabli ne računajući konstantnu.
59
Stepeni slobode Zbir kvadrata Sredina kvadrata
Regresija k=2 ESS=345,43 172,72
Rezidual n-k-1=7 RSS=31,47 4,49
Ukupno n-1=9 TSS=376,9
Output iz Excela Analiza varijanse
60
ANOVA
df SS MS F Significance F
Regression 2 345,4314 172,7157 38,41957 0,000168182
Residual 7 31,4686 4,495514
Total 9 376,9
Analiza rezultata
Zašto korigovati stepene slobode? U modelu multiple regresije činjenica da se doda jedna eksplikativna varijabla čak i neznačajna ima za posljedice da smanji zbir kvadrata neobjašnjenih odstupanja i poveća zbir kvadrata objašnjenih odstupanja. Dodavanje eksplikativne varijable rezultira u povećanju koeficijenta determinacije ali i gubitkom jednog stepena slobode. Kako bi se to uzelo u obzir računa se koeficijent determinacije korigovan za stepene slobode.
61
892,0)1()1(
11
957,0
916,0
)(
1
)(
)ˆ(
2
2
1
2
1
2
1
2
1
2
2
Rkn
n
R
yy
e
yy
yy
R
R
R n
t
t
n
t
t
n
t
t
n
t
t
P.3.
62
0
05,0
)1(,
*
)1(,2
2
*
1
210
~
)1()1(
0:
)0...(0:
HseodbacujeFFjeAko
F
knR
kR
RSSddlRSS
ESSddlESS
F
ESSH
ESSH
knk
knk
k
P.3.
Odbacuje se H0 , ESS je različita od nule, varijable x1t i x2t su
eksplikativne varijable od yt.
Ograničenje F testa za globalnu značajnost regresije. U slučaju
odbacivanja ovaj test ima ograničeni značaj. On samo konstatuje da
ima najmanje jednu varijablu eksplikativna signifikantna bez drugih
indikacija.
63
74,441,38
247,31
243,345
05,0
7;2
* FF
00016818,041,387;2
C
Fc
P. 4. Predviđanje
64
hnhnhn xxy ,2,1 256,0902,087,18ˆ
Period x1t x2t Predviđanje
11 24 21
12 12 30
14,3521256,024902,087,18ˆ110 y
01,2230256,012902,087,18ˆ210 y
Analiza slučaja 4:
Cilj: Upotreba dummy varijabli, test linearnog ograničenja na koeficijente.
Podaci su prikupljeni za 364 domaćinstva i to:
- godišnja potrošnja za rekreaciju-odjeću (R-0) varijabla potrošnja u € Yi
- godišnji prihodi domaćinstava u € x1i
- mjesto stanovanja
- selo = 1, ako nije selo 0 x2i
- grad = 1, ako ne 0 x3i
- predgrađe = 1, ako ne 0 x4i
Podaci za 364 domaćinstva su predstavljeni u Excelu za Analizu slučaja 4.
65
P. 1. Ocijenite koeficijente sljedeća tri modela i intepretirajte rezultate.
P. 2. Za model 2. izračunati predviđanje za potrošnju rekreacija - odjeća za domaćinstvo u gradu čiji je godišnji prihod 50 000€.
66
iiiiii
iiiiii
iiiii
iiiiii
predgradseloprihodpotrošnjaModel
xxxxYModel
xxxYModel
xxxxYModel
.:
.3
.2
.1
43210
44332211
3322110
443322110
Odgovori - Rješenja
P.1. Traži se veza između prihoda domaćinstava i potrošnje za rekreaciju-odjeću. Mislimo da mjesto stanovanja može biti eksplikativni (objašnjavajući ) faktor potrošnje.
Kreirali smo tri varijable
selo = 1, ako ne 0
grad = 1, ako ne 0
predgrađe = 1, ako ne 0
Varijabla je - dihatomna, binarna, dummy na engleskom. To je posebna eksplikativna varijabla koja uzima vrijednost 0 ili 1.
67
Ocjena modela 1.
Koeficijenti modela se ne mogu ocijeniti jer postoji perfektna multikolinearnost. Zbir tri dummy varijable je jednak 1, i perfektno je koreliran sa vektorom 1 konstantnog člana. Estimatori metode najmanjih kvadrata se ne mogu utvrditi. U slučaju kvalitativnih varijabli koje imaju više modeliteta (npr. boja očiju, porodična situacija itd.) treba kodirati toliko varijabli indikatora koliko ima modeliteta manje 1.
68
Primjena Excela
69
Ocjena modela 2.
Koeficijenti su značajno različiti od 0, model je validan prema statističkim kriterijima.
U prosjeku od 100€ prihoda potrošnja za R-0 predstavlja 5,80€ (100x0,057993).
Stanovnici seoske zone troše 533,1635 € manje od prosjeka, a stanovnici grada troše 1545 € više od prosjeka.
70
Primjena Excela
71
Model.3.
U modelima 2. i 3. koeficijent uz varijablu prihod je identičan.
Stanovnici grada troše 1545 € više nego oni iz predgrađa (2487,83-942,90 = 1544,92) koji troše 533,17 € (942,90 - 409,73 = 533,17) više nego stanovnici sela.
Dobivamo koeficijente modela 2.
72
Primjena Excela
73
P. 2. Predviđanje
Za model 2 predviđanje potrošnje za R-0 za domaćinstvo koje živi u gradu i čiji je godišnji prihod 50 000€ je dobiveno sljedećim izrazom
74
euraY
Y
exxxY
i
i
iiiii
83,5387
193,1544016,533000.50058,090,942
93,154416,533058,090,942 321
Analiza slučaja 5. Mobilnost kapitala
Ekonomsko područje primjene: Monetarna i finansijska makroekonomija
Od 1980. godine uočava se porast liberalizacije internacionalog tržišta kapitala i ova liberalizacija je rezultirala u finansijskoj globalizaciji tj. u svjetskom tržištu kapitala.
U kontekstu liberalizacije tržišta kapitala, FELDSTEIN i HORIOKA (1980) su željeli evaluirati stepen mobilnosti internacionalnog kapitala u dugom roku na bazi analize veza između investiranja i štednje zemalja OECD.
75
Analiza slučaja 5. Mobilnost kapitala
Ovo pitanje je značajno jer u zavisnosti od stepena mobilnosti kapitala uticaj ekonomskih politika može biti jači ili slabiji. Npr. porezna politika u korist nacionalne štednje će imati značajniji efekat na investiranje u zemlji ukoliko je nivo mobilnosti kapitala slabiji.
U slučaju nepostojanja mobilnosti kapitala nalaze se rezultati zatvorene ekonomije, nacionalna štednja je jednaka nacionalnom investiranju i svaki porast štednje rezultira identičnim porastom investiranja.
76
Analiza slučaja 5. Mobilnost kapitala
• FELDSTEIN i HORIOKA su mjerili stepen mobilnosti kapitala na bazi analize između štednje i investicija. Oni su ocijenili regresioni model:
u kojem:
predstavljaju proporciju bruto investicija i štednje u BDP (GDP), stohastički član.
77
Y
S
Y
I.21
Y
Si
Y
I
Analiza slučaja 5. Mobilnost kapitala
• U slučaju perfektne mobilnosti kapitala, porast stope štednje u jednoj zemlji mora uzrokovati porast investicija. Granična produktivnost kapitala je opadajuća funkcija stoka kapitala što znači da će prvo imati koristi zemlje koje inicijalno imaju manje kapitala.
• U slučaju jake mobilnosti kapitala porast nacionalne (državne) štednje ne rezultira u identičnom porastu nacionalnih investicija. Ocjena blizu jedinici pokazuje da porast nacionalne štednje uzrokuje identičan porast nacionalnih investicija. Dodatna štednja ostaje u zemlji i mobilnost kapitala je slaba.
78
2
Prezentacija baze podataka
Podaci su publikovani u ,,Ekonomske perspektive OECD” 2000. Serija podataka o GDP, državnoj štednji, privatnoj štednji, javnoj štednji i nacionalnim investicijama su izražene u nacionalnoj valuti u tekućim cijenama, a serije izvoz, uvoz su raspoložive kao proporcija u GDP.
Na osnovu ovih podataka su izračunate stope investiranja štednje i prosječan komercijalni deficit za različite podperiode.
U dokumentu podataka dati su podaci za 19 zemalja: USA, Japan, Njemačka, Francuska, Italija, Holandija, Norveška, Portugal, Španija, Švedska, Švajcarska, Australija i Velika Britanija.
79
Prezentacija baze podataka
Serije su godišnji prosjeci
• txi = I/Y udio investicija u GDP
• txs = S/Y udio nacionalne štednje u GDP
• tx priv = S privatna /Y udio privatne štednje u GDP
• tx javna = S javna /Y udio javne štednje u GDP
• dc = -(X-M)/Y je udio komercijalnog deficita u GDP
Npr. txi 7098 prosječna stopa investicija u periodu 1970-1998.
80
Analiza slučaja 5. Mobilnost kapitala
Ocijeniti običnom metodom najmanjih kvadrata model:
txi7098i=b1+b2txs7098i+ei = 0,085+0,62txs7098i+ei Analizirajte dobiveni rezultat.
81
19,...,2,1,21
i
Y
S
Y
It
ii
iii txstxi 70987098 21
Analiza slučaja 5. Mobilnost kapitala
Za vježbu provjerite ocjenu sljedećeg modela i interpretirajte dobivene rezultate:
txi7098i=b1+b21txpriv7098i+b22txsjav7098i+ei= =0,067+0,71txpriv7098i+0,54txsjav7098i+ei U Excelu je prezentovana baza podataka i ocjene modela.
82
Primjena Excela
83
Primjena Excela
84
Analiza varijanse
• Analiza varijanse se koristi u analizi većeg broja uzoraka za utvrđivanje statističke značajnosti razlika između njihovih aritmetičkih sredina.
• Cilj analize varijanse je da utvrdi da li je varijabilitet između uzoraka (posmatranih grupa podataka) statistički značajniji od varijabiliteta u uzorku.
• U zavisnosti od broja nezavisnih varijabli koje se uključuju u analizu razlikuju se jednofaktorska ( jednostavna) i dvofaktorska (složena) analiza varijanse.
85
Jednofaktorska analiza varijanse
• Statističku značajnost razlika aritmetičkih sredina između dva uzorka se određuje t – testom.
• Kada je broj uzoraka veći od dva primjenjuje se jednofaktorska analiza varijanse. Nije neophodno da uzorci imaju isti broj podataka i zaključak se donosi na osnovu dobijene p vrijednosti.
86
Primjer 6.
U tri pogona se proizvodi isti proizvod. Ispituje se produktivnost rada mjerena utroškom vremena za proizvodnju proizvoda. Slučajnim izborom iz pogona A je izabrano 8, iz pogona B 7 i iz pogona C 9 proizvoda. Utrošeno vrijeme za proizvodnju proizvoda u minutama je dato u sljedećoj tabeli:
87
Analiza varijanse Primjer 6
Može li se prihvatiti
pretpostavkada ne
postoji razlika u prosječnom
utrošku vremena za proizvodnju
proizvoda u datim pogonima uz nivo signifakantnosti (značajnosti, rizika) od 5%?
88
Primjer 6 Jednofaktorska analiza varijanse
Pogon A Pogon B Pogon C
29 21 26
30 26 23
27 25 23
27 28 24
22 21 25
28 20 29
25 22 20
24 22
27
Primjer 6
89
Primjer 6
90
Hipoteze Primjer 6
Odgovor
• Empirijski F odnos je manji od teorijskog F odnosa pa se na
nivou rizika od 5% ne odbacuje nulta hipoteza
• p- vrijednost je 0,0974 i veća je od nivoa 5% što upućuje na prihvatanje nulte hipoteze
• Na osnovu dobivenih rezultata ne može se prihvatiti pretpostavka da je produktivnost rada u pogonima različita.
91
3210 :H
3210 :H
Primjer 7
• Služba za istraživanje i razvoj Pošte ispituje produktivnost rada službenika na šalterima poslovnice. Posmatrana su 4 službenika. Evidentiran je broj usluženih stranaka po satu za slučajno odabrane vremenske intervale i rezultati prikazani u tabeli.
• Testirajte hipotezu da službenici u prosjeku uslužuju jednak broj stranaka uz nivo rizika 5%. Navedite pretpostavke od kojih se polazi u ovom testu.
92
Primjer 7
93
Dvofaktorska analiza varijanse Primjer 8
Na tržište se lansira novi parfem. Glavni element marketinške strategije je dizajn proizvoda. Razvijena su tri moguća dizajna. Prije konačne odluke želi se ispitati reakcija potrošača. Proizvodi tri dizajna (A, B i C) na slučajan način su alocirani u parfimerijama približno istih karakteristika u četiri regije. U tabeli su predstavljeni podaci o sedmičnoj prodaji:
94
Primjer 8
95
Hipoteze
• Za regije:
• Za dizajn:
Odgovor
• F test: na nivou rizika od 5% odbacuje se nulta hipoteza da su prosječne prodaje u svim regijama i tri različita dizajnirana proizvoda jednake.
• Na osnovu dobivenih rezultata zaključuje se da i faktor regija i faktor dizajn utiču na prodaju parfema.
96
0:;0: 32113210 HH
0:;0: 4321143210 HH