96
1 Ekonomski fakultet u Sarajevu II ciklus studija: master studij Prof. dr Rabija Somun-Kapetanović Akademska godina 2012/2013 METODOLOGIJA NAUČNO – ISTRAŽIVAČKOG RADA II DIO

Metodologija II Dio 2013

Embed Size (px)

DESCRIPTION

Metodologija naucno istrazivackog rada

Citation preview

Page 1: Metodologija II Dio 2013

1

Ekonomski fakultet u Sarajevu

II ciklus studija: master studij

Prof. dr Rabija Somun-Kapetanović

Akademska godina 2012/2013

METODOLOGIJA NAUČNO –

ISTRAŽIVAČKOG RADA II DIO

Page 2: Metodologija II Dio 2013

Teme:

Osnovne kvantitativne metode analize podataka: osnovne statističke metode korelaciona i regresiona analiza analiza varijanse

kvantitativne metode predviđanja.

studije slučajeva.

2

Page 3: Metodologija II Dio 2013

Statističke metode temeljene na zavisnosti (dependence methods)

Ova grupa metoda istražuije prisutnost ili odsutnost relacije između dva skupa, odnosno između zavisne i nezavisne varijable. Ova grupa metoda se dijeli prema broju nezavisnih varijabli, broju zavisnih varijabli, i vrsti mjerne skale nezavisne i zavisne varijable.

• Regresija

• Analiza varijanse (ANOVA)

• Diskriminantna analiza

• Kanonska korelacijska analiza

3

Page 4: Metodologija II Dio 2013

Statističke metode temeljene na međuzavisnosti (interdependence methods)

Ove metode se primjenjuju kada nisu eksplicitno definisani skupovi zavisnih i nezavisnih varijabli. Zadatak je istražiti zašto su varijable međusobno korelirane. U ovu grupu spadaju:

• Metoda glavnih komponenti

• Faktorska analiza

• Grupisanje podataka klaster analizom

4

Page 5: Metodologija II Dio 2013

Jednostavni linearni model

• Analiza osnovnih elemenata ekonometrijske regresije pomoću jednostavne linearne veze.

• Veza između konceptualnog ekonomskog modela i njegovog ekonometrijskog izraza.

• Tehnike za ocjenu ekonometrijskog modela:

– estimator (procjenitelj) metode najmanjih kvadrata.

• Provjera statističke pouzdanosti ocijenjenih modela

• Korisni indikatori za evaluaciju kvaliteta ocjena.

5

Page 6: Metodologija II Dio 2013

Od ekonomskog do ekonometrijskog modela

Ako se analizira evolucija posmatranog fenomena između različitih individua u vremenskom presjeku model se piše u sljedećem obliku:

gdje indeks i označava da se istražuje promjena varijable Y u funkciji varijable X između različitih individua (jedinica posmatranja, npr. zemlje, potrošači, preduzeća).

6

ii XY 10

Page 7: Metodologija II Dio 2013

Od ekonomskog do ekonometrijskog modela

U prethodnom dijelu smo definisali funkciju potrošnje u obliku linearne veze: C = α + ·Y

gdje je C potrošnja, Y dohodak , α nužna potrošnja, granična skladnost potrošnji.

Ako se koriste podaci vremenskih serija model se izražava sljedećom relacijom:

gdje indeks t pokazuje da se analizira evolucija varijable Y kao funkcija varijable X u toku vremenskog perioda (godina, mjeseci).

7

XY 10 +=

tt XY 10

Page 8: Metodologija II Dio 2013

Od ekonomskog do ekonometrijskog modela

Ukoliko se ekonomske pojave analiziraju za više posmatranih jedinica u toku odabranog vremenskog perioda, radi se o modelu sa panel podacima koji se formalizira sljedećim izrazom:

8

itit XY 10

Page 9: Metodologija II Dio 2013

Od ekonomskog do ekonometrijskog modela

Svi faktori koji nisu (eksplicitno) uključeni u model se mogu grupisati u teorijskom modelu sintetičkim izrazom koji predstavlja stohastički član ili grešku koji se označava kao:

– t za model sa podacima vremenske serije,

– i za model u vremenskom presjeku

– it za model sa panel podacima

Ovaj izraz predstavlja grešku specifikacije modela zbog neuključivanja u model nekih eksplikativnih faktora i istovremeno uzima u obzir greške mjerenja podataka.

9

Page 10: Metodologija II Dio 2013

Od ekonomskog do ekonometrijskog modela

Uvođenje ovog člana omogućava da se pređe sa teorijskog na ekonometrijski model i za vremensku seriju izraz je:

Yt zavisna varijabla koja se objašnjava tj. endogena , Xt nezavisna varijabla kojom se objašnjava tj. Egzogena

je regresiona prava, 0 konstantna, 1 nagib, a stohastički član ili greška koja predstavlja razlike između teorijskog i ekonometrijskog modela.

Zadatak je ocjeniti parametre 0 i 1 .

Nije moguće poznavati njihove prave vrijednosti.

10

ttt XY 10

tX10

Page 11: Metodologija II Dio 2013

Parametri i pretpostavke o osobinama stohastičnosti modela

a) , normalnost

b) , očekivana vrijednost greške je jednaka nuli

c) , konstantna varijansa – homoskedastičnost

d) za svako i, j; ij; , nepostojanje autokorelacije

e) nezavisnost greške od egzogene varijable j.

11

n.1,2,...,i ,10 iii xy

),0(~ 2 Ni

0)( iE

22 )( iE

0),( jiE

0),( ji XE

Page 12: Metodologija II Dio 2013

Osobine procjenitelja

Da bi se ocijenile vrijednosti parametara regresionog modela potrebno je odabrati formulu (procjenitelj, estimator) kojim će se doći do njihove najbolje procjene.

Procjenitelji trebaju imati sljedeće osobine:

1. Nepristrasnost

2. Konzistentnost

3. Efikasnost

4. Najbolja linearna nepristrasnost

12

Page 13: Metodologija II Dio 2013

Metod najmanjih kvadrata i kriterij izbora regresione prave

Vidjeti detaljno u knjizi:

Somun-Kapetanović, R.: Statistika u ekonomiji i menadžmentu, Sarajevo, Ekonomski fakultet, 2006. str. 111 – 145.

13

Page 14: Metodologija II Dio 2013

Regresiona i korelaciona analiza

• Zadatak regresione analize je istraživanje analitičkog oblika veze između pojava kojem se najviše približavaju promjene analiziranih pojava.

• Zadatak korelacione analize je utvrđivanje stepena i smjera povezanosti pojava.

14

Page 15: Metodologija II Dio 2013

Metod jednostavne regresije

Analiza slučaja 1.

Cilj:

• izračunati koeficijent korelacije i testirati signifikantnost u odnosu na 0.

• ocijeniti parametre modela jednostavne linearne regresije i seriju reziduala

• ocijeniti rezidualnu varijansu i varijansu i standardnu grešku dobivenih parametara.

15

Bourbonnais R., (2008): Exercice pedagogiques d'econometrie, Economica, Paris, str.14.

Page 16: Metodologija II Dio 2013

Podaci za varijable Yt , Xt

16

t Y X

1 20 54

2 19 53

3 21 59

4 21 66

5 23 63

6 20 62

7 25 65

8 24 60

9 28 59

10 27 65

11 31 70

12 33 65

Page 17: Metodologija II Dio 2013

Ocjena modela

Ocijenićemo relaciju

b0 i b1 parametri modela koje treba ocijeniti i koji se još nazivaju regresioni koeficijenti, n broj podataka, et rezidual.

17

ttt xy 10

nteXbby ttt ,...,1=,++= 10

Page 18: Metodologija II Dio 2013

Pitanja:

P.1. Nacrtati grafikon i izračunati koeficijent korelacije. Da li je koeficijent korelacije značajno različit od 0?

P.2. Objasniti značenje slučajnog člana, ocijeniti parametre b0 i b1 i kompletirati seriju reziduala.

P.3. Ocijeniti neobjašnjenu (rezidualnu) varijansu i standardne greške koeficijenata b0 i b1 .

18

Page 19: Metodologija II Dio 2013

Odgovori: P.1.

• Grafička prezentacija: oblak rasipanja Y u funkciji X (Excel u prilogu)

• Grafikon ukazuje na pozitivnu korelaciju varijabli

• Koeficijent jednostavne linearne korelacije je dat sljedećim izrazom:

19

n

t

t

n

t

t

t

n

t

t

yx

yx

yyxx

yyxxyxCOV

r

1

2

1

2

1,

)-()-(

)-()-(),(

62,067,23025,274

00,157.

1

2

1

2

1

2

1

2

1 1 1

.

n

t

n

t

tt

n

t

n

t

tt

n

t

n

t

n

t

tttt

yynxxn

yxyxn

Page 20: Metodologija II Dio 2013

Odgovori: P.1.

• rx,y= 0,62

• Test hipoteze na je sljedeći

• Za ovaj test potrebno je primjeniti t statistiku

• Ako je t * > tn-2 tj. t izračunato veće od tablične vrijednosti t za nivo % i (n – 2) stepena slobode odbacuje se H0 što znači da je teorijski koeficijent korelacije značajno različit od 0.

• Ako je broj stepeni slobode veći od 30 tada se Studentova distribucija može aproksimirati normalnom distribucijom.

20

yx , 0:;0: ,1,0 yxyx HH

2

)1( 2

,

,*

n

r

rt

yx

yx

Page 21: Metodologija II Dio 2013

Odgovori: P.1.

Veza se u opštem slučaju smatra signifikantnom ako je rizik da će se pogriješiti manji od 5% afirmišući da je koeficijent korelacije različit od 0.

t * = 2,52 > t 0,0512-2= 2,228

Odbacujemo H0 koeficijent korelacije ρx,y je značajno različit od nule na nivou rizika 5%.

21

Page 22: Metodologija II Dio 2013

Odgovori: P.2.

Estimator MNK, pouzdan i konvergentan je jednak

22

21

),(

X

YXCovb

572,0

)(

)()(

1

2

1

1

n

t

t

n

t

tt

xx

yyxx

b

017,118,61572,03,2410 xbyb

ttt xxbby 572,0017,11ˆ10

ttt yye ˆ

Page 23: Metodologija II Dio 2013

Odgovori: P.3.

Varijanse ocijenjenih parametara su:

Standardne greške ocijenjenih parametara su:

23

079,14212

79,140

2ˆ 1

2

2

n

en

t

t

92,19625,274

82,61

12

1079,14

)(

1ˆˆ

1

2

222

0

n

t

t

b

xx

x

n

0513,025,274

079,14

)(

ˆˆ

1

2

22

1

n

t

t

b

xx

03,14ˆ bo226.0ˆ1 b

Page 24: Metodologija II Dio 2013

Primjena Excela

24

Page 25: Metodologija II Dio 2013

Primjena Excela

25

Page 26: Metodologija II Dio 2013

Primjena Excela

26

Page 27: Metodologija II Dio 2013

Nastavak Analize slučaja 1

Ciljevi:

• statistički testovi

• Studentov test za parametre (jednostrani i dvostrani)

• račun kritične vjerovatnoće

• test analize varijanse

• interval povjerenja parametara i objašnjenje varijanse

• Interval predviđanja

27

Page 28: Metodologija II Dio 2013

Testiranje hipoteza, slučaj 1.

P.1. Testirati na nivou 5% hipotezu:

Zašto je ova hipoteza značajna za testiranje ? Dajte kritičnu vjerovatnoću testa.

Odredite interval povjerenja za koeficjent β1 sa pouzdanošću 95%.

P.2. Testirati sljedeće hipoteze uz α =5%:

i dajte kritične vjerovatnoće testa.

28

0:;0: 1110 HH

5,0:;5,0: 1110 HH

Page 29: Metodologija II Dio 2013

P.3. Izračunati: • Ukupan zbir kvadrata odstupanja TSS (total sum of square):

• Neobjašnjeno odstupanje kvadrata ili zbir kvadrata rezidualnih odstupanja RSS (residual sum of square):

• Zbir kvadrata objašnjenih odstupanja ESS (estimated sum of square), objašnjeno odstupanje:

• Izračunati koeficijent determinacije R2 i kompletirati tabelu analize varijanse. Testirati uz α=5% sljedeće hipoteze:

• Šta možete zaključiti?

29

n

t

t yy1

2)(

n

t

tt

n

t

t yye1

2

1

2 )ˆ(

n

t

t yy1

2)ˆ(

0)-ˆ(:1

2

0

n

t

t yyH 0)-ˆ(:1

2

1

n

t

t yyH

Page 30: Metodologija II Dio 2013

Odgovori:

P.1.

Prema

Odbacuje se H0 nepoznati teorijski koeficijent je značajno različit od 0.

30

0:,0: 1110 HH

2-n11 t~

ˆ1b

b

21

10 ~ˆ

0)0(:

1

n

b

tb

H

> 53,2=226.0

572,0=

ˆ=*

1

1

b

bt

228,205,0

10 t

Page 31: Metodologija II Dio 2013

Odgovori

Interval povjerenja je:

Nepoznati koeficjent β1 ima 95% vjerovatnoće da se nađe u tom intervalu.

Konstatujemo da je nula van tog intervala što je u saglasnosti sa prethodnom hipotezom i donesenom odlukom.

31

08,1;07,0

226,0228,2572,0

ˆ

ˆ

1

1

2/

211

2/

211

1

1

bn

n

b

tb

tb

Page 32: Metodologija II Dio 2013

Odgovori:

P.2.

Ne može se odbaciti nulta hipoteza to znači da nije značajno različit od 0,5

32

5,0: 10 H 5,0: 11 H

t test⇒)5,0=( 10 H2

1 ~ˆ

5,0

1

n

b

tb

32,0226,0

5,0572,0

ˆ

5,0*

1

1

b

bt

228,232,0* 05,0

10 tt

1

Page 33: Metodologija II Dio 2013

P. 3.

Ukupan zbir kvadrata odstupanja:

Rezidualni zbir kvadrata odstupanja:

Objašnjeni zbir kvadrata odstupanja:

Koeficijent determinacije:

33

67,230)(1

2

n

t

t yy

79,1401

2

n

t

te

88.89)ˆ( 2

1

yyn

t

t

389,0

)(

1

)(

)ˆ(

1

2

1

2

1

2

1

2

2

n

t

t

n

t

t

n

t

t

n

t

t

yy

e

yy

yy

R

389,0)62,0( 22

,

2 yxrR

Page 34: Metodologija II Dio 2013

P. 3.

Tabela: Analiza varijanse

34

STEPENI

SLOBODE

ZBIR

KVADRATA

SREDINA

KVADRATA

REGRESIJA 1 89,88 89,88

REZIDUAL 10 140,79 14,08

UKUPNO 11 230,67

Page 35: Metodologija II Dio 2013

Odgovori

Kako odrediti stepene slobode? Stepen slobode je jednak broju parametara koji se mogu slobodno izabrati poslije realizacije statističke ocjene.

Npr. ako je raspoloživ uzorak od 6 podataka i ako se

poznaje aritmetička sredina uzorka tada se slobodno može odabrati 5 podataka a šesti će se izračunati iz aritmetičke sredine: broj stepeni slobode je dakle (n -1).

35

Page 36: Metodologija II Dio 2013

Odgovori

Za ukupan zbir kvadrata odstupanja poznata je aritmetička sredina od Y što znači gubitak jednog stepena slobode tj. (n-1).

Za rezidualnu sumu kvadrata odstupanja potrebno je poznavati dva parametra :

što znači gubitak 2 stepena slobode (n-2).

Za objašnjenu sumu kvadrata odstupanja potrebno je poznavati b1 da bi se izračunala ESS: i

odakle slijedi broj stepeni slobode jednak je 1.

36

10 bib )( 10 ttt xbbye

tt xbby .ˆ10 xbby .10

)()ˆ( 1 xxbyy tt

Page 37: Metodologija II Dio 2013

Testiranje

F test

Ako je odbacuje se H0 što znači da je objašnjena suma kvadrata odstupanja značajno različita od 0.

Varijabla Xt objašnjava varijablu Yt .

Kritična vjerovatnoća (rizik da se pogrešno odbaci H0 je data vrijednošću vjerovatnoće α takođe

Odbacujemo nultu hipotezu jer je rizik manji od 5%.

37

0)(: 2

1

0

yyHn

t

t 0)(: 2

1

1

yyHn

t

t

38,610/79,140

1/88,89

2/)ˆ(

1/)(

*

1

2

1

2

n

t

tt

n

t

t

nyy

yy

F

05,0

2,1

*

nFF

96,410,1 c

F 03,0c

Page 38: Metodologija II Dio 2013

Analiza slučaja 2.

Cilj: Statistički testovi i poređenje koeficijenata regresije

Interesuje nas veza između ocjene iz ekonometrije i ocjene iz statistike dobivene prethodne godine za određenu grupu studenata

Model za ocjenu je

ocjena iz ekonometrije za individuu i

ocjena dobivena iz statistike prethodne godine za individuu i

parametri za ocjenu

stohastički član, greška koja zadovoljava klasične hipoteze.

38

iii xy 10

iy

ix

10 i

t

Page 39: Metodologija II Dio 2013

Rezultati ocjene modela

Uzet je uzorak 97 studenata i to 54 mladića i 43 djevojke.

39

Model 1 za mladiće Model 2 za djevojke

iii exy 3,381,0 ,1

)12,2(

54n

84,02 R

iii exy 5,109,1 ,1

)20,3(

43n

87,02 R

Page 40: Metodologija II Dio 2013

Pitanja:

P.1. Obrazložite postupak

P.2. Postoji li statistički značajna relacija između ocjene iz statistike i ocjene iz ekonometrije? Odredite kritičnu vjerovatnoću testa i komentarišite rezultat.

P.3. Za dva modela testirati

Odrediti kritičnu vjerovatnoću testa.

40

1:;1: 1110 HH

Page 41: Metodologija II Dio 2013

Odgovori - Rješenja

P.1. Modeli su specificirani u vremenskom presjeku jer su podaci prikupljeni u trenutku t za 97 individua (jedinica posmatranja). Uzorak je podijeljen na 2 podskupa (mladići i djevojke) i ocijenjena su 2 modela jer se pretpostavlja da su parametri 2 modela različiti.

P.2.

Za model 1.

Pošto je broj stepeni slobode veći od 30 Studentova distribucija se može aproksimirati normalnom. Odbacuje se nulta hipoteza što znači da postoji veza između ocjene iz ekonometrije i ocjene iz statistike u prethodnoj godini za mladiće.

41

0:;0: 1110 HH

96,112,2ˆ

* 05,0

521

1

tb

tb

Page 42: Metodologija II Dio 2013

Odgovori - Rješenja

Kritična vjerovatnoća c se dobija kao , c =0,039

Postoji rizik od 3,9% da će se napraviti greška ako se odbaci H0. Nulta hipoteza se odbacuje jer je rizik greške manji od 5%.

Za drugi model

Odbacuje se H0 kao što znači da postoji veza između ocjene iz ekonometrije i ocjene iz statistike u prethodnoj godini za djevojke.

Kritična vjerovatnoća c : odnosno c = 0,0026.

Postoji 0,26% rizika da će se pogriješiti ako se odbaci H0 .

U oba modela je pokazana statistički značajna veza i za drugi model relacija je jača jer je kritična vjerovatnoća manja.

42

12,252 c

t

96,120,3ˆ

* 05,0

411

1

tb

tb

20,341 c

t

Page 43: Metodologija II Dio 2013

Primjena Excela

43

Page 44: Metodologija II Dio 2013

Odgovori - Rješenja

P.3. Treba izračunati standardnu grešku za svaki od koeficjenata

Za model 1:

Za model 2:

44

*

11*

1

1

1

ˆb

b

b

bt

bbt

382,012,2

81,0ˆ

1b

340,020,3

09,1ˆ

2b

Page 45: Metodologija II Dio 2013

Odgovori - Rješenja

Dvostrani test

Za količnik

Za prvi model

Pošto je empirijska vrijednost negativna, nalazimo se u negativnom dijelu kritičnog regiona i vrijednost je

Prihvatamo H0 , teorijski koeficijent nije značajno različit od 1.

Kritična vjerovatnoća odnosno c =0,62.

Postoji 62% rizika da će se pogriješiti ako se odbaci H0 i zbog toga se ne odbacuje.

45

1: 10 H 1: 11 H

)1( 10 H 21 ~ˆ

1

1

n

b

tb

497,0382,0

181,0

ˆ

1*

1

1

b

bt

.497,096,105,0

53 t

1

497,053 c

t

Page 46: Metodologija II Dio 2013

Odgovori-Rješenja

Za drugi model:

H0 se prihvata, nije značajno različit od 1.

Kritična vjerovatnoća , c =0,79

79% rizik greške ako se odbaci H0 . Zbog toga prihvatamo H0

46

96,1264,034,0

109,1

ˆ

1* 05,005,0

411

1

ttb

tb

1

264,041 c

t

Page 47: Metodologija II Dio 2013

Model multiple regresije

Treba ocijeniti sljedeći model

zavisna varijabla

eksplikativne varijable čije su vrijednosti poznate

za period od 10 godina.

47

tttt xxy ,22,110

ty

tt xix ,2,1

Page 48: Metodologija II Dio 2013

Analiza slučaja 3. : Model multiple regresije

Tabela:

48

ttt xixy ,2,1,

t

1 12 7 48

2 21 9 40

3 24 11 18

4 24 12 28

5 13 7 40

6 17 9 32

7 21 12 31

8 26 14 24

9 31 19 22

10 30 21 25

tytx ,1 tx ,2

Page 49: Metodologija II Dio 2013

Analiza slučaja 3. : Model multiple regresije

P.1. Ocijeniti regresioni model.

P.2. Testirati sljedeće hipoteze uz nivo pouzdanosti 95%.

i odrediti kritičnu vjerovatnoću testa.

Komentarisati dobivene rezultate.

49

0:;0: 2110 HH

0:;0: 2120 HH

Page 50: Metodologija II Dio 2013

Primjena Excela

50

Page 51: Metodologija II Dio 2013

Primjena Excela

51

Page 52: Metodologija II Dio 2013

Primjena Excela

52

Page 53: Metodologija II Dio 2013

Odgovori - Rješenja

P.1. Ocijenjeni regresioni model je :

53

tt ebby 21 256,0902,087,18

Page 54: Metodologija II Dio 2013

Odgovori-rješenja

P.2.

i nepoznati koeficijent β1 je značajno različit od 0.

Kritična vjerovatnoća testa

Postoji 3,2 šansi na hiljadu da pogriješimo ako odbacimo H0, odbacujemo je jer je rizik da ćemo pogriješiti manji od 5%.

54

1

1

110

0

0:;0:

kn

b

i

kn

b

ii

tb

tb

HH

i

i

36,2

37,4206,0

902,0

ˆ

05.0

1

1*

1

1

kn

b

b

t

bt

0

05,0

7

*

1Hseodbacujettb

0032,037,47 ctjtc

Page 55: Metodologija II Dio 2013

Odgovori - rješenja

nalazimo se lijevo od kritične oblasti za H0

odbacuje se H0 .

Nepoznati parametar β2 je različit od nule.

Kritična vjerovatnoća

Postoji 4,3% rizika da ćemo pogriješiti ako odbacimo nultu hipotezu. Odbacujemo je jer je rizik da ćemo pogriješiti manji od 5%.

55

46,2104,0

256,0

ˆ

0:0:

2

2

2*

2120

b

b

bt

HH

36,246,2 05,0

7

*

2 ttb

043,0,46,27 cc

t

Page 56: Metodologija II Dio 2013

Odgovori-rješenja

Interval povjerenja je:

Koeficjent β1 ima 95% vjerovatnoće da se nađe u ovom intervalu. Nula je izvan ovog intervala što potvrđuje prethodni test .

56

2/

211

n

b

tb

.38,1;43,0206,0306,2902,0ˆ11

2/

21 1

bntb

Page 57: Metodologija II Dio 2013

Nastavak analize slučaja 3. : Predviđanje

Cilj: analiza varijanse, računanje koeficijenta multiple korelacije, korigovanog koeficijenta determinacije. Predviđanje i interval.

Uzeti podatke i rezultate iz vježbe 4. multipla regresija.

– P.2. Kompletirati tabelu analize varijanse

– P.3. Izračunati r,

– P.4.Testirati značajnost regresije uz rizik od 5%

– P.5. Izračunati predviđene vrijednosti Yt i interval sa 95% značajnosti za periode 11 i 12 znajući sljedeće vrijednosti:

57

RR___

,

2

Period

11 24 21

12 12 30

tx ,1 tx ,2

Page 58: Metodologija II Dio 2013

Odgovori: P.1.

TSS:

RSS:

ESS:

58

n

t

n

t

t

n

t

t yyyyyy1 1

2

1

2 )ˆ()ˆ()(

n

t

t

n

t

t

n

t

tt

n

t

t

yy

eyy

yy

1

2

1

2

1

2

1

2

43,345)ˆ(

47,31)ˆ(

9,376)(

Page 59: Metodologija II Dio 2013

Analiza varijanse

Broj stepeni slobode objašnjenog zbira kvadrata odstupanja (ESS) je jednak k kada imamo k eksplikativnih varijabli ne računajući konstantnu.

59

Stepeni slobode Zbir kvadrata Sredina kvadrata

Regresija k=2 ESS=345,43 172,72

Rezidual n-k-1=7 RSS=31,47 4,49

Ukupno n-1=9 TSS=376,9

Page 60: Metodologija II Dio 2013

Output iz Excela Analiza varijanse

60

ANOVA

df SS MS F Significance F

Regression 2 345,4314 172,7157 38,41957 0,000168182

Residual 7 31,4686 4,495514

Total 9 376,9

Page 61: Metodologija II Dio 2013

Analiza rezultata

Zašto korigovati stepene slobode? U modelu multiple regresije činjenica da se doda jedna eksplikativna varijabla čak i neznačajna ima za posljedice da smanji zbir kvadrata neobjašnjenih odstupanja i poveća zbir kvadrata objašnjenih odstupanja. Dodavanje eksplikativne varijable rezultira u povećanju koeficijenta determinacije ali i gubitkom jednog stepena slobode. Kako bi se to uzelo u obzir računa se koeficijent determinacije korigovan za stepene slobode.

61

892,0)1()1(

11

957,0

916,0

)(

1

)(

)ˆ(

2

2

1

2

1

2

1

2

1

2

2

Rkn

n

R

yy

e

yy

yy

R

R

R n

t

t

n

t

t

n

t

t

n

t

t

Page 62: Metodologija II Dio 2013

P.3.

62

0

05,0

)1(,

*

)1(,2

2

*

1

210

~

)1()1(

0:

)0...(0:

HseodbacujeFFjeAko

F

knR

kR

RSSddlRSS

ESSddlESS

F

ESSH

ESSH

knk

knk

k

Page 63: Metodologija II Dio 2013

P.3.

Odbacuje se H0 , ESS je različita od nule, varijable x1t i x2t su

eksplikativne varijable od yt.

Ograničenje F testa za globalnu značajnost regresije. U slučaju

odbacivanja ovaj test ima ograničeni značaj. On samo konstatuje da

ima najmanje jednu varijablu eksplikativna signifikantna bez drugih

indikacija.

63

74,441,38

247,31

243,345

05,0

7;2

* FF

00016818,041,387;2

C

Fc

Page 64: Metodologija II Dio 2013

P. 4. Predviđanje

64

hnhnhn xxy ,2,1 256,0902,087,18ˆ

Period x1t x2t Predviđanje

11 24 21

12 12 30

14,3521256,024902,087,18ˆ110 y

01,2230256,012902,087,18ˆ210 y

Page 65: Metodologija II Dio 2013

Analiza slučaja 4:

Cilj: Upotreba dummy varijabli, test linearnog ograničenja na koeficijente.

Podaci su prikupljeni za 364 domaćinstva i to:

- godišnja potrošnja za rekreaciju-odjeću (R-0) varijabla potrošnja u € Yi

- godišnji prihodi domaćinstava u € x1i

- mjesto stanovanja

- selo = 1, ako nije selo 0 x2i

- grad = 1, ako ne 0 x3i

- predgrađe = 1, ako ne 0 x4i

Podaci za 364 domaćinstva su predstavljeni u Excelu za Analizu slučaja 4.

65

Page 66: Metodologija II Dio 2013

P. 1. Ocijenite koeficijente sljedeća tri modela i intepretirajte rezultate.

P. 2. Za model 2. izračunati predviđanje za potrošnju rekreacija - odjeća za domaćinstvo u gradu čiji je godišnji prihod 50 000€.

66

iiiiii

iiiiii

iiiii

iiiiii

predgradseloprihodpotrošnjaModel

xxxxYModel

xxxYModel

xxxxYModel

.:

.3

.2

.1

43210

44332211

3322110

443322110

Page 67: Metodologija II Dio 2013

Odgovori - Rješenja

P.1. Traži se veza između prihoda domaćinstava i potrošnje za rekreaciju-odjeću. Mislimo da mjesto stanovanja može biti eksplikativni (objašnjavajući ) faktor potrošnje.

Kreirali smo tri varijable

selo = 1, ako ne 0

grad = 1, ako ne 0

predgrađe = 1, ako ne 0

Varijabla je - dihatomna, binarna, dummy na engleskom. To je posebna eksplikativna varijabla koja uzima vrijednost 0 ili 1.

67

Page 68: Metodologija II Dio 2013

Ocjena modela 1.

Koeficijenti modela se ne mogu ocijeniti jer postoji perfektna multikolinearnost. Zbir tri dummy varijable je jednak 1, i perfektno je koreliran sa vektorom 1 konstantnog člana. Estimatori metode najmanjih kvadrata se ne mogu utvrditi. U slučaju kvalitativnih varijabli koje imaju više modeliteta (npr. boja očiju, porodična situacija itd.) treba kodirati toliko varijabli indikatora koliko ima modeliteta manje 1.

68

Page 69: Metodologija II Dio 2013

Primjena Excela

69

Page 70: Metodologija II Dio 2013

Ocjena modela 2.

Koeficijenti su značajno različiti od 0, model je validan prema statističkim kriterijima.

U prosjeku od 100€ prihoda potrošnja za R-0 predstavlja 5,80€ (100x0,057993).

Stanovnici seoske zone troše 533,1635 € manje od prosjeka, a stanovnici grada troše 1545 € više od prosjeka.

70

Page 71: Metodologija II Dio 2013

Primjena Excela

71

Page 72: Metodologija II Dio 2013

Model.3.

U modelima 2. i 3. koeficijent uz varijablu prihod je identičan.

Stanovnici grada troše 1545 € više nego oni iz predgrađa (2487,83-942,90 = 1544,92) koji troše 533,17 € (942,90 - 409,73 = 533,17) više nego stanovnici sela.

Dobivamo koeficijente modela 2.

72

Page 73: Metodologija II Dio 2013

Primjena Excela

73

Page 74: Metodologija II Dio 2013

P. 2. Predviđanje

Za model 2 predviđanje potrošnje za R-0 za domaćinstvo koje živi u gradu i čiji je godišnji prihod 50 000€ je dobiveno sljedećim izrazom

74

euraY

Y

exxxY

i

i

iiiii

83,5387

193,1544016,533000.50058,090,942

93,154416,533058,090,942 321

Page 75: Metodologija II Dio 2013

Analiza slučaja 5. Mobilnost kapitala

Ekonomsko područje primjene: Monetarna i finansijska makroekonomija

Od 1980. godine uočava se porast liberalizacije internacionalog tržišta kapitala i ova liberalizacija je rezultirala u finansijskoj globalizaciji tj. u svjetskom tržištu kapitala.

U kontekstu liberalizacije tržišta kapitala, FELDSTEIN i HORIOKA (1980) su željeli evaluirati stepen mobilnosti internacionalnog kapitala u dugom roku na bazi analize veza između investiranja i štednje zemalja OECD.

75

Page 76: Metodologija II Dio 2013

Analiza slučaja 5. Mobilnost kapitala

Ovo pitanje je značajno jer u zavisnosti od stepena mobilnosti kapitala uticaj ekonomskih politika može biti jači ili slabiji. Npr. porezna politika u korist nacionalne štednje će imati značajniji efekat na investiranje u zemlji ukoliko je nivo mobilnosti kapitala slabiji.

U slučaju nepostojanja mobilnosti kapitala nalaze se rezultati zatvorene ekonomije, nacionalna štednja je jednaka nacionalnom investiranju i svaki porast štednje rezultira identičnim porastom investiranja.

76

Page 77: Metodologija II Dio 2013

Analiza slučaja 5. Mobilnost kapitala

• FELDSTEIN i HORIOKA su mjerili stepen mobilnosti kapitala na bazi analize između štednje i investicija. Oni su ocijenili regresioni model:

u kojem:

predstavljaju proporciju bruto investicija i štednje u BDP (GDP), stohastički član.

77

Y

S

Y

I.21

Y

Si

Y

I

Page 78: Metodologija II Dio 2013

Analiza slučaja 5. Mobilnost kapitala

• U slučaju perfektne mobilnosti kapitala, porast stope štednje u jednoj zemlji mora uzrokovati porast investicija. Granična produktivnost kapitala je opadajuća funkcija stoka kapitala što znači da će prvo imati koristi zemlje koje inicijalno imaju manje kapitala.

• U slučaju jake mobilnosti kapitala porast nacionalne (državne) štednje ne rezultira u identičnom porastu nacionalnih investicija. Ocjena blizu jedinici pokazuje da porast nacionalne štednje uzrokuje identičan porast nacionalnih investicija. Dodatna štednja ostaje u zemlji i mobilnost kapitala je slaba.

78

2

Page 79: Metodologija II Dio 2013

Prezentacija baze podataka

Podaci su publikovani u ,,Ekonomske perspektive OECD” 2000. Serija podataka o GDP, državnoj štednji, privatnoj štednji, javnoj štednji i nacionalnim investicijama su izražene u nacionalnoj valuti u tekućim cijenama, a serije izvoz, uvoz su raspoložive kao proporcija u GDP.

Na osnovu ovih podataka su izračunate stope investiranja štednje i prosječan komercijalni deficit za različite podperiode.

U dokumentu podataka dati su podaci za 19 zemalja: USA, Japan, Njemačka, Francuska, Italija, Holandija, Norveška, Portugal, Španija, Švedska, Švajcarska, Australija i Velika Britanija.

79

Page 80: Metodologija II Dio 2013

Prezentacija baze podataka

Serije su godišnji prosjeci

• txi = I/Y udio investicija u GDP

• txs = S/Y udio nacionalne štednje u GDP

• tx priv = S privatna /Y udio privatne štednje u GDP

• tx javna = S javna /Y udio javne štednje u GDP

• dc = -(X-M)/Y je udio komercijalnog deficita u GDP

Npr. txi 7098 prosječna stopa investicija u periodu 1970-1998.

80

Page 81: Metodologija II Dio 2013

Analiza slučaja 5. Mobilnost kapitala

Ocijeniti običnom metodom najmanjih kvadrata model:

txi7098i=b1+b2txs7098i+ei = 0,085+0,62txs7098i+ei Analizirajte dobiveni rezultat.

81

19,...,2,1,21

i

Y

S

Y

It

ii

iii txstxi 70987098 21

Page 82: Metodologija II Dio 2013

Analiza slučaja 5. Mobilnost kapitala

Za vježbu provjerite ocjenu sljedećeg modela i interpretirajte dobivene rezultate:

txi7098i=b1+b21txpriv7098i+b22txsjav7098i+ei= =0,067+0,71txpriv7098i+0,54txsjav7098i+ei U Excelu je prezentovana baza podataka i ocjene modela.

82

Page 83: Metodologija II Dio 2013

Primjena Excela

83

Page 84: Metodologija II Dio 2013

Primjena Excela

84

Page 85: Metodologija II Dio 2013

Analiza varijanse

• Analiza varijanse se koristi u analizi većeg broja uzoraka za utvrđivanje statističke značajnosti razlika između njihovih aritmetičkih sredina.

• Cilj analize varijanse je da utvrdi da li je varijabilitet između uzoraka (posmatranih grupa podataka) statistički značajniji od varijabiliteta u uzorku.

• U zavisnosti od broja nezavisnih varijabli koje se uključuju u analizu razlikuju se jednofaktorska ( jednostavna) i dvofaktorska (složena) analiza varijanse.

85

Page 86: Metodologija II Dio 2013

Jednofaktorska analiza varijanse

• Statističku značajnost razlika aritmetičkih sredina između dva uzorka se određuje t – testom.

• Kada je broj uzoraka veći od dva primjenjuje se jednofaktorska analiza varijanse. Nije neophodno da uzorci imaju isti broj podataka i zaključak se donosi na osnovu dobijene p vrijednosti.

86

Page 87: Metodologija II Dio 2013

Primjer 6.

U tri pogona se proizvodi isti proizvod. Ispituje se produktivnost rada mjerena utroškom vremena za proizvodnju proizvoda. Slučajnim izborom iz pogona A je izabrano 8, iz pogona B 7 i iz pogona C 9 proizvoda. Utrošeno vrijeme za proizvodnju proizvoda u minutama je dato u sljedećoj tabeli:

87

Page 88: Metodologija II Dio 2013

Analiza varijanse Primjer 6

Može li se prihvatiti

pretpostavkada ne

postoji razlika u prosječnom

utrošku vremena za proizvodnju

proizvoda u datim pogonima uz nivo signifakantnosti (značajnosti, rizika) od 5%?

88

Primjer 6 Jednofaktorska analiza varijanse

Pogon A Pogon B Pogon C

29 21 26

30 26 23

27 25 23

27 28 24

22 21 25

28 20 29

25 22 20

24 22

27

Page 89: Metodologija II Dio 2013

Primjer 6

89

Page 90: Metodologija II Dio 2013

Primjer 6

90

Page 91: Metodologija II Dio 2013

Hipoteze Primjer 6

Odgovor

• Empirijski F odnos je manji od teorijskog F odnosa pa se na

nivou rizika od 5% ne odbacuje nulta hipoteza

• p- vrijednost je 0,0974 i veća je od nivoa 5% što upućuje na prihvatanje nulte hipoteze

• Na osnovu dobivenih rezultata ne može se prihvatiti pretpostavka da je produktivnost rada u pogonima različita.

91

3210 :H

3210 :H

Page 92: Metodologija II Dio 2013

Primjer 7

• Služba za istraživanje i razvoj Pošte ispituje produktivnost rada službenika na šalterima poslovnice. Posmatrana su 4 službenika. Evidentiran je broj usluženih stranaka po satu za slučajno odabrane vremenske intervale i rezultati prikazani u tabeli.

• Testirajte hipotezu da službenici u prosjeku uslužuju jednak broj stranaka uz nivo rizika 5%. Navedite pretpostavke od kojih se polazi u ovom testu.

92

Page 93: Metodologija II Dio 2013

Primjer 7

93

Page 94: Metodologija II Dio 2013

Dvofaktorska analiza varijanse Primjer 8

Na tržište se lansira novi parfem. Glavni element marketinške strategije je dizajn proizvoda. Razvijena su tri moguća dizajna. Prije konačne odluke želi se ispitati reakcija potrošača. Proizvodi tri dizajna (A, B i C) na slučajan način su alocirani u parfimerijama približno istih karakteristika u četiri regije. U tabeli su predstavljeni podaci o sedmičnoj prodaji:

94

Page 95: Metodologija II Dio 2013

Primjer 8

95

Page 96: Metodologija II Dio 2013

Hipoteze

• Za regije:

• Za dizajn:

Odgovor

• F test: na nivou rizika od 5% odbacuje se nulta hipoteza da su prosječne prodaje u svim regijama i tri različita dizajnirana proizvoda jednake.

• Na osnovu dobivenih rezultata zaključuje se da i faktor regija i faktor dizajn utiču na prodaju parfema.

96

0:;0: 32113210 HH

0:;0: 4321143210 HH