23
EKONOMETRIA PREDNÁŠKA 2 LINEÁRNY EKONOMETRICKÝ MODEL S DVOMI PREMENNÝMI 1

EKONOMETRIA PREDNÁŠKA 2

  • Upload
    ingo

  • View
    68

  • Download
    8

Embed Size (px)

DESCRIPTION

EKONOMETRIA PREDNÁŠKA 2. LINEÁRNY EKONOMETRICKÝ MODEL S DVOMI PREMENNÝMI. Obsah prednášky:. LINEÁRNY EKONOMETRICKÝ MODEL S DVOMI PREMENNÝMI 2.1 Predpoklady lineárneho ekonometrického modelu s dvomi premennými 2.2 Odhad parametrov lineárneho ekonometrického modelu s dvomi premennými - PowerPoint PPT Presentation

Citation preview

Page 1: EKONOMETRIA PREDNÁŠKA  2

EKONOMETRIA

PREDNÁŠKA 2

LINEÁRNY EKONOMETRICKÝ MODEL S DVOMI PREMENNÝMI

1

Page 2: EKONOMETRIA PREDNÁŠKA  2

LINEÁRNY EKONOMETRICKÝ MODEL S DVOMI PREMENNÝMI

2.1 Predpoklady lineárneho ekonometrického modelu s dvomi premennými 2.2 Odhad parametrov lineárneho ekonometrického modelu s dvomi premennými2.3 Štatistické vlastnosti odhadovej funkcie najmenších štvorcov

Otázky k 2. PREDNÁŠKE

Obsah prednášky:

2

Page 3: EKONOMETRIA PREDNÁŠKA  2

Najjednoduchším ekonometrickým modelom je lineárny model, v ktorom je jedna premenná Y závislá iba od jednej nezávisle premennej X a aditívnej náhodnej poruchy:

1OY X u

Pri modelovaní ekonomických vzťahov sa len málokedy stretneme s takýmto jednoduchým modelom, budeme sa ním podrobne zaoberať hlavne kvôli jeho jednoduchosti, názornosti a možnosti grafického znázornenia. Z modelu (2.1) vyplýva, že podmienená stredná hodnota endogénnej premennej Y je lineárnou funkciou exogénnej premennej X:

(2.1)

0 1E Y X X (2.2)

Zo vzťahu (2.2) je zrejmé, že s rastom premennej X rastie v priemere aj premenná Y. Označenie „ v priemere“ znamená, že niektoré pozorovania endogénnej premennej nemusia nutne rásť s rastom premennej X. Odchýlky endogénnej premennej od podmienenej strednej hodnoty t.j. od hodnoty endogénnej premennej ležiacej na skutočnej regresnej priamke, možno vyjadriť:

i i iu Y E Y X (2.3)

3

Page 4: EKONOMETRIA PREDNÁŠKA  2

4

i i iY E Y X u

kde ui je náhodná premenná, ktorá sa nazýva náhodnou poruchou, náhodnou chybou. Zo vzťahov (2.2) a (2.4) vyplýva:

(2.4)

0 1i i i i iY E Y X u X u (2.5)

Zo vzťahu (2.5) vyplýva, že i - tá hodnota endogénnej premennej Y sa rovná priemernej hodnote Y všetkých pozorovaní s hodnotou exogénnej premennej Xi plus náhodná odchýlka ui , ktorá môže mať kladnú aj zápornú hodnotu:

i i i i i i iE Y X E E Y X E u X E Y X E u X (2.6)

Zo vzťahu vyplýva že rovnica platí ako rovnosť len vtedy ak :

0i iE u X (2.7)

to znamená, že podmienená stredná hodnota náhodnej poruchy sa rovná nule, a vyplýva z predpokladu, že regresná priamka prechádza cez podmienené stredné hodnoty endogénnej premennej. O náhodnej poruche sme zatiaľ predpokladali, že vyjadruje súhrnný vplyv tých premenných, ktoré neboli do modelu z rôznych dôvodov zaradené. Mnoho z nezaradených premenných (hoci merateľných) pôsobia navzájom protichodne, takže ich výsledný efekt na endogénnu premennú, zahrnutú do náhodnej zložky je malý až zanedbateľný a nesystematický.

Page 5: EKONOMETRIA PREDNÁŠKA  2

5

V chovaní endogénnej premennej (aj pri zaradení všetkých vysvetľujúcich premenných), existuje určitá náhodnosť, ktorá sa nedá vysvetliť. Ekonometrické modeli sú v konečnom dôsledku modelmi správania ľudí v rôznych ekonomických úlohách, ako spotrebiteľov, výrobcov, investorov... . Ich správanie nie je úplne racionálne a bez zvyšku vysvetliteľné a predvídateľné. Náhodná porucha obsahuje teda vplyv všetkých nezaradených vysvetľujúcich premenných, ale aj túto „čistú“ náhodnosť v správaní ekonomických subjektov.

Page 6: EKONOMETRIA PREDNÁŠKA  2

6

2.1 Predpoklady lineárneho ekonometrického modelu s dvomi premennými Ak predpokladáme, že ekonomická hypotéza je formulovaná ekonometrickým modelom v tvare lineárneho regresného modelu, a máme k dispozícii n pozorovaní hodnôt premenných Y a X, môžeme model (2.1) prepísať do tvaru:

1i O i iY X u i = 1,2, ... , n(2.8)

Komplexná špecifikácia lineárneho regresného modelu predpokladá okrem špecifikácie lineárneho vzťahu, aj špecifikáciu rozdelenia pravdepodobnosti náhodných porúch ui, ako aj predpoklad o tom, ako sú generované hodnoty exogénnej premennej X. Tieto informácie je možné sformulovať do základných, tzv. klasických predpokladov lineárneho modelu:Predpoklad 1: Náhodné poruchy majú vo všetkých pozorovaniach nulovú strednú hodnotu:

( ) 0iE u i = 1,2, ... , n (2.9)

Predpoklad 2: Rozptyl náhodných porúch je vo všetkých pozorovaniach rovnaký (konštantný):

2 2( )iE u i = 1,2, ... , n (2.10)

Page 7: EKONOMETRIA PREDNÁŠKA  2

7

Predpoklad 3: Náhodné poruchy nie sú navzájom korelované, tz. ich kovariancie sú rovné nule

( ) 0i jE u u i = 1,2, ... , n

i j (2.11)

Predpoklad 4: Exogénna (vysvetľujúca) premenná X je nenáhodná, t.j. jej hodnoty Xi sú v opakovaných výberoch fixné, rozptyl jej hodnôt okolo priemeru je nenulový.Predpoklad 5: Náhodné poruchy majú normálne rozdelenie:

2(0, )iu N (2.12)

Splnenia týchto predpokladov zaručuje, že metódy odhadu parametrov lineárneho modelu majú určité dobré vlastnosti, ak nie sú splnené, odhady parametrov strácajú niektoré z týchto dobrých vlastností. Predpoklady 1 až 5 predstavujú požiadavky klasickej štatistiky, ktoré však v ekonometrii nemusia byť vždy splnené, pretože ekonomické dáta nie sú generované kontrolovaným experimentom. Metódy klasickej štatistiky boli vyvinuté pre účely analýzy experimentálnych dát, ktoré predpoklady 1 až 5 spĺňajú.

Page 8: EKONOMETRIA PREDNÁŠKA  2

8

Splnenie predpokladu 1 znamená, že náhodná premenná ui má vo všetkých pozorovaniach nulovú strednú hodnotu. Predpoklad 2 sa označuje ako predpoklad homoskedasticity. Podľa neho majú náhodné poruchy vo všetkých pozorovaniach rovnaký rozptyl , ktorý však nepoznáme. Lineárny model (2.8) má teda nie dva, ale tri neznáme parametre a . Variabilitu náhodných porúch je možné vypočítať:

0 1, 2

2 2var( ) ( ) ( )i i i iu E u E u E u (2.13)

V prípade porušenia tohto predpokladu (ak neplatí), náhodné poruchy nemajú konštantný rozptyl model je heteroskedastický. Heteroskedasticita je typická najmä pre prierezové dáta, u časových radov sa vyskytuje v menšej miere. Predpoklad 3 sa vzťahuje k vlastnosti náhodných porúch o ich vzájomnej neskorelovanosti, (nulovej kovariancie):

(2.14) cov( , ) ( ) ( ) ( , ) 0i j i i j j i Ju u E u E u u E u E u u Ak platí vzťah (2.14), znamená to, že pre náhodné poruchy z rôznych pozorovaní sú nezávislé. V opačnom prípade, ak vzťah (2.14) neplatí, hovoríme o sériovej korelácii náhodných porúch resp. autokorelácii. Autokorelácia (podobne ako heteroskedasticita) teda označuje situáciu, keď v správaní náhodných porúch je prítomný určitý systematický prvok.

Page 9: EKONOMETRIA PREDNÁŠKA  2

9

Posledný predpoklad 5 o normálnom rozdelení náhodných porúch, vyplýva z chyby špecifikácie vysvetľujúcich premenných a chýb merania, pričom obidve chyby sú súčtom veľkého počtu náhodných premenných, ktoré spôsobujú malé odchýlky endogénnej premennej od jej nenáhodnej časti .

Rozdelenie takto definovaných náhodných porúch vyplýva z centrálnej limitnej vety, podľa ktorej rozdelenie súčtu náhodných premenných konverguje s rastom počtu členov súčtu k normálnemu rozdeleniu. Normalita rozdelenia náhodných porúch je východiskom pre štatistickú indukciu modelu (testovanie parametrov modelu aj modelu ako celku, intervalové odhady parametrov...).

cov( , ) ( ) ( ) 0i i i i i iX u E X E X u E u

Predpoklad 4 definuje požiadavku pre vysvetľujúcu premennú, pre ktorú platí, že nie je generovaná náhodným procesom. Znamená to, že vysvetľujúca premenná je nestochastická, alebo ak aj je stochastická, nie je korelovaná s náhodnou poruchou tj.:

(2.15)

Page 10: EKONOMETRIA PREDNÁŠKA  2

10

2.2 Odhad parametrov lineárneho ekonometrického modelu s dvomi premennými

Odhady parametrov lineárneho modelu (2.1) budeme označovať . . Hodnoty skutočných parametrov nepoznáme, ale na základe náhodného výberu dvojíc pozorovaní premenných Y, X je možné ich štatisticky odhadnúť v tvare výberovej regresnej priamky

0 1,b b

0 1i iY b b X (2.16)

0 1,

Rozdiel medzi skutočnou hodnotou endogénnej premennej Yi a vyrovnanou (ležiacou na priamke) , budeme označovať ei a nazývať reziduály:iY

0 1ˆ

i i i i ie Y Y Y b b X (2.17)

Pre odhad parametrov je zrejme najdôležitejšie vybrať kritérium pre odhad výberovej regresnej priamky. Od takejto priamky očakávame, že najlepšie vyrovná (vystihne) skutočnú závislosť medzi premennými Y a X , pričom by bolo želateľné, aby každá odchýlka v procese minimalizácie bola penalizovaná úmerne k jej veľkosti. Túto vlastnosť spĺňa metóda najmenších štvorcov založená na kritériu minimalizácie súčtu štvorcov odchýlok:

Page 11: EKONOMETRIA PREDNÁŠKA  2

11

20 1

1

( )n

i ii

Y b b X

minimum (2.18)

Toto kritérium vyhovuje požiadavke, aby penalizácia väčších odchýlok bola prísnejšia ako u odchýlok menších. Ak napr. určitá odchýlka je päť krát väčšia ako iná, posudzuje sa až dvadsaťpäť krát prísnejšie. Úloha (2.18) je z matematického hľadiska hľadanie voľného extrému funkcie :

21( , )i Oe f b b (2.19)

Extrém funkcie (2.18) resp. (2.19) obvykle riešime formuláciou podmienok existencie extrému: prvé parciálne derivácie podľa neznámych parametrov položíme rovné nule t.j.:

0 10 1

10

0 10 1

11

( , )2. . 1 0

( , )2. . 0

n

i ii

n

i i ii

f b bY b b X

b

f b bY b b X X

b

(2.20)

Page 12: EKONOMETRIA PREDNÁŠKA  2

12

0 11

0 11

2 . 1 0

2 . 0

n

i ii

n

i i ii

Y b b X

Y b b X X

(2.21)

Úpravou sústavy (2.21) získame tzv. normálne rovnice metódy najmenších štvorcov:

0 11 1

20 1

1 1 1

.n n

i ii i

n n n

i i i ii i i

Y n b b X

Y X b X b X

(2.22)

Vydelením prvej rovnice počtom pozorovaní n dostaneme

0 11 1

1 1n n

i ii i

Y b b Xn n

1OY b b X (2.23)

(2.24)

Page 13: EKONOMETRIA PREDNÁŠKA  2

13

To znamená, že regresná priamka prechádza bodom so súradnicami rovnými priemerom premenných Y a X t.j. ( ).,X Y

Riešením sústavy (2.22) získame odhady parametrov lineárneho ekonometrického modelu 0 1,b b

tak, že vynásobíme prvú rovnicu a druhú rovnicu vynásobíme počtom pozorovaní n

20 1

1 1 1 1

20 1

1 1 1

. ( )

. . .

n n n n

i i i ii i i i

n n n

i i i ii i i

Y X nb X b X

n Y X n b X n b X

1

n

ii

X

a odpočítame prvú rovnicu od druhej:2

21

1 1 1 1 1

. .n n n n n

i i i i i ii i i i i

n Y X Y X b n X X

(2.25)

(2.26)

Zo vzťahu (2.26) po úprave dostaneme:

Page 14: EKONOMETRIA PREDNÁŠKA  2

14

1 1 11 2

2

1 1

.

.

n n n

i i i ii i i

n n

i ii i

n Y X Y Xb

n X X

(2.27)

Vypočítanú hodnotu parametra b1 zo vzťahu (2.27), dosadíme do rovnice (2.23), z ktorej po úprave dostaneme vzťah pre výpočet druhého parametra b0:

1 1 1 1 10 2

2 2

1 1

..

.

n n n n n

i i i i i ii i i i i

n n

i ii i

Y n X Y X Y Xb

n nn X n X

2

1 1 1 10 2

2

1 1

.

n n n n

i i i i ii i i i

n n

i ii i

X Y X X Yb

n X X

(2.28)

Page 15: EKONOMETRIA PREDNÁŠKA  2

15

2.3 Štatistické vlastnosti odhadovej funkcie najmenších štvorcov

Bodové odhady parametrov, ktoré sme získali vyššie popísaným spôsobom, sú lineárnymi funkciami pozorovaní náhodnej endogénnej premennej Y a pozorovaní fixnej exogénnej premennej X. Odhadnutá regresná priamka je len jednou z mnohých priamok, ktorými je možné preložiť korelačné pole údajov (Xi, Yi) kde i = 1, 2, ... , n.

Výsledkom metódy najmenších štvorcov sú estimátory parametrov lineárnej regresnej funkcie vo forme bodových odhadov , ktoré sa môžu od skutočných hodnôt líšiť. Je preto potrebné overiť, či estimátory majú požadované vlastnosti, ktoré musia spĺňať.

0 1, 0 1,b b

Pripomeňme si niektoré základné teoretické požiadavky štatistickej indukcie o vlastnostiach estimátorov. Predpokladajme, že odhadujeme neznámy parameter

z výberového súboru údajov 1 2, ,..., nZ Z Z a označme jeho hodnotu

1 2ˆ ( , ,..., )nf Z Z Z

Page 16: EKONOMETRIA PREDNÁŠKA  2

16

Pri posudzovaní vlastností estimátorov sa najčastejšie využívajú tieto charakteristiky:

• Stredná hodnota • Rozptyl • Výberová chyba = , vyjadruje rozdiel medzi skutočnou

hodnotou parametra a jej odhadom.

ˆ( )E 2ˆ ˆ ˆvar( ) ( )E E ˆ

• Skreslenie, t.j. rozdiel medzi strednou hodnotou estimátora a skutočnou hodnotou parametra:

• Stredná štvorcová chyba MSE (Mean Square Error), ktorá meria rozptyl

estimátora okolo skutočnej hodnoty parametra:

ˆ( )skreslenie E

2 2 2 2ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ( ) ( ) ( ) ( ) ( )MSE E E E E rozptyl skreslenie

Aby mohli byť estimátory využiteľné v ekonometrickej analýze ekonomických javov musia spĺňať určité požadované štatistické vlastnosti:

• neskreslenosť (nestrannosť, nevychýlenosť)• výdatnosť, efektívnosť• konzistentnosť• asymptotická neskreslenosť• asymptotická výdatnosť

Page 17: EKONOMETRIA PREDNÁŠKA  2

17

Neskreslenosť je základnou požiadavkou bodových odhadov, vyjadrujúcou vlastnosť, kedy stredná hodnota odhadovaného parametra sa rovná skutočnej hodnote parametra:

ˆE resp. pre parametre lineárneho modelu

0 0E b 1 1E b

Niekedy sa neskreslenosť označuje ako odhad bez systematickej chyby, kedy odhad nepodhodnocujeme ani nenadhodnocujeme. Naopak skreslené odhady sú zaťažené systematickou chybou. Samotná vlastnosť však ešte nezaručuje, že neskreslený odhad je dobrý. Je preto žiaduce, aby sme okrem skreslenosti posudzovali aj jeho rozptyl, lebo často neskreslený estimátor môže mať taký veľký rozptyl, že konkrétny odhad je príliš vzdialený od skutočnej hodnoty. Dokonca estimátor s malým skreslením a veľmi malým rozptylom by sme niekedy preferovali.

Page 18: EKONOMETRIA PREDNÁŠKA  2

18

Výdatnosť (efektívnosť) estimátora nazývame vlastnosť, kedy jeho rozptyl je menší alebo rovnaký, ako rozptyl akéhokoľvek iného neskresleného estimátora. Označme ľubovoľný nestranný estimátor , potom je výdatný estimátor ak platí:

2 2ˆ ˆ ˆˆ ˆ ˆvar var , . :tj E E E E

resp. pre parametre lineárneho modelu je možné ich variabilitu určiť:

2

0 0 0

2

1 1 1var

var b E b

b E b

2

2 10

2

1

2

12

1

var.

var

n

ii

n

ii

n

ii

Xb

n X X

bX X

Page 19: EKONOMETRIA PREDNÁŠKA  2

19

Rozptyly estimátorov b0 a b1 sú priamo úmerné rozptylu náhodných porúch a nepriamoúmerné sume štvorcov odchýlok exogénnej premennej Xi ad jej priemeru. Znamená to, že čím je menší rozptyl náhodných porúch, tým presnejšie budú odhady parametrov, naopak čím väčšia bude variabilita exogénnej premennej, tým presnejšie odhadneme parametre modelu.

Konzistentnosť je vlastnosť estimátora, kedy požadujeme aby s rastom pozorovaní , platilo pre pravdepodobnosť, že odhad sa od skutočného parametra bude líšiť, konverguje k nule, resp. pravdepodobnosť, že odhad sa od skutočného parametra líšiť nebude, konverguje k jednej. Inými slovami estimátor je konzistentný, ak jeho rozdelenie pravdepodobnosti s rastom veľkosti výberového súboru sa degeneruje do jedného bodu, ktorým je skutočný parameter .Asymptotická neskreslenosť, je vlastnosť estimátora, kedy s rastom výberu konverguje jeho stredná hodnota k skutočnému parametru t.j. platí:

n

ˆlimnE

Ak je parameter neskreslený, je aj asymptoticky neskreslený, naopak to platiť nemusí.

Page 20: EKONOMETRIA PREDNÁŠKA  2

20

Asymptoticky výdatný je estimátor ak je konzistentný, jeho asymptotické rozdelenie pravdepodobnosti má konečnú strednú hodnotu a konečný rozptyl a neexistuje žiadny iný konzistentný estimátor, ktorý má menší asymptotický rozptyl ako tento estimátor. Ak využijeme podobnú symboliku ako pri výdatnosti, musí platiť:

2 2ˆ ˆlim lim

n nE E

Lineárny regresný model má okrem parametrov aj ďalší neznámi parameter – rozptyl náhodných porúch

2

Pri jeho výpočte vyjdeme z odpočítania spriemerovanej rovnice (2.24) od pôvodnej rovnice (2.8), pričom po úprave dostaneme:

1i i iY X u u

1i i ie Y b X ak platí:

1 1i i ie b X u u

vypočítame strednú hodnotu súčtu štvorcov reziduálov z tvaru (2.31) a po úprave dostaneme:

(2.31)

(2.29)

(2.30)

Page 21: EKONOMETRIA PREDNÁŠKA  2

21

2 2 221 1 1 1

1 1 1 1

2 2 2

2

1 2

n n n n

i i i i ii i i i

E e E b X E u u E b X u u

n

2 2

1

2n

ii

E e n

2

21

2

n

ii

eEn

Na základe tohto postupu je možné odvodiť odhad rozptylu náhodných porúch pomocou neskresleného estimátora s2 :

2

2 1

2

n

ii

es

n

(2.32)

Page 22: EKONOMETRIA PREDNÁŠKA  2

22

a odhady rozptylov parametrov:

2 2

2 21 10

2 2

1 1

2 2

12 2

1 1

var .. .

var

n n

i ii i

n n

i ii i

n n

i ii i

X Xb s

n X X n X X

sb

X X X X

(2.33)

PRÍLOHA K PREDNÁŠKE 2: Príklad 2.1

Page 23: EKONOMETRIA PREDNÁŠKA  2

23

Otázky k 2. PREDNÁŠKE

1. Uveďte stručne definíciu klasických predpokladov lineárneho ekonometrického modelu.

2. Popíšte problémy nesplnenia predpokladov lineárneho ekonometrického modelu.

3. Charakterizujte odhad parametrov lineárneho ekonometrického modelu metódou najmenších štvorcov.

4. Formulujte štatistické vlastnosti odhadovej funkcie najmenších štvorcov.5. Ktoré charakteristiky sa najčastejšie používajú pri posudzovaní

vlastností estimátorov najmenších štvorcov .6. Aké vlastnosti musia spĺňať estimátory aby boli použiteľné

v ekonometrickej analýze ekonomických javov.7. Charakterizujte neskreslenosť.8. Charakterizujte výdatnosť.9. Charakterizujte konzistentnosť.10.Dokážte, že štvorcová chyba estimátora je súčtom jeho rozptylu

a štvorca jeho skreslenia.