35
Modely s kvalitatívnymi vysvetľujúcimi premennými

Modely s kvalitatívnymi vysvetľujúcimi premennými

  • Upload
    zena

  • View
    46

  • Download
    0

Embed Size (px)

DESCRIPTION

Modely s kvalitatívnymi vysvetľujúcimi premennými. Kvalitatívne premenné. Kvalitatívne premenné môžmeme „kvantifikovať“ vytvorením takzvaných umelých premenných , ktoré nadobúdajú hodnoty 0 a 1 0 indikuje absenciu sledovaného atribútu 1 indikuje prítomnosť sledovaného atribútu - PowerPoint PPT Presentation

Citation preview

Page 1: Modely s kvalitatívnymi vysvetľujúcimi premennými

Modely s kvalitatívnymi vysvetľujúcimi premennými

Page 2: Modely s kvalitatívnymi vysvetľujúcimi premennými

Kvalitatívne premenné

Kvalitatívne premenné môžmeme „kvantifikovať“ vytvorením takzvaných umelých premenných, ktoré nadobúdajú hodnoty 0 a 1 0 indikuje absenciu sledovaného atribútu 1 indikuje prítomnosť sledovaného atribútu

Napríklad premenná rozlišujúca pohlavie môže byť kvantifikovaná ako žena=1 a muž=0 alebo opačne.

Umelé premenné sú často nazývané aj kategorickými premennými alebo kvalitatívnymi premennými. Príklady: pohlavie, náboženstvo, národnosť, geografický región,

politická príslušnosť

Page 3: Modely s kvalitatívnymi vysvetľujúcimi premennými

Pasca umelých premenných (dummy variable trap) Pokiaľ model obsahuje lokujúcu konštantu a kvalitatívna premenná má

m kategórii, potom do modelu zavádzame len (m-1) umelých premenných. Napr. pohlavie má len dve kategórie takže do modelu zavedieme len jednu umelú

premennú. Je tomu tak pretože umelá premenná pri ženách nadobúda hodnotu 1 a pri

mužoch 0

Pokiaľ by sme skúmali napr. politickú príslušnosť v USA medzi Demokratmi, Republikánmi a nezávislými stranami zaviedli by sme do modelu dve umelé premenné ktoré by reprezentovali príslušnosť k trom stranám

Pokiaľ toto pravidlo nieje dodržané, dôjde k tomu čo sa niekedy nazýva aj ako pasca umelých premenných (dummy variable trap)-situácia dokonalej závislosti medzi vysvetlujúcimi premennými

Page 4: Modely s kvalitatívnymi vysvetľujúcimi premennými

Referenčná kategória

Kategória pri ktorej premenná nadobúda hodnotu 0 je často označovaná ako referenčná kategória. Všetky porovnania sú robené vo vzťahu k

referenčnej kategórii.

Pokiaľ je v modeli viac umelých premenných venujte zvýšenú pozornosť sledovaniu referenčnej kategórie, inak bude obtiažne interpretovať výsledky.

Page 5: Modely s kvalitatívnymi vysvetľujúcimi premennými

Čo si treba pamätať o umelých premenných Pokiaľ je v regresnom modeli zahrnutá lokujúca konštanta, počet

umelých premenných musí byť o jedno menej ako počet obmien kvalitatívnej premennej.

Pokiaľ je model odhadnutý bez lokujúcej konštanty, je možné do neho zahrnúť taký počet umelých premenných aký je počet kategórií kvalitatívnej premennej.

Koeficient pri umelej premennej je vždy interpretovaný vo vzťahu k referenčnej kategóri.

Umelá premenná môže byť v interakcii s kvantitatívnymi vysvetľujúcimi premennými rovnako tak ako aj s kvalitatívnymi vysvetľujúcimi premennými. Pokiaľ model obsahuje niekoľko kvalitatívnych premenných s rôznymi kategóriami, zavedenie premenných pre všetky kombinácie spotrebuje veľký počet stupňov voľnosti-

Page 6: Modely s kvalitatívnymi vysvetľujúcimi premennými

Interpretácia umelých premenných

Koeficient pri umelej premennej znamená rozdiel v lokujúcich konštantách medzi kategóriou pri ktorej sa umelá premenná rovná 1 a referenčnou kategóriou

Lokujúca konštanta z modelu s umelými premennými je konštantou kategórie ktorá je označená ako 0.

Page 7: Modely s kvalitatívnymi vysvetľujúcimi premennými

Interpretácia umelých premenných

Ak: Yi = B1 + B2 Fi

kde Y = mzda a F = umelá premenná rozlišujúca pohlaviepotom, v priemere, ženy zarábajú mzdu (B1 + B2) a zarábajú mzdu

B1. (všimnite si že B2 môže byť negatívne)

Takže ženy zarábajú o B2 viac ako muži.

Page 8: Modely s kvalitatívnymi vysvetľujúcimi premennými

Neviem štatistiku ale vôbec to nevadí, pretože aj tak nemám žiadne údaje.

Page 9: Modely s kvalitatívnymi vysvetľujúcimi premennými

Časové rady

Page 10: Modely s kvalitatívnymi vysvetľujúcimi premennými

Čo je časový rad??

Údaje o skúmanom sociálno - ekonomickom jave - chronologicky usporiadané v čase

správne zostavený časový rad údajov musí spĺňať porovnateľnosť údajov:– v čase ( za rovnako dlhé obdobia, resp.

rovnaké vzdialenosti medzi skúmaním) – v priestore ( rovnaké územné celky, regióny)– a vecnú porovnateľnosť (metodologickú,

obsahovú)

Page 11: Modely s kvalitatívnymi vysvetľujúcimi premennými

Označme hodnoty skúmaného ukazovateľa:

y1, y2 , y3 , ... yt …… yT, kde t = 1, 2, ….T,

pričom T je počet období, t je teda formálna časová premenná, ktorá udáva poradie hodnoty skúmaného ukazovateľa , napr.

Rok Yt t1995 3110 11996 3570 21997 3860 31998 3870 41999 3770 5

HNP SR na obyv.V rr.95-99 v US$

Page 12: Modely s kvalitatívnymi vysvetľujúcimi premennými

Z hľadiska dĺžky obdobia za ktoré skúmame hodnoty ukazovateľa, resp. dĺžky intervalu medzi jednotlivými skúmaniami ČR členíme na:

dlhodobé - ročné údaje, resp. päťročné

krátkodobé - kvartálne, mesačné údaje, resp. Jednodňové a pod.

12

Page 13: Modely s kvalitatívnymi vysvetľujúcimi premennými

Ak niečo skúmate takto z blízka riskujete že stratíte prehľad o celkovom kontexte

Page 14: Modely s kvalitatívnymi vysvetľujúcimi premennými

Základné charakteristiky rozboru časových radov

Absolútne miery rastu (poklesu):– absolútny prírastok (pokles) - prvé

diferencie y t = y t - y t -1

– druhé druhé diferencie (zrýchlenie)

y t 2 = y t - y t -1

14

Page 15: Modely s kvalitatívnymi vysvetľujúcimi premennými

Relatívne miery rastu

– koeficient rastu : k t = y t / y t - 1

(bezrozmerné číslo, napr. 1, 05, resp. 0.86)– koeficient prírastku : k t

= k t - 1 – tempo rastu (koef. Rastu v %):

Tt = k t . 100 , ( hovorí na koľko % vzrástol, resp. poklesol ukazovateľ, napr. 105%, alebo 86%

– tempo prírastku: T t

=Tt - 100, resp. T t = (k t - 1 ) . 100

(hovorí o koľko % vzrástol / poklesol ukazovateľ v aktuálnom období oprotí prechádzajúcemu)

15

Page 16: Modely s kvalitatívnymi vysvetľujúcimi premennými

Vývoj HNP SR za rr.95-99 v US$ na obyv. a rok.

16

Rok GNPSR (US$) koeficient koeficient tempo tempo1995 3110 rastu prirastku v % rastu prirastku v %1996 3570 1.148 114.79 0.15 14.791997 3860 1.081 108.12 0.08 8.121998 3870 1.003 100.26 0.00 0.261999 3770 0.974 97.42 -0.03 -2.58

V roku 1997 oproti r. 96 vzrástol HNP na obyv. na 108,12%

V roku 1997 oproti r. 96 vzrástol HNP na obyv. o 8,12%

Page 17: Modely s kvalitatívnymi vysvetľujúcimi premennými

Z jednotlivých koeficientov rastu možno vypočítať priemerný koeficient rastu

17

1-T 2 1-T

1 ...k . k .k k _ 4

k = (1,148.1,081. 1,003 . 0,974) = 1.0493

Za obdobie rr. 95-99 HNP v SR rástol ročne približne o 4,9%

Page 18: Modely s kvalitatívnymi vysvetľujúcimi premennými

Rozbor jednotlivých zložiek časového radu Časové rady vznikajú ako dôsledok pôsobenia

podstatných aj nepodstatných činiteľov na skúmaný sociálno ekonomický jav. Tieto činitele môžeme rozdeliť na:

trendové - vývojové, ktoré pôsobia neustále a určujú hlavný smer vývoja, t.j. trend v ČR (Tt ) periodické, ktoré spôsobujú pravidelné kolísanie hodnôt ČR okolo trendu, môžeme ich rozdeliť na

– cyklické (C t )- v dlhodobých ČR (hospodárske cykly)

– sezónne (S t )- krátkodobých ČR (sezónne kolísanie cien, sezónny dopyt…..),

18

Page 19: Modely s kvalitatívnymi vysvetľujúcimi premennými

náhodné činitele (E t ) - pôsobia náhodne, nepravidelne. Tieto činitele pôsobia na vývoj každého skúmaného ukazovateľa v štatistike

Na základe tohto rozčlenenia môžme dekomponovať - rozložiť ČR na tri zložky:

– trendovú (Tt )

– periodickú (C t ), resp. (S t ) – náhodnú (E t )

Medzi zložkami môže byť :aditívny vzťah : Yt = T t + St + Et

multiplikatívny vzťah: Yt = T t . St . Et

19

Page 20: Modely s kvalitatívnymi vysvetľujúcimi premennými

Analýza trendu v časovom rade Pri dekompozičnom prístupe je analýza trendu

založená:• na analytickom vyrovnaní vývoja hodnôt

skúmaného ukazovateľa vhodnou trendovou funkciou

ide o analógiu jednoduchej regresnej analýzy, pričom odhadované hodnoty sú funkciou časovej premennej t,

yt , = f (t)

trendová funkcia je potom použitá nielen ku hodnoteniu kvality prognózy “ex-post”, ale aj na prognózy “ex-ante”

20

Page 21: Modely s kvalitatívnymi vysvetľujúcimi premennými

21

doc. Ing . Z lata S ojko vá,CSc. 21

Niektoré typy jednoduchých trendových funkcií

t21o

't

1bo

't

t1o

't

221o

't

1o't

1o't

b . bb y

t .b y

b .b y

t.bt . bb y

tlog . bb y

t/bb y

Historické údaje Oblasť prognózy “ex-ante”

Page 22: Modely s kvalitatívnymi vysvetľujúcimi premennými

Štatistické posúdenie vhodnosti trendovej funkcie:

22

y var.celk.

TF l.var.vysvet

)yy(

)y'y( i

t2T

1tt

2T

1tt

yt

• pomocou indexu korelácie i yt , resp. • indexu determinácie iyt

2

ktoré vyjadrujú kvalitu prognózy “ex-post”

•Prioritné je však vecné posúdenie vhodnosti trendovejfunkcie, pretože je potrebné zvažovať ako sa “asi” môže skúmaný ukazovateľ v budúcich obdobiach vyvíjať

Page 23: Modely s kvalitatívnymi vysvetľujúcimi premennými

23

Analýza sezónnej zložky v časovom rade

Dekompozičný prístup predpokladá sa: multiplikatívny model ČR: Yt = Tt . St . Et

analýzu trendu v ČR (ak je prítomný) vhodnou trendovou funkciou: Tt = yt

, = f(t)

analýzu sezónnej zložky potom pomocou sezónnych indexov:

kde y t , sú hodnoty získané vyrovnaním časového

radu vhodnou trendovou funkciou pre t = 1,2…T

, y

y S

,t

tt

Page 24: Modely s kvalitatívnymi vysvetľujúcimi premennými

Postup analýzy a konštrukcie prognózy:

• Najskôr analyzujeme trend vyrovnaním časového radu vhodnou trendovou funkciou (pomocou regresnej analýzy)

• Podľa trendovej funkcie vypočítame “vyrovnané” hodnoty trendu (uskutočníme prognózu trendu aj na kvartály prognózovaného r. 1990)

• Indexy sezónnosti S t vypočítame delením skutočnej hodnoty tržieb y t hodnotou y t

‘ vypočítanou podľa trendovej funkcie

Indexy sezónnosti spriemerníme (aby sme objektivizovali sezónnu zložku a potom korigujeme na súčet 4 (korekcia na presnosť)

24

Page 25: Modely s kvalitatívnymi vysvetľujúcimi premennými

25

Rok Kvartál Tržby v tis.Sk t yt´ St = yt / yt' St priemerne St pr. korig y*1 184 1 170.141 1.0814558 1.046494 1.046400 178.036

1987 2 173 2 173.858 0.995066 0.972797 0.972709 169.1133 160 3 177.575 0.9010298 0.931975 0.931891 165.484 189 4 181.291 1.0425206 1.049093 1.048999 190.1741 191 5 185.008 1.0323869 Suma St priem. 193.593

1988 2 185 6 188.725 0.9802626 4.000359724 4 183.5753 179 7 192.442 0.9301517 Korekcny faktor: 179.3354 200 8 196.159 1.0195836 0.999910077 205.771 205 9 199.875 1.0256395 209.15

1989 2 192 10 203.592 0.9430623 198.0363 200 11 207.309 0.9647441 193.1894 229 12 211.026 1.0851762 221.3661 13 214.742 224.706

1990 2 14 218.459 212.4973 15 222.176 207.0444 16 225.893 236.961

Prognózatrendu

PrognózaY t ‘ . St priem.

Vyrovnané hodnoty trendu

Analýza sezónnosti a prognóza

Indexy sezónnosti

Výsledná Prognózatrendu a sezónnosti

Page 26: Modely s kvalitatívnymi vysvetľujúcimi premennými

Vzťah medzi množstvom prognóz a šancou že aspon jedna bude správna

Page 27: Modely s kvalitatívnymi vysvetľujúcimi premennými

Použitie umelých premenných pri sezónnych dátach

Proces odstránenia sezónnej zložky z časového radu výsledný časový rad je očistený o sezónnosť

Uvažujme nasledujúci model predikujúci tržby z predaja oblečenia:

Kde D2 =1 pre druhý kvartál, D3 =1 pre tretí kvartál, D4= 1 pre 4th kvartál Sales = reálne tržby na tisíc štvorcových stôp priestoru predajne.

1 2 2 3 3 4 4t t t t tSales A A D A D A D u

Page 28: Modely s kvalitatívnymi vysvetľujúcimi premennými

Použitie umelých premenných v sezónnych údajoch

Proces očistenia časového radu od sezónnosti je nasledujúci:1. Z odhadnutého modelu získame eohadovaný objem tržieb. 2. Odhadovaný objem tržieb odčítame od skutočných tržieb

a získame reziduá.3. K získaným reziduám pripočítame (výberovú) priemernú

hodnotu tržieb. Výsledné hodnoty sú časovým radom tržieb ktorý je očistený od sezónnosti.

Page 29: Modely s kvalitatívnymi vysvetľujúcimi premennými

FRISCH-WAUGHOV TEORÉM

Zavedením umelých premenných do modelu očistíme od sezónnosti všetky časové rady použité v danom modeli.

Ak použijeme v regresii časové rady sezónne očistených údajov, získané odhady sú rovnaké ako odhady koeficientov z regresia ktorá používa neočistené údaje ale umelé premenné pre zohľadnenie setónnosti.

Page 30: Modely s kvalitatívnymi vysvetľujúcimi premennými

Miery presnosti prognóz

Page 31: Modely s kvalitatívnymi vysvetľujúcimi premennými

Miery presnosti prognózChybou prognózy sa nazýva rozdiel:

Priemerná chyba:

Môže byť kladná alebo záporná podľa toho či prognózy častejšie podhodnocujú (yt>predikované y), alebo nadhodnocujú (yt<predikované y) skutočnosť.Táto miera sa považuje za mieru skreslenia a interpretuje sa podľa znamienka ME>0 model systematicky podhodnocuje ME<0 nadhodnocuje skutočnosť

ttt yye ˆ

n

tt

n

ttt e

nyy

nME

11

1)ˆ(

1

Page 32: Modely s kvalitatívnymi vysvetľujúcimi premennými

Priemerná absolútna chyba:

Vyjadruje priemernú absolútnu odchýlku skutočných hodnôt od odhadnutých hodnôt v rovnakých merných jednotkách v akých je vyjadrený pôvodný časový rad

Priemerná štvorcová chyba – rozptyl chýb:

-citlivé na veľké chyby

n

tt

n

ttt e

nyy

nMAE

11

1

n

t

n

tttt e

nyy

nMSE

1 1

22 1ˆ

1

Page 33: Modely s kvalitatívnymi vysvetľujúcimi premennými

Percentuálne mieryPriemerná percentuálna chyba:

Priemerná percentuálna miera skreslenia, ak je kladná znamená to že model systematicky podhonocuje skutočnosť (väčšina chýb je kladná) a naopak.

n

t

n

t t

t

t

tt

y

e

ny

yy

nMPE

1 1

%100.1

%100.)ˆ(1

Page 34: Modely s kvalitatívnymi vysvetľujúcimi premennými

Priemerná absolútna percentuálna miera chyba:

Vyjadruje v percentách priemernú veľkosť chýb prognóz v porovnaní so skutočnými hodnotami na celom úseku prognózovania, t=1,2,....,n

%100.1

%100.ˆ1

11

n

t t

tn

t t

tt

y

e

ny

yy

nMAPE

Page 35: Modely s kvalitatívnymi vysvetľujúcimi premennými

Štatistika pre testovanie hypotéz a vašej trpezlovosti ;-)