15
Profesor Zorica Mladenovic Ekonomski fakultet, Beograd, 2020. 1 BOKS-DŽENKINSOVA STRATEGIJA MODELIRANJA Zorica Mladenović BOKS-DŽENKINSOVA STRATEGIJA MODELIRANJA Autori: Box i Jenkins, 1976 Cilj: izbor odgovarajućeg ARIMA modela koji na zadovoljavajući način opisuje kretanje konkretnog skupa podataka vremenske serije. Polazna osnova: ARIMA model Izgradnja ARIMA modela (ARIMA modeliranje) ’Modeliranje bez teorije’ ’Sofisticirana ekstrapolacija’ Box: ‚‚Svi modeli su pogrešni, samo su neki korisni” ( ) ( ) ( ) t q q t d p p e L ... L L X L L ... L L + = 2 2 1 0 2 2 1 1 1 1 1 2

BOKS-DŽENKINSOVA STRATEGIJA MODELIRANJAavs.ekof.bg.ac.rs/predavanja/2020/Boks-Dzenkinsova... · 2020. 3. 18. · BOKS-DŽENKINSOVA STRATEGIJA MODELIRANJA • Pristup se sastoji od

  • Upload
    others

  • View
    25

  • Download
    0

Embed Size (px)

Citation preview

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 1

    BOKS-DŽENKINSOVA

    STRATEGIJA MODELIRANJA

    Zorica Mladenović

    BOKS-DŽENKINSOVA

    STRATEGIJA MODELIRANJA

    • Autori: Box i Jenkins, 1976

    • Cilj: izbor odgovarajućeg ARIMA modela koji na

    zadovoljavajući način opisuje kretanje konkretnog

    skupa podataka vremenske serije.

    • Polazna osnova: ARIMA model

    • Izgradnja ARIMA modela (ARIMA modeliranje)

    – ’Modeliranje bez teorije’

    – ’Sofisticirana ekstrapolacija’

    – Box: ‚‚Svi modeli su pogrešni, samo su neki korisni”

    ( )( ) ( ) tqqtdpp eL...LLXLL...LL −−−−+=−−−−− 2210221 111

    1

    2

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 2

    BOKS-DŽENKINSOVA

    STRATEGIJA MODELIRANJA

    • Pristup se sastoji od tri faze:

    – identifikacija modela

    – ocena parametara modela i

    – provera adekvatnosti modela.

    • Iterativna procedura

    I Faza identifikacije modela

    • Potrebno je izabrati užu klasu ARIMA modela za koju pretpostavljamo da predstavlja potencijalni generator skupa podataka. Taj izbor zavisi od odgovora na sledeća pitanja:– Da li je potrebno stabilizovati varijansu vremenske

    serije?

    – Koliki je stepen integrisanosti serije, odnosno koliko je puta treba diferencirati da bi se ostvarila njena stacionarna reprezentacija?

    – Koliki je red autoregresione i komponente pokretnih sredina modela? i

    – Da li je potrebno u model uključiti slobodan član?

    3

    4

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 3

    Pitanje Metodološki okvir

    1. Da li je potrebno stabilizovati

    varijansu vremenske serije?Grafički prikaz date serije

    2. Koliki je stepen integrisanosti

    serije?(d=?) 1. Test jediničnog korena

    2. Obični i parcijalni korelogram

    polazne serije

    3. Koliki je red autoregresione i

    komponente pokretnih sredina

    modela? (p=?, q=?)

    Obični i parcijalni korelogram

    serije (koja je transformisana u

    zavisnosti od broja jediničnih

    korena)

    4. Da li je potrebno u model

    uključiti slobodan član za d=1?1. Grafički prikaz date serije

    2. SW test

    ModelObična

    autokorelaciona funkcija

    Parcijalna

    autokorelaciona funkcija

    AR(p)

    Vrednosti opadaju tokom vremena

    po eksponencijalnoj/oscilatornoj ili

    sinusoidnoj putanji

    11≠ 0, 22≠ 0,..., pp=p,kk=0 za k>p.

    Vrednosti su različite od nule samo

    za docnje koje su manje ili jednake

    redu procesa p.

    MA(q)

    r1≠ 0, r2≠ 0,..., rq≠ 0, rk=0 za k>q.

    Vrednosti opadaju tokom vremena i

    jednake su nuli za docnje veće od

    reda procesa q.

    Vrednosti opadaju tokom vremena

    po eksponencijalnoj/oscilatornoj ili

    sinusoidnoj putanji

    ARMA(p,q)

    Vrednosti opadaju tokom vremena.

    Prvih q koeficijenata je određeno

    parametrima AR i MA komponente,

    dok se za docnje veće od q

    koeficijenti ponašaju kao kod AR

    modela.

    Vrednosti opadaju tokom vremena.

    Prvih p koeficijenata je određeno

    parametrima AR i MA

    komponente. Za docnje veće od p

    koeficijenti slede putanju sličnu

    kao kod MA modela.

    5

    6

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 4

    II Faza ocene parametara modela

    • Metod običnih najmanjih kvadrata se može

    koristiti u oceni parametara AR modela.

    • Za ocenu parametara MA i ARMA modela

    koristi se metod nelinearnih najmanjih

    kvadrata koji se zasniva na upotrebi

    metoda numeričke optimizacije.

    III Faza provere

    adekvatnosti modela

    • Da li je model saglasan sa podacima?

    – Da li su reziduali normalno raspodeljeni i

    neautokorelisani?

    • Da li je izbor AR i MA komponente optimalan?

    – Da li je model istovremeno ekonomičan i dovoljno

    precizan?

    7

    8

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 5

    III-1. Analiza reziduala

    • Normalnost (histogram, JB test)

    • Autokorelacija

    – Da li postoji autokorelacije na određenoj, k-toj,

    docnji? (H0: rk=0) i

    – Da li postoji autokorelacija na svim docnjama

    do K-te? (H0: r1= r2 =...= rK =0).

    Da li postoji autokorelacije na

    određenoj, k-toj, docnji? (H0: rk=0)

    Validnost nulte hipoteze H0: rk=0 protiv

    alternativne H1: rk≠0 se testira tako što se

    proverava da li ocena autokorelacionog

    koeficijenta na docnji k serije reziduala,

    pripada intervalu (-2/√T, 2/√T).

    9

    10

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 6

    Da li postoji autokorelacija na svim

    docnjama do K-te?

    (H0: r1= r2 =...= rK =0).• Validnost nulte hipoteze H0: r1= r2 =...= rK =0 se testira protiv

    alternativne da je bar jedan od prvih K autokorelacionih koeficijenata serije reziduala različit od nule na osnovu Boks-Pirsove statistike:

    • Na uzorcima manjeg obima raspodela BP(K) statistike se ne aproksimira dovoljno precizno χ2 raspodelom u smislu da se korišćenjem standardnih kritičnih vrednosti ove raspodele potcenjuje postojanje autokorelacije.

    • Ovaj problem se prevazilazi upotrebom korigovane verzije Boks-Pirsove statistike, čiji su autori Boks i Ljung:

    =

    −−−

    +==

    K

    i

    qpKi :

    iT

    ˆ)T(T)K(BLj)K(Q

    1

    22

    2 r

    =

    −−==

    K

    1i

    2qpK

    2ii :ˆT)K(BPK,...,2,1i,T

    1,0N:ˆ rr

    Šta raditi u slučaju da autokorelacija

    postoji u rezidualima?

    • To je znak da ARIMA model nije dobro

    postavljen, odnosno da odabir objašnjavajućih

    promenljivih nije adekvatan.

    • Neophodno je redefinisati izbor AR i MA

    komponenti u skladu sa evidentiranim tipom

    (redom) autokorelacije i potom oceniti novi

    model.

    11

    12

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 7

    III-2. Optimalan izbor parametara modela

    (Informacioni kriterijum)

    Informacioni kriterijum predstavlja zbir dva elementa

    1. Element koji je funkcija neobjašnjenog

    varijabiliteta modela

    2. Element kojim se sankcioniše gubitak u broju

    stepeni slobode zbog povećanja broja

    parametara za ocenjivanje

    g je nenegativna kaznena funkcija

    s2 je ocena varijanse slučajne greške modela

    T

    qpgsln)q,p(IC

    ++= 2

    11

    Informacioni kriterijum

    • Sabirci u informacionoj funkciji različito

    reaguju na povećanje p i q:

    • Ocena varijanse sl. greške modela se smanjuje

    • Kaznena komponenta se povećava

    • Cilj: izbor kombinacije p i q koja minimizira

    vrednost informacionog kriterijuma

    T

    qpgsln)q,p(IC

    ++= 2

    13

    14

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 8

    Informacioni kriterijum (II)

    Funkcija g Kaznena

    komponenta

    Naziv Oznaka

    2 2(p+q)/T Akaikeov AIC

    lnT (lnT)(p+q)/T Švarcov SC / SIC

    2ln(lnT) 2(ln(lnT))*

    (p+q)/T

    Hana-Kvinov HQC / HQIC

    Dodatni kriterijumi u fazi

    provere adekvatnosti modela:

    1. Namerno proširenje ARIMA modela

    2. Analiza preciznosti u prognoziranju

    15

    16

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 9

    Dodatni kriterijumi u fazi

    provere adekvatnosti modela:

    1. Dodajemo AR i MA komponente da bismo

    proverili da li je model ’otporan’ na proširenje

    Modifikacija se realizuje korak po korak

    Dodatni kriterijumi u fazi provere adekvatnosti modela:

    2. Preciznost u predvidjanju

    : prognoze) greske (varijanse apokazatelj sledecih

    osnovu na modela razlicitih prognoze preciznost oProveravam 3.

    : trenucima u podatka ukupno

    za serije vremenske kretanje moPrognozira 2.

    podataka sa zakljucno model Ocenjujemo 1.

    :vrednosti

    T1,...,mm,1,2,..., :trenuci

    :T) (ukupno uzorka iz Podaci

    gmpodataka g

    )g(X̂),...,(X̂:Ocene

    X,...,X:vrednostipoznatenevarSt

    T,...,,mmg

    m

    X,...,X,X,...,X

    mm

    gmm

    Tmm

    T

    1

    21

    1

    11

    ++

    +

    =+

    ++

    +

    17

    18

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 10

    Dodatni kriterijumi u fazi provere adekvatnosti modela:

    preciznost u predvidjanju II

    ( )

    slicna) relativno modela svojstva ostala

    su da kompretpostav (pod ijuspecifikac jusuperiorni sugerisu vrednosti Manje 4.

    ( prognoze greska naprocentual apsolutna Srednja 3.3.

    ( prognoze greska apsolutna Srednja 3.2.

    ) ( prognoze greske kvadratne srednje Koren 3.1.

    : osnovu na prognoze preciznost oProveravam 3.

    = += +

    +

    =

    +

    =

    +

    −=−

    g

    j jm

    m

    g

    j jm

    mjm

    g

    j

    mjm

    g

    j

    mjm

    X

    )j(X̂

    gX

    )j(X̂X

    g

    )errorpercentapsolutemean

    )j(X̂Xg

    )errorapsolutemean

    )j(X̂Xg

    rorsquared ermeanroot

    11

    1

    2

    1

    1100100

    1

    1

    Primer: Modeliranje godišnje stope rasta BDP

    privrede Srbije (2002:1-2014:3)

    51 kvartalni podatak

    19

    20

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 11

    Identifikacija

    Testiranje prisustva jediničnog korena u

    godišnjoj stopi rasta BDP privrede Srbije

    • ADF test

    H0: Xt ~I(1), H1: Xt ~I(0)

    ADF(3)=-4.76, tk=-3.51

    -4.76

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 12

    23

    Identifikacija

    Analiza korelacione strukture godišnje stope rasta

    BDP (2002:1-2014:3), T=51 II

    Docnja Ocena parcijalnog Značajna korelacija

    (k) autokorel.koeficijenta

    • 1 0.702 DA

    • 2 0.108 NE

    • 3 0.090 NE

    • 4 -0.333 DA

    • 5 0.285 DA

    • 6 0.101 NE

    • 7 0.094 NE

    • 8 -0.051 NE

    • Interval poverenja sa verovatnoćom 0.95: [-0.274;0.274]

    Identifikacija

    Predlog modela

    • I ARIMA(5,0,0)

    • II ARIMA(0,0,3)

    23

    24

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 13

    Finalni model I:

    Redukovani ARIMA(5,0,0)

    Dependent Variable: X

    Method: Least Squares

    Sample (adjusted): 2003Q2 2014Q3

    Included observations: 46 after adjustments

    Convergence achieved after 3 iterations

    Variable Coefficient Std. Error t-Statistic Prob.

    C 0.018387 0.022495 0.817378 0.4186

    AR(1) 0.847032 0.150558 5.625936 0.0000

    AR(2) -0.047405 0.167969 -0.282223 0.7792

    AR(3) 0.341610 0.153667 2.223055 0.0319

    AR(4) -0.679710 0.164617 -4.129042 0.0002

    AR(5) 0.365372 0.148513 2.460207 0.0183

    R-squared 0.670041 Mean dependent var 0.027663

    Adjusted R-squared 0.628797 S.D. dependent var 0.039148

    S.E. of regression 0.023851 Akaike info criterion -4.512856

    Sum squared resid 0.022755 Schwarz criterion -4.274337

    Log likelihood 109.7957 Hannan-Quinn criter. -4.423505

    F-statistic 16.24547 Durbin-Watson stat 2.105793

    Prob(F-statistic) 0.000000

    Inverted AR Roots .86 .56-.47i .56+.47i -.57+.69i

    -.57-.69i

    Dependent Variable: X

    Method: Least Squares

    Sample (adjusted): 2003Q2 2014Q3

    Included observations: 46 after adjustments

    Convergence achieved after 3 iterations

    Variable Coefficient Std. Error t-Statistic Prob.

    AR(1) 0.842077 0.115149 7.312919 0.0000

    AR(3) 0.334425 0.141592 2.361901 0.0229

    AR(4) -0.671169 0.159299 -4.213257 0.0001

    AR(5) 0.374197 0.129251 2.895115 0.0060

    R-squared 0.666190 Mean dependent var 0.027663

    Adjusted R-squared 0.642346 S.D. dependent var 0.039148

    S.E. of regression 0.023412 Akaike info criterion -4.588206

    Sum squared resid 0.023021 Schwarz criterion -4.429194

    Log likelihood 109.5287 Hannan-Quinn criter. -4.528639

    Durbin-Watson stat 2.076152

    Inverted AR Roots .90 .55-.46i .55+.46i -.58+.69i

    -.58-.69i

    Finalni model I:

    Redukovani ARIMA(5,0,0)

    Inverse Roots of AR/MA Polynomial(s)

    Specification: X AR(1) AR(3) AR(4) AR(5)

    Sample: 2001Q1 2014Q3

    Included observations: 46

    AR Root(s) Modulus Cycle

    0.903349 0.903349

    -0.577638 ± 0.685834i 0.896679 2.766985

    0.547002 ± 0.464739i 0.717770 8.921584

    No root lies outside the unit circle.

    ARMA model is stationary.

    25

    26

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 14

    Finalni model II:

    ARIMA(0,0,3)

    Dependent Variable: X

    Method: Least Squares

    Included observations: 51 after adjustments

    Convergence achieved after 13 iterations

    MA Backcast: OFF

    Variable Coefficient Std. Error t-Statistic Prob.

    C 0.033696 0.009772 3.448283 0.0012

    MA(1) 0.816207 0.110067 7.415537 0.0000

    MA(2) 0.650897 0.130614 4.983350 0.0000

    MA(3) 0.671089 0.110972 6.047377 0.0000

    R-squared 0.638205 Mean dependent var 0.031539

    Adjusted R-squared 0.615111 S.D. dependent var 0.039339

    S.E. of regression 0.024406 Akaike info criterion -4.512828

    Sum squared resid 0.027995 Schwarz criterion -4.361312

    Log likelihood 119.0771 Hannan-Quinn criter. -4.454929

    F-statistic 27.63591 Durbin-Watson stat 1.935316

    Prob(F-statistic) 0.000000

    Inverted MA Roots .05-.86i .05+.86i -.91

    Inverse Roots of AR/MA Polynomial(s)

    Specification: X MA(1) MA(2) MA(3) C

    Sample: 2001Q1 2014Q3

    Included observations: 51

    MA Root(s) Modulus Cycle

    -0.910668 0.910668

    0.047231 ± 0.857140i 0.858440 4.145267

    No root lies outside the unit circle.

    ARMA model is invertible.

    Zapis modela

    ).(.JB),.(.)(Q,.s,.SC

    ).( ) . ().().(t-odn.

    ê.ê.ê.ê.X

    ).(.JB),.(.)(Q,.s,.SC

    ).( ) .(). ().(t-odn.

    êX.X.X.X.X

    ttttt

    tttttt

    68076045005580244036134

    056984427453

    670650820030

    91018051028380234042924

    902214362317

    370670330840

    321

    5431

    ===−=

    ++++=

    ===−=

    ++−+=

    −−−

    −−−−

    3)ARIMA(0,0,

    ,0) ARIMA(5,0Redukovani

    27

    28

  • Profesor Zorica Mladenovic

    Ekonomski fakultet, Beograd, 2020. 15

    Analiza preciznosti u predvidjanju

    - Ocenjeni su modeli zaključno sa 2014:1- Prognozirane su vrednosti za 2014:2-2014:3

    - Analizirana je varijansa greške prognoze

    ModelKoren srednje

    kvadratne greške

    prognoze

    Srednja apsolutna

    greška prognoze

    Srednja

    apsolutna

    procentualna

    greška prognoze

    Redukovani ARIMA(5,0,0) 0.0219 0.0172 106.18

    ARIMA(0,0,3) 0.0235 0.0194 105.92

    29