1-2bab

1

BAB 1

PENDAHULUAN

Pada dasarnya setiap nilai dari hasil pengamatan (data), selalu dapat dikaitkan dengan

waktu pengamatannya. Hanya pada saat analisisnya, kaitan variabel waktu dengan

pengamatan sering tidak dipersoalkan. Dalam hal kaitan variabel waktu dengan

pengamatan diperhatikan, sehingga data dianggap sebagai fungsi atas waktu, maka data

seperti ini dinamakan Data Deret Waktu (Time series). Banyak persoalan dalam ilmu

terapan yang datanya merupakan data deret waktu, misalnya dalam bidang ilmu

a. ekonomi : banyak barang terjual dalam setiap hari, keuntungan perusahaan dalam

setiap tahun, total nilai ekspor dalam setiap bulan,

b. fisika : curah hujan bulanan, temperatur udara harian, gerak partikel,

c. demografi : pertumbuhan penduduk, mortalitas dan natalitas,

d. pengontrolan kualitas : proses pengontrolan kualitas produk, pengontrolan proses

produksi,

e. biomedis : denyut nadi, proses penyembuhan, pertumbuhan mikroba.

Karena data deret waktu merupakan regresi data atas waktu, dan salah satu segi

(aspect) pada data deret waktu adalah terlibatnya sebuah besaran yang dinamakan

Autokorelasi (autocorrelation), yang konsepsinya sama dengan korelasi untuk data

bivariat, dalam analisis regresi biasa. Signifikansi (keberartian) autokorelasi menentukan

analisis regresi yang harus dilakukan pada data deret waktu. Jika autokorelasi tidak

signifikans (dalam kata lain data deret waktu tidak berautokorelasi), maka analisis regresi

yang harus dilakukan adalah analisis regresi sederhana biasa, yaitu analisis regresi data

atas waktu. Sedangkan jika signifikans (berautokorelasi) harus dilakukan analisis

regresi data deret waktu, yaitu analisis regresi antar nilai pengamatan. Segi lain dalam

data deret waktu adalah kestasioneran data yang diklasifikasikan atas stasioner kuat

(stasioner orde pertama, strickly stationer) dan stasioner lemah (stasioner orde dua,

weakly stationer), dan kestasioner ini merupakan kondisi yang diperlukan dalam analisis

data deret waktu, karena akan memperkecil kekeliruan baku.

2

Dalam teori Statistika, setiap data deret waktu dibangun atas komponen trend (T),

siklis (S), musiman (M, untuk data bulanan), dan variasi residu (R). Bentuk hubungan

antara nilai data dengan komponen-komponennya tersebut bisa bermacam-macam, dan

bentuk hubungan yang sering digunakan adalah linier dan multiplikatif. Jika xt nilai data

pada waktu-t dan hubungan dengan komponennya linier, maka persamaannya

xt = Tt + St + Mt + Rt , jika t : bulanan (1.1)

xt = Tt + St + Rt , jika t : tahunan (1.2)

dan multiplikatif, maka persamaannya

xt = T.S.M.R , jika t : bulanan (1.3)

xt = T.S.R , jika t : tahunan (1.4)

Sebagai akibat dari terdapatnya komponen-komponen dalam data deret waktu dan

terjadinya hubungan antar komponen, adalah berautokorelasinya antar pengamatan

sehingga dapat dibangun sebuah hubungan fungsional yang dinamakan regresi deret

waktu.

1.1. Regresi Deret Waktu

Analisis data deret waktu merupakan telaahan khusus dari analisis regresi biasa,

seperti halnya analisis ekonometrika dan analisis disain eksperimen. Analisis regresi

deret waktu adalah analisis regresi dalam kondisi variabel respon berautokorelasi,

sehingga antar variabel respon dapat dibangun sebuah hubungan fungsional, yang dalam

analisis data deret waktu bentuk hubungannya selalu digunakan regresi linier.

Konsepsi analisis regresi linier biasa dapat digunakan secara utuh dalam analisis

regresi deret waktu, hanya proses perhitungan nilai penaksir parameternya tidak selalu

bisa dijadikan acuan. Dalam analisis regresi linier biasa, proses perhitungan taksiran

parameter selalu dapat dilakukan dengan menggunakan perhitungan matriks, sebab

sistem persamaan parameternya selalu merupakan sistem persamaan linier. Sedangkan

dalam analisis regresi deret waktu, ada beberapa model yang perhitungan taksiran

parameternya harus menggunakan metoda iterasi atau rekursif, sehingga sebagian besar

persoalan analisis regresi deret waktu harus diselesaikan dengan menggunakan fasilitas

komputer.

3

Dalam analisis data deret waktu, jika pengamatan berautokorelasi maka model

hubungan fungsionalnya dibangun berdasarkan kondisi kestasioner data, sehingga model

regresi deret waktu dikelompokan atas regresi deret waktu stasioner dan regresi deret

waktu tidak stasioner. Model regresi deret waktu tidak stasioner identik dengan model

regresi deret waktu stasioner, yang terlebih dulu data distasionerkan melalui proses

diferensi. Jika data deret waktu Xt , t = 1, 2, . . . berautokorelasi maka model regresi

antar pengamatan (autoregresi) disajikan dalam persamaan

Xt = µ + γ1Xt-1 + γ2Xt-2 + . . . + γkXt-k + Zt (1.5)

dengan Zt kekeliruan model yang diasumsikan berdistribusi identik independen dengan

rata 0 dan varians konstan σ2, yang dalam analisis data deret waktu Zt biasa disebut white

noise, µ , γ1 , . . . , γk parameter autoregresi.

Model autoregresi dengan Persamaan (1.5) dinamakan Autoregresi Lag-k dan disingkat

AR(k).

Dalam analisis data deret waktu, untuk menyajikan Xt-i , i = 1, 2 , . . . , k biasa

digunakan operator backshift B, dengan menuliskan Xt-i = BiXt, sehingga model AR(k)

jika disajikan dalam operator backshift maka persamaannya menjadi

Xt = µ + γ1BXt + γ2B2Xt + . . . + γkBkXt + Zt (1.6)

atau

Xt - γ1BXt - γ2B2Xt - . . . - γkBkXt = µ + Zt

Γk(B)Xt = µ + Zt

dengan Γk(B) = 1 - γ1B - γ2B2 - . . . - γkBk

Karena Γk(B) ≠ 0, secara matematis persamaan Γk(B)Xt = µ + Zt setara dengan

tkk

t Z)B(

1)B(

XΓ

+Γ

µ=

Xt = Γk-1(B)µ + Γk

-1(B)Zt = θ + Γk-1(B)Zt (1.7)

sehingga jika didefinisikan Γk-1(B) = Ψp(B) = 1 - ψ1B - ψ2B2 - . . . - ψpBp maka

Persamaan (1.7) menjadi

Xt = θ + Ψp(B)Zt = θ + Zt - ψ1Zt-1 - ψ2Zt-2 - . . . - ψpZt-p (1.8)

Model dengan Persamaan (1.8) dinamakan model rata-rata bergerak (moving average)

orde-p disingkat MA(p). Jadi dalam hal ini model MA(p) merupakan model inversi dari

4

AR(k), yang berarti model AR(k) dan MA(p) merupakan model yang saling berkebalikan

(invertible)

Model AR(k) dan MA(p) merupakan model regresi deret waktu stasioner dan saling

berkebalikan, sehingga keduanya dapat digabungkan dengan cara dijumlahkan, dan

model yang diperoleh dinamakan model autoregresi rata-rata bergerak, disingkat

ARMA(k,p), dengan persamaan

Xt = η + γ1Xt-1 + γ2Xt-2 + . . . + γkXt-k + Zt - ψ1Zt-1 - ψ2Zt-2 - . . . -ψpZt-p (1.9)

atau

Xt - γ1Xt-1 - γ2Xt-2 - . . . - γkXt-k = η + Zt - ψ1Zt-1 - ψ2Zt-2 - . . . -ψpZt-p

Γk(B)Xt = η + Ψp(B)Zt

Karena AR(k) dan MA(p) adalah mode regresi deret waktu stasioner, maka ARMA(k,p)

juga model regresi deret waktu stasioner.

Jika data tidak stasioner, maka dapat distasionerkan melalui proses stasioneritas, yang

berupa proses diferensi jika trendnya linier, dan proses linieritas dengan proses diferensi

pada data hasil proses linieritas, jika trend data tidak linier. Model ARMA(k,p) untuk

data hasil proses diferensi dinamakan model autoregresi integrated rata-rata bergerak

disingkat ARIMA(k,q,p).

1.2. Proses Analisis Untuk Data Deret Waktu.

Dalam analisis data deret waktu, proses baku yang harus dilakukan adalah

1. Memetakan nilai data atas waktu, hal ini dilakukan untuk menelaah kestasioneran

data, sebab jika data tidak stasioner maka harus distasionerkan melalui proses

stasioneritas.

2. Menggambarkan korelogram (gambar fungsi autokorelasi), untuk menelaah apakah

autokorelasi signifikans atau tidak, dan perlu-tidaknya proses diferensi dilakukan.

Jika autokorelasi data tidak signifikans, analisis data cukup menggunakan analisis

regresi sederhana data atas waktu, sedangkan jika signifikans harus menggunakan

analisis regresi deret waktu. Jika data ditransformasikan, maka proses pemetaan data

dan penggambaran korelogram, sebaiknya dilakukan juga pada data hasil

5

transformasi, untuk menelaah apakah proses transformasi ini sudah cukup baik dalam

upaya menstasioner kan data.

3. Jika dari korelogram disimpulkan bahwa autokorelasi signifikans, maka bangun

model regresi deret waktunya, dan lakukan penaksirannya baik dalam kawasan waktu

maupun kawasan frekuensi.

4. Lakukan proses peramalan dengan metode yang sesuai dengan kondisi datanya, dan

untuk mendapatkan hasil yang memuaskan sebaiknya gunakan metode Box-Jenkins .

Semua proses tersebut dapat dilakukan dengan mengunakan kemasan program (software)

komputer, dan telah banyak kemasan program yang dapat digunakan diantaranya SPSS

dan STATISCA.

1.3. Sasaran Analisis Data Deret Waktu

Ada beberapa tujuan dalam analisis data deret waktu, yaitu

1.3.1. Deskripsi (description)

Jika ingin mempresentasikan karakter dari data yang dimiliki, seperti kestasioneran,

keberadaan komponen musiman, keberartian autokorelasi (sebab pada dasarnya setiap

data deret waktu berautokorelasi hanya autokorelasinya signifikans atau tidak ?), maka

tahap pertama dari analisis data deret waktu adalah menggambarkan peta data dan

korelogram, yang tujuannya,

1.3.1.1. gambar peta data atas waktu untuk menelaah kestasioneran dan keberaadaan

komponen musiman (jika datanya bulanan), dan

1.3.1.2. gambar korelogram untuk menelaah signifikansi autokorelasi dan perlu-tidaknya

transformasi data,

sehingga berdasarkan informasi visual tersebut dapat dirumuskan mengenai analisis data

yang harus dilakukan, yaitu analisis regresi sederhana data atas waktu, atau analisis

regresi deret waktu.

1.3.2. Menerangkan (explanation)

Jika variabel data deret waktu lebih dari satu buah, maka telaahan dilakukan untuk

menentukan apakah salah satu variabel dapat menjelaskan variabel lain, sehingga bisa

dibangun sebuah model regresi (fungsi transfer) untuk keperluan analisis data deret

6

waktu lebih lanjut ? Sebab pada dasarnya analisis data deret waktu adalah analisis data

univariat, sehingga jika datanya bivariat atau multivariat, maka bagaimana proses

univariatisasinya ?

1.3.3. Perkiraan (prediction)

Jika dimiliki sampel data deret waktu, dan diinginkan perkiraan nilai data berikutnya,

maka proses peramalan harus dilakukan. Peramalan adalah sasaran utama dari analisis

data deret waktu, yang prosesnya bisa berdasarkan karakter dari komponen data, atau

model regresi deret waktu. Pengertian perkiraan (prediction) dan peramalan

(forecasting) beberapa penulis ada yang membedakannya, sebab mereka berpendapat

perkiraan adalah penaksiran (estimation) nilai data dengan tidak memperhatikan model

hubungan (regresi) antar nilai data, tetapi peramalan adalah proses penaksiran nilai data

berdasarkan sebuah model hubungan fungsional antar nilai data. Tetapi kebanyakan

penulis berpendapat perkiraan dengan peramalan adalah dua proses analisis data yang

sama. Dalam buku ajar ini perkiraan bisa diidentikan dengan peramalan.

1.3.4. Kontrol (control)

Proses kontrol dilakukan untuk menelaah apakah model (regresi) ramalan (perkiraan)

yang ditentukan cukup baik untuk digunakan ? Dalam statistika, sebuah model baik

digunakan untuk peramalan, jika dipenuhi modelnya cocok dan asumsinya juga dipenuhi.

Sehingga proses kontrol terhadap model perlu dilakukan untuk menelaah dipenuhi-

tidaknya asumsi, kecocokan bentuk model yang dibangun, ada-tidaknya pencilan

(outliers), yang analisisnya dapat dilakukan berdasarkan karakter nilai residu atau analisis

varians.

Untuk bisa memahami dengan baik mengenai analisis data deret waktu, diperlukan

pemahaman mengenai analisis regresi biasa, sebab analisis data deret waktu adalah

analisis khusus dari analisis regresi biasa, yaitu analisis regresi dalam hal data responnya

berautokorelasi, sehingga konsepsi pada analisis regresi biasa berlaku dalam analisis

regresi deret waktu, tetapi belum tentu untuk sebaliknya.

7

BAB 2

ANALISIS DALAM KAWASAN WAKTU

Sudah dikemukakan pada Bab 1 bahwa data deret waktu adalah data yang merupakan

fungsi atas waktu, dan setiap data deret waktu dibangun oleh komponen trend, siklis,

musiman (untuk data bulanan), dan variasi residu. Sehingga berdasarkan konsepsi

tersebut, analisis data deret waktu dapat dilakukan dalam dua kawasan (domain), yaitu

kawasan waktu dan kawasan frekuensi. Dalam kawasan waktu adalah telaah signifikansi

autokorelasi, kestasioneran data, penaksiran parameter model regresi deret waktu, dan

peramalan (forecasting). Sedangkan dalam kawasan frekuensi adalah telaahan frekuensi

tersembunyi, yaitu frekuensi komponen siklis yang sulit diperoleh dalam kawasan waktu,

dengan tujuan untuk mengetahui hal-hal istimewa atau kondisi tertentu pada data.

Analisis dalam kawasan frekuensi dinamakan Analisis Spektral, dan analisis ini

dilakukan untuk memberikan informasi tambahan pada hasil analisis dalam kawasan

waktu.

2.1. Autokorelasi dan Autokorelasi Parsial

Konsepsi autokorelasi setara (identik) dengan korelasi Pearson untuk data bivariat.

Deskripsinya sebagai berikut, jika dimiliki sampel data deret waktu x1 , x2 , . . . , xn , dan

dapat dibangun pasangan nilai (x1 , xk+1) , (x2 , xk+2) , . . . , (xk , xn) , autokorelasilasi

lag-k, dari sampel data deret waktu adalah

( )( )

( ) ( )��

�−

=

−

=

−

=+

+

−−

−−==

kn

1t

2i

kn

1t

21t

kn

1t

2kt1t

kttk

xxxx

xxxx)X,X.(korr (2.1)

�=

=k

1tt1 x

k1

x , �+=

=n

1ktt2 x

k1

x

Dalam analisis data deret waktu untuk mendapatkan hasil yang baik, nilai n harus cukup

besar, dan autokorelasi disebut berarti jika nilai k cukup kecil dibandingkan dengan n,

sehingga bisa dianggap

8

n

xxxx

n

1tt

21

�==≈≈

dan Persamaan (2.1) menjadi

( )( )

( )�

�

=

−

=+

−

−−≈ n

1t

2t

kn

1tktt

k

xx

xxxxr

dan perumusan autokorelasi seperti ini yang digunakan dalam analisis data deret waktu.

Karena rk merupakan fungsi atas k, maka hubungan autokorelasi dengan lagnya

dinamakan Fungsi Autokorelasi (autocorrelation function, ACF), dan dinotasikan oleh

( )( )

( )�

�

=

−

=+

−

−−=ρ n

1t

2t

kn

1tktt

xx

xxxx)k( (2.2)

Konsepsi lain pada autokorelasi adalah autokorelasi parsial (partial autocorrelation),

yaitu korelasi antara Xt dengan Xt+k, dengan mengabaikan ketidak-bebasan Xt+1 , Xt+2 , . .

. , Xt+k-1, sehingga Xt dianggap sebagai konstanta, Xt = xt , t = t+1 , t+2 , . . . , t+k-1 .

Autokorelasi parsial Xt dengan Xt+k didefinisikan sebagai korelasi bersyarat,

ρkk = kor.(Xt,Xt+kXt+1 = xt+1 , Xt+2 = xt+2 , . . . , Xt+k-1 = xt+k-1) (2.3)

Seperti halnya autokorelasi yang merupakan fungsi atas lagnya, yang hubungannya

dinamakan fungsi autokorelasi (ACF), autokorelasi parsial juga merupakan fungsi atas

lagnya, dan hubungannya dinamakan Fungsi Autokorelasi Parsial (partial

autocorrelation function, PACF). Gambar dari ACF dan PACF dinamakan korelogram

(correlogram) dan dapat digunakan untuk menelaah signifikansi autokorelasi dan

kestasioneran data. Jika gambar ACF membangun sebuah histogram yang menurun (pola

eksponensial), maka autokorelasi signifikans atau data berautokorelasi, dan jika diikuti

oleh gambar PACF yang histogramnya langsung terpotong pada lag-2, maka data tidak

stasioner, dan dapat distasionerkan melalui proses diferensi.

Jika dimiliki sampel data deret waktu, x1 , x2 , . . . , xn , maka yang harus dihitung

untuk mendapatkan autokorelasi sampel lag-k secara “manual” adalah,

9

1. rata-rata sampel, �=

=n

1ttx

n1

x

2. autokovarians sampel lag-k, ( )( )�−

=+ −−

−=

kn

1tkttk xxxx

kn1

s

3. autokorelasi sampel lag-k, 0

kk s

sr =

Sedangkan untuk menghitung autokorelasi parsial sampel lag-k, adalah sebagai berikut

1. bangun kombinasi linier Xt+k dengan Xt+k-1 = xt+k-1 , Xt+k-2 = xt+k-2 , . . . , Xt+1 = xt+1,

dengan persamaan

Xt+k = β1xt+k-1 + β2xt+k-2 + . . . + βk-1xt+1 , βi , 1 ≤ i ≤ k-1 , koefisien model.

2. lakukan proses penaksiran untuk βi , berdasarkan metode kuadrat rata-rata hitung,

yaitu meminimumkan E(Xt+k - β1xt+k-1 - β2xt+k-2 - . . . - βk-1xt+1), dengan asumsi

E(Xt) = 0. Proses minimisasi dilakukan dengan menggunakan perhitungan

diferensiasi biasa, sehingga jika ri , 1ki1 −≤≤ , autokorelasi sampel lag-i , maka

penaksir βi , ∧β , diperoleh berdasarkan persamaan matriks

��

�

�

��

�

�

β

β

β

��

�

�

��

�

�

=

��

�

�

��

�

�

−

∧

∧

∧

−−−

−−

−−

−1k

2

1

14k3k2k

3k4k11

2k3k21

1k

2

1

.

.

.

1r...rrr..................

rr...r1rrr...rr1

r...

rr

Dengan menggunakan metode Cramer, jika dinotasikan

��

�

�

��

�

�

=

−−−

−−

−−

1r...rrr..................

rr...r1rrr...rr1

m

14k3k2k

3k4k11

2k3k21

,

��

�

�

��

�

�

=

−1k

2

1

r...

rr

r

dan

10

��

�

�

��

�

�

=

−−−−−−

−−−−−−−

−−

−−

−−

1...rrr...rrr...rrr...rr........................

r...rr...1rrr...rr...r1rr...rrr...r1

m

2ik1kik3k2k

3ik2k1ik4k3k

4k2i312

3k1i211

2ki12i1

i

yaitu matriks yang diperoleh dari m dengan mengganti kolom ke-i oleh r ,

maka m

m ii =β

∧, dengan mi dan m masing-masing determinan dari mi dan m,

Berdasarkan Persamaan (2.3), maka autokorelasi parsial populasi dihitung berdasarkan

persamaan

��

��

� −��

��

� −

��

��

� −��

��

� −=ρ

+∧

+

∧

+∧

+

∧

ktkttt

ktkttt

kk

XX.varXX.var

XXXX.kov

sehingga autokorelasi parsial sampel, dihitung berdasarkan persamaan

( )

( )′��

��

� β−β−

′��

��

� β−β−=

β−−β−

β−−β−=

−

∧∧

−

∧∧

−−

∧∧−

∧

−

∧

1k11-k1

1k111-kk

1k1k11

11k1k1kkk

...1r . . . r 1

...1r . . . r r

r...r1

r...rrr (2.4)

Persamaan (2.4) jika dikaitkan dengan nilai-nilai i

∧β yang dihitung berdasarkan

perhitungan determinan matriks, maka sajian dalam persamaan determinannya

11

1r...rrr..................

rr...r1rrr...rr1rr...rrr..................

rr...r1rrr...rr1

r

11k2k1k

2k3k11

1k2k21

k13k2k1k

23k11

12k21

kk

−−−

−−

−−

−−−

−

−

=

Menghitung autokorelasi parsial antara Xt dengan Xt+k dapat juga dilakukan sebagai

berikut. Bangun model regresi linier tanpa konstanta dengan Xt+k sebagai variabel tidak

bebas dan Xt+k-1 , Xt+k-2 , . . . , Xt sebagai variabel bebas,

Xt+k = φk1Xt+k-1 + φk2Xt+k-2 + . . . + φkkXt + εt+k

φki , i = 1, 2, . . . , k , parameter model ;

εt+k kekeliruan yang diasumsikan berdistribusi normal identik independen dengan rata-

rata 0, varians konstan σ2, dan tidak berkorelasi dengan Xt+k-i , i = 1, 2, . . . ,k ;

Dengan tidak mengabaikan keumuman, diasumsikan E(Xt+k) = 0 untuk setiap t dan k.

Selanjutnya perkalikan Xt+k-i dengan persamaan regresi

γi = φk1γi-1 + φk2γi-2 + φkkγi-k

untuk setiap i = 1, 2, . . . , k, dan hitung nilai ekspetasinya, yang hasilnya akan

membangun sebuah sistem persamaan linier

ρi = φk1ρi-1 + φk2ρi-2 + φkkρi-k , i = 1, 2, . . . , k

dengan menggunakan metode Cramer, maka akan diperoleh jawab

φ11 = ρ1

12

11

1

1

1

21

1

22

ρρρρρ

=φ

11

1

11

22

11

21

311

21

11

33

ρρρρρρρρρρρρρ

=φ

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

1...1...

.....................1...1...1......

.....................1...1...1

13k2k1k

14k3k2k

3k4k32

2k3k11

1k2k21

k13k2k1k

1k24k3k2k

34k32

23k11

12k21

kk

ρρρρρρρρ

ρρρρρρρρρρρρρρρρρ

ρρρρρ

ρρρρρρρρρρρρ

=φ

−−−

−−−

−−

−−

−−

−−−

−−−−

−

−

−

Sehingga jika ρi ditaksir oleh i

∧ρ = ri (autokorelasi sampel), maka φii ditaksir oleh

kkii

∧∧ρ=φ = rii (autokorelasi parsial sampel), i = 1, 2, . . . , k. Berdasarkan paparan

mengenai kedua konsepsi perhitungan autokorelasi parsial tersebut, dapat disimpulkan

autokorelasi parsial antara Xt dengan Xt+k adalah penaksir koefisien regresi ke-k, dari

model regresi dengan persamaan

13

Xt+k = φk1Xt+k-1 + φk2Xt+k-2 + . . . + φkkXt + εt+k

kkkkkk r=ρ=φ∧∧

Untuk menghitung autokorelasi dan autokorelasi parsial banyak kemasan program

(software) komputer yang dapat digunakan, seperti SPSS, MINITAB, dan STATISTICA,

sehingga jika para pengguna analisis data deret waktu tidak memahami konsepsi

perhitungan dan pembuatan program komputer untuk perhitungannya, bisa menggunakan

salah satu kemasan program tersebut untuk keperluan analisisnya.

Contoh numerik :

Perhatikan data pada Tabel 2.1 di bawah ini

Tabel 2.1 Data Volume Penjualan

(dalam ribuan unit)

Tahun Bulan 1990 1991 1992 1993 1994 1995 1996

Januari 12,35 10,12 9,25 2,75 5,80 12,25 10,85 Pebruari 9,78 8,75 5,45 10,19 11,09 8,75 7,50 Maret 10,25 19,75 5,89 4,35 7,00 8,00 12,67 April 2,75 25,30 5,55 30,25 12,20 6,75 29,77 Mei 25,24 12,10 10,25 5,25 11,20 30,45 12,20 Juni 20,25 30,00 6,75 5,25 5,00 10,25 12,25 Juli 11,25 10,25 10,00 30,25 2,75 30,30 12,25 Agustus 12,20 10,35 30,33 12,25 10,00 10,50 12,25 September 20,25 25,05 12,33 8,75 7,75 5,55 4,25 Oktober 10,00 12,25 30,25 24,20 20,10 12,25 5,75 Nopember 8,75 9,90 10,25 25,22 2,57 5,75 7,50 Desember 10,80 8,90 9,25 5,50 4,75 10,25 10,00

Jika autokorelasi dan autokorelasi parsial dihitung dengan menggunakan paket program

SPSS untuk 16 lag yang pertama (default-nya proram) diperoleh hasil seperti dibawah in.

MODEL: MOD_1. Autocorrelations: NILAI Auto- Stand. Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob. +----+----+----+----+----+----+----+----+ 1 -.012 .107 . * . .014 .907 2 .039 .107 . I* . .149 .928 3 .116 .106 . I** . 1.356 .716 4 -.094 .105 . **I . 2.161 .706 5 -.232 .105 *.***I . 7.084 .214 6 -.036 .104 . *I . 7.204 .302 7 -.103 .103 . **I . 8.204 .315

14

8 -.151 .103 .***I . 10.364 .240 9 .100 .102 I** . 11.323 .254 10 -.073 .101 *I . 11.844 .296 11 .155 .101 I***. 14.227 .221 12 .022 .100 . * . 14.276 .283 13 .044 .099 . I* . 14.476 .341 14 -.027 .098 . *I . 14.553 .409 15 .031 .098 . I* . 14.655 .477 16 -.080 .097 . **I . 15.331 .501 Plot Symbols: Autocorrelations * Two Standard Error Limits . Total cases: 84 Computable first lags: 83 Partial Autocorrelations: NILAI Pr-Aut- Stand. Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 +----+----+----+----+----+----+----+----+ 1 -.012 .109 . * . 2 .039 .109 . I* . 3 .117 .109 . I** . 4 -.094 .109 . **I . 5 -.249 .109 *.***I . 6 -.055 .109 . *I . 7 -.062 .109 . *I . 8 -.112 .109 . **I . 9 .071 .109 . I* . 10 -.109 .109 . **I . 11 .150 .109 . I***. 12 -.051 .109 . *I . 13 -.001 .109 . * . 14 -.060 .109 . *I . 15 .002 .109 . * . 16 -.029 .109 . *I . Plot Symbols: Autocorrelations * Two Standard Error Limits . Total cases: 84 Computable first lags: 83

dan gambar ACF dengan PACF-nya seperti di bawah di bawah ini

16151413121110987654321

Lag Number

1.0

0.5

0.0

-0.5

-1.0

AC

F

Lower ConfidenceLimit

Upper ConfidenceLimit

Coefficient

Nilai

Gambar 2.1a ACF Nilai Data Pada Tabel 2.1

16151413121110987654321

Lag Number

1.0

0.5

0.0

-0.5

-1.0

Part

ial A

CF



Coefficient

Nilai

Gambar 2.1b

PACF Nilai Data Pada Tabel 2.1

15

Jika ditelaah, gambar ACF dan PACF keduanya membangun pola alternating (tanda

dan nilai autokorelasi berubah secara acak sesuai dengan berjalannya nilai lag), hal ini

mengindikasikan data tidak stasioner dalam varians, dan stasioner lemah dalam rata-rata

hitung. Sedangkan signifikansi autokorelasi kemungkinannya lemah (nilai lagnya cukup

besar jika dibandingkan dengan ukuran sampelnya)

Jika hasil telaahan secara “visual” tidak cukup menyakinkan, maka dapat dilakukan

pengujian hipotesis statistis untuk keberartian autokorelasi.

2.2. Stasioneritas

Kestasioneran data merupakan kondisi yang diperlukan dalam analisis regresi deret

waktu karena dapat memperkecil kekeliruan model, sehingga jika data tidak stasioner,

maka harus dilakukan transformasi stasioneritas melalui proses diferensi, jika trendnya

linier, sedangkan jika tidak linier, maka transformasinya harus dilakukan dulu

transformasi linieritas trend melalui proses logaritma natural jika trendnya eksponensial,

dan proses pembobotan (penghalusan eksponensial sederhana) jika bentuknya yang lain,

yang selanjutnya proses diferensi pada data hasil proses linieritas.

Berdasarkan deskripsinya, bentuk kestasioneran ada dua, yaitu stasioner kuat

(strickly stationer), atau stasioner orde pertama (primary stationer) dan stasioner

lemah (weakly stationer), atau stasioner orde kedua (secondary stationer). Deskripsi

umum kestasioneran adalah sebagai berikut, data deret X1 , X2 , . . . disebut stasioner kuat

jika distribusi gabungan n21 ttt X, . . . , X , X sama dengan distribusi gabungan

ktktkt n21X, . . . , X , X +++ , untuk setiap nilai t1, t2, . . . , tn dan k. Sedangkan disebut

stasioner lemah, jika rata-rata hitung data konstan, E(Xt) = µ, dan autokovariansnya

merupakan fungsi dari lag, ρk = f(k). Sedangkan ketidakstasioner data diklasifikasikan

atas tiga bentuk yaitu

1. tidak stasioner dalam rata-rata hitung, jika trend tidak datar (tidak sejajar sumbu

waktu) dan data tersebar pada “pita” yang meliput secara seimbang trendnya.

16

2. tidak stasioner dalam varians, jika trend datar atau hampir datar tapi data tersebar

membangun pola melebar atau menyempit yang meliput secara seimbang trendnya

(pola terompet).

3. tidak stasioner dalam rata-rata hitung dan varians, jika trend tidak datar dan data

membangun pola terompet.

Untuk menelaah ketidak-stasioneran data secara visual, tahap pertama dapat

dilakukan pada peta data atas waktu, karena biasanya “mudah”, dan jika belum

mendapatkan kejelasan, maka tahap berikutnya ditelaah pada gambar ACF dengan

PACF. Telaahan pada gambar ACF, jika data tidak stasioner maka gambarnya akan

membangun pola,

1. menurun, jika data tidak stasioner dalam rata-rata hitung (trend naik atau turun),

2. alternating, jika data tidak stasioner dalam varians,

3. gelombang, jika data tidak stasioner dalam rata-rata hitung dan varians.

Gambar-gambar di bawah ini menyajikan kasus data tidak stasioner dan bentuk ACF-nya

276

271

266

261

256

251

246

241

236

231

226

221

216

211

206

201

196

191

186

181

176

171

166

161

156

151

146

141

136

131

126

121

116

111

106

101

96

91

86

81

76

71

66

61

56

51

46

41

36

31

26

21

16

11

61

Case Number

0.600

0.500

0.400

0.300

0.200

0.100

0.000

Val

ue c

rest

Gambar 2.2a Data tidak stasioner dalam rata-rata hitung

16151413121110987654321

Lag Number

1.0

0.5

0.0

-0.5

-1.0

AC

F



Coefficient

crest

Gambar 2.2b ACF dari Gambar 2.2a

17

CREST

Lag Number

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

Par

tial A

CF

1.0

.5

0.0

-.5

-1.0

Confidence Limits

Coefficient

Gambar 2.2c

PACF dari Gambar 2.2a

216

211

206

201

196

191

186

181

176

171

166

161

156

151

146

141

136

131

126

121

116

111

106

101

96

91

86

81

76

71

66

61

56

51

46

41

36

31

26

21

16

11

61

Case Number

40000

30000

20000

10000

Val

ue c

onne

ct

Gambar 2.2d Data tidak stasioner dalam rata-rata

hitung dan varians

16151413121110987654321

Lag Number

1.0

0.5

0.0

-0.5

-1.0

AC

F



Coefficient

connect

Gambar 2.2e ACF dari Gambar 2.2d

CONNECT

Lag Number

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

Par

tial A

CF

1.0

.5

0.0

-.5

-1.0

Confidence Limits

Coefficient

Gambar 2.2f

PACF dari Gambar 2.2d

119

117

115

113

111

109

107

105

103

101

99

97

95

93

91

89

87

85

83

81

79

77

75

73

71

69

67

65

63

61

59

57

55

53

51

49

47

45

43

41

39

37

35

33

31

29

27

25

23

21

19

17

15

13

11

97531

Case Number

80.0

70.0

60.0

50.0

40.0

30.0

20.0

10.0

Val

ue o

zone

Gambar 2.2g Data tidak stasioner dalam varians

16151413121110987654321

Lag Number

1.0

0.5

0.0

-0.5

-1.0

ACF



Coefficient

ozone

Gambar 2.2h ACF dari Gambar 2.2g

18

OZONE

Lag Number

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

Par

tial A

CF

1.0

.5

0.0

-.5

-1.0

Confidence Limits

Coefficient

Gambar 2.2i

PACF dari Gambar 2.2g

Untuk ilustrasi perhatikan data pada Tabel 2.1. Jika digambarkan, peta data atas

waktu gambarnya seperti di bawah ini

WAKTU

SEP 1996

APR 1996

NOV 1995

JUN 1995

JAN 1995

AUG 1994

MAR 1994

OCT 1993

MAY 1993

DEC 1992

JUL 1992

FEB 1992

SEP 1991

APR 1991

NOV 1990

JUN 1990

JAN 1990

Val

ue N

ILA

I

40

30

20

10

0

Gambar 2.3

Peta data pada Tabel 2.1

Gambar 2.3 terlihat identik dengan Gambar 2.2e, menyajikan pola trend yang hampir

mendatar (sejajar sumbu waktu) dan variasi data terletak pada sebuah “pita yang meliput

tidak seimbang” trend data, hal ini mengindikasikan bahwa data stasioner lemah dalam

rata-rata hitung, tapi tidak stasioner dalam varians. Ketidak stasioneran dalam varians

jelas terlihat pada gambar ACF dan PACF-nya (Gambar 2.1a dan 2.1b), yang keduanya

menyajikan pola hampir alternating. Untuk lebih memperjelas pendapat tersebut,

perhatikan gambar-gambar hasil diferensi orde-1 dari data pada Tabel 2.1 berikut ini.

19

WAKTU

SEP 1996

APR 1996

NOV 1995

JUN 1995

JAN 1995

AUG 1994

MAR 1994

OCT 1993

MAY 1993

DEC 1992

JUL 1992

FEB 1992

SEP 1991

APR 1991

NOV 1990

JUN 1990

JAN 1990

Val

ue D

IFF(

NIL

AI,1

)

30

20

10

0

-10

-20

-30

Gambar 2.4

Peta data pada Tabel 2.1 hasil diferensi orde-1

DIFF(NILAI,1)

Lag Number

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

AC

F

1.0

.5

0.0

-.5

-1.0

Confidence Limits

Coefficient

Gambar 2.5a ACF data pada Tabel 2.1 hasil diferensi

orde-1

DIFF(NILAI,1)

Lag Number

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

Par

tial A

CF

1.0

.5

0.0

-.5

-1.0

Confidence Limits

Coefficient

Gambar 2.5b PACF data pada Tabel 2.1 hasil diferensi

orde-1

Gambar 2.4 menyajikan pola data dengan trend mendatar dan pola “terompet di sisi kiri

dan kanan”, hal ini berarti dengan didiferensi orde-1 data yang tadinya stasioner lemah

dalam rata-rata hitung menjadi stasioner kuat dalam rata-rata hitung. Selanjutnya dari

gambar ACF (Gambar 2.5a) yang membangun pola alternating dan PACF (Gambar 2.5b)

pola “hampir gelombang”, hal ini menunjukan bahwa proses diferensi belum bisa

menstabilkan varians, tetapi tidak perlu dilakukan lagi (cukup orde-1), yang harus

dilakukan adalah transformasi stabilitas varians.

20

Seperti halnya dengan telaahan keberatian autokorelasi, jika telaahan ketidak

stasioneran secara “visual” kurang meyakinkan, maka pengujian hipotesis statistis untuk

kestasioneran data perlu dilakukan.

2.3. Model Regresi Deret Waktu

Jika data deret waktu berautokorelasi pada lag-k, maka selanjutnya membangun

model hubungan fungsional antar pengamatan (model regresi deret waktu, model

autoregresi), dan pada Bab 1 sudah dikemukakan model regresi deret waktu dari data

yang berautokorelasi pada lag-k, dinamakan model autoregresi order-k (lag-k), ditulis

AR(k), yang persamaannya

Xt = µ + γ1Xt-1 + γ2Xt-2 + γkXt-k + Zt

dengan Zt kekeliruan yang diasumsikan berdistribusi normal identik independen dengan

rata 0 dan varians konstan σ2, dan dalam analisis data deret waktu Zt dinamakan proses

acak atau white noise, µ , γ1 , . . . , γk parameter autoregresi.

Untuk menentukan nilai taksiran parameter model berdasarkan sampel data deret

waktu, x1 , x2 , . . . , x2, prosesnya seperti pada analisis regresi multipel biasa, sebab

model AR(k) setara dengan model regresi multipel biasa atas k variabel bebas, yang

dalam regresi deret waktu sebagai variabel bebasnya adalah, Xt-1 , Xt-2 , . . . , Xt-k dan

variabel tidak bebasnya Xt, sehingga langkah-langkah perhitungan secara “manual”

sebagai berikut,

1. bangun pasangan pengamatan, (Xt , Xt-1 , . . . , Xt-k) dan sajikan pada tabel seperti di

bawah ini

Xt Xt-1 . . . Xt-k

xn xn-1 . . . xn-k

xn-1 xn-2 . . . xn-1-k

. . . .

. . . .

. . . . xk+1 xk . . . x1

21

2. bangun matriks

��

�

�

��

�

�

=

+

−

1k

1n

n

x...

xx

Y ,

��

�

�

��

�

�

=

−

−−−−

−−−

11kk

k1n3n2n

kn2n1n

x......xx1..................

x......xx1x......xx1

X ,

��

�

�

��

�

�

γ

γµ

=β

k

1

.

.

.

3. hitung XX′ , ( ) 1XX −′ , dan YX′

4. sehingga penaksir β , ( ) YXXX 1 ′′=β −∧

Misal untuk model AR(1), dengan persamaan

Xt = µ + γXt-1 + Zt , t = 1 , 2 , . . . , n (2.4)

Pada persamaan ini

��

�

�

��

�

�

=

−

2

1n

n

x...

xx

Y ,

��

�

�

��

�

�

=

−

−

1

2n

1n

x1......

x1x1

X , ��

��

�

γµ

=β ,

��

�

�

��

�

� −=′

��

�−

=

−

=

−

=1n

1t

2t

1n

1tt

1n

1tt

xx

x)1n(XX

( )��

�

�

��

�

�

−−

−

��

��

�−−

=′�

��

��−

=

−

=

−

=

−

=

−

=

−

)1n(x

xx

xx)1n(

1XX 1n

1tt

1n

1tt

1n

1t

2t

21n

1tt

1n

1t

2t

1 ,

��

�

�

��

�

�

=′�

�

=−

=n

2tt1t

n

2tt

xx

xYX

sehingga

��

�

�

��

�

�

−+−

−

��

��

�−−

=��

�

�

��

�

�

γ

µ=β��

��

�� =−

=

−

=

=−

−

==

−

=

−

=

−

=

∧

∧∧

n

2tt1t

n

2tt

1n

1tt

n

2tt1t

1n

1tt

n

2tt

1n

1t

2t

21n

1tt

1n

1t

2t

xx)1n(xx

xxxxx

xx)1n(

1

atau

22

21n

1tt

1n

1t

2t

n

2tt1t

1n

1tt

n

2tt

1n

1t

2t

xx)1n(

xxxxx

��

��

�−−

−=µ

��

��−

=

−

=

=−

−

==

−

=∧

, 21n

1tt

1n

1t

2t

n

2tt1t

n

2tt

1n

1tt

xx)1n(

xx)1n(xx

��

��

�−−

−+−=γ

��

��−

=

−

=

=−

=

−

=∧

Contoh numerik

Jika data pada Tabel 2.1 modelnya AR(1) dengan Persamaan (2.4), maka

Y : vektor berukuran 83x1, dengan elemen-elemennya nilai data dari bulan Pebruari

1990 sampai dengan Desember 1996

X : matriks berukuran 83x2, dengan elemen-elemen kolom ke-1 semuanya sama dengan

1, dan kolom ke-2 nilai data dari bulan Januari 1990 sampai dengan Nopember 1996

sehingga jika dihitung dengan menggunakan paket program MINITAB, diperoleh hasil

( ) ��

��

�=′

17710.9 1033.821033.8 84.00

XX , ( ) ��

��

�=′ −

0.0002005 0.0024678-0.0024678- 0.0422766

XX 1 , ��

��

�=′

12537.71021.5

YX

��

��

�=β

∧

0.0125-12.4611

atau ∧µ = 12,4611 , 1

∧γ = -0,0125 , dan model ramalannya

tX∧

= 12,4611 – 0,0125Xt-1

Untuk menghitung model ramalan ini dapat juga digunakan paket program SPSS

yang hasilnya akan lebih baik, karena ada sajian analisis variansnya. Misalnya untuk

data pada Tabel 2.1, jika dianggap modelnya AR(1) dengan Persamaan (2.4) dan

dianalisis dengan paket program SPSS, diperoleh hasil sebagai berikut,

>Warning # 16445 >Since there is no seasonal component in the model, the seasonality of the >data will be ignored. MODEL: MOD_1 Model Description: Variable: NILAI Regressors: NONE Non-seasonal differencing: 0 No seasonal component in model. Parameters: AR1 ________ < value originating from estimation > CONSTANT ________ < value originating from estimation > 95.00 percent confidence intervals will be generated. Split group number: 1 Series length: 84

23

No missing data. Melard's algorithm will be used for estimation. Termination criteria: Parameter epsilon: .001 Maximum Marquardt constant: 1.00E+09 SSQ Percentage: .001 Maximum number of iterations: 10 Initial values: AR1 -.01249 CONSTANT 12.30771 Marquardt constant = .001 Adjusted sum of squares = 4986.4749 Conclusion of estimation phase. Estimation terminated at iteration number 1 because: Sum of squares decreased by less than .001 percent. FINAL PARAMETERS: Number of residuals 84 Standard error 7.7981124 Log likelihood -290.71697 AIC 585.43394 SBC 590.29558 Analysis of Variance: DF Adj. Sum of Squares Residual Variance Residuals 82 4986.4748 60.810558 Variables in the Model: B SEB T-RATIO APPROX. PROB. AR1 -.012357 .11048249 -.111841 .91122242 CONSTANT 12.307710 .84058082 14.641912 .00000000 Covariance Matrix: AR1 AR1 .01220638 Correlation Matrix: AR1 AR1 1.0000000 Regressor Covariance Matrix: CONSTANT CONSTANT .70657612 Regressor Correlation Matrix: CONSTANT CONSTANT 1.0000000

Dari hasil perhitungan diperoleh taksiran µ dan γ, masing-masing∧µ = 12,307710 dan

∧γ = -0,012357, dengan kekeliruan baku (simpangan baku kekeliruan, std error) model,

se = 7,7981124, dan kekeliruan baku regresi, sγ = 0,11048249. Jika melihat nilai mutlak

T-RATIO, T-RATIO = -0,111841 = 0,111841 , yang jika dibandingkan dengan

nilai kritisnya untuk taraf signifikans, α = 0,05 (sesuai dengan defaultnya SPSS), derajat

bebas, DF = 82, nilainya antara 1,29 dengan 1,30 (1,29 < T-TABEL <1,30), maka

24

T-RATIO < T-TABEL, yang berarti model AR(1) tidak signifikans untuk digunakan

sebagai model ramalan. Untuk lebih jelas dapat dilihat peta nilai data dengan nilai

ramalannya untuk model AR(1) di bawah ini

WAKTU

SEP 1996

APR 1996

NOV 1995

JUN 1995

JAN 1995

AUG 1994

MAR 1994

OCT 1993

MAY 1993

DEC 1992

JUL 1992

FEB 1992

SEP 1991

APR 1991

NOV 1990

JUN 1990

JAN 1990

Val

ue

40

30

20

10

0

NILAI

Fit for NILAI from A

RIMA, MOD_2 CON

Gambar 2.6 Peta data pada Tabel 2.1 dengan nilai ramalannya

berdasarkan model AR(1) dengan konstanta

Dari Gambar 2.6 terlihat perbedaan yang mencolok antara peta nilai aktual yang

berupa gambar spektrum dengan peta nilai ramalan yang hampir mendatar. Ketidak

berartian model AR(1) dengan konstanta untuk data Pada Tabel 2.1, kemungkinannya

karena data tidak stasioner dalam varians, sebab seperti sudah dikemukan, analisis regresi

deret waktu dilakukan jika data stasioner, sehingga transformasi stabilisasi varians harus

dilakukan dulu sebelum membangun model regresi deret waktu.

Pada Bab 1 juga sudah dikemukakan, model AR(k) memiliki model kebalikan yaitu

model rata-rata bergerak, MA(p), dengan persamaan

Xt = θ + Ψ(B)Zt = θ + Zt - ψ1Zt-1 - ψ2Zt-2 - . . . - ψpZt-p

θ , ψ1 , ψ2 , . . . , ψp parameter regresi.

Tidak seperti pada model AR(k) yang penaksiran parameternya dapat dilakukan seperti

pada analisis regresi multipel biasa, penaksiran parameter dalam model MA(p) harus

dilakukan dengan metode iterasi, yang proses perhitungannya harus menggunakan

fasilitas komputer beserta bahasa pemogramannya. Misal untuk model MA(1),

Xt = θ + Zt + ψZt (2.5)

25

untuk menentukan taksiran θ dan ψ, berdasarkan sampel data deret waktu x1 , x2 , . . . , xn

prosesnya sebagai berikut :

x1 = θ + z1 + ψz0 = θ + z1 �

z1 = x1 - θ

x2 = θ + z2 + ψz1 = θ + z2 + ψ(x1 - θ) �

z2 = x2 - θ - ψ(x1 - θ) = x2 - ψx1 + (ψ - 1)θ

x3 = θ + z3 + ψz2 = θ + z3 + ψ{x2 - ψx1 + (ψ - 1)θ} �

z3 = x3 - θ - ψ{x2 - ψx1 + (ψ - 1)θ} = x3 - ψx2 + ψ2x1 + {ψ(ψ - 1) – 1}θ

= x3 - ψx2 + ψ2x1 + (ψ2 - ψ - 1)θ

…………………………………………………………………………..

………………………………………………………………………….

………………………………………………………………………….

xn = θ + zn + ψzn-1

= θ + zn + ψ[xn-1 - ψxn-2 + . . . +(-1)i+1ψi-1xn-i + . . . +(-1)nψn-2x1 + {ψn-2 - ψn-3 + . . . +

(-1)i-1ψn-i-1 + . . . + (-1)n-2ψ –1}θ] �

zn = xn - ψxn-1 + ψ2xn-2 - . . . -(-1)i+1ψixn-i + . . . +(-1)nψn-1x1 + (ψn-1 - ψn-2 + . . . +

(-1)iψn-i + . . . + (-1)n-1ψ –1}θ]

selanjutnya bangun jumlah kuadrat �=

=n

1i

2izJ dan perhitungan diferensiasi 0

J =θ∂

∂ ,

0J =ψ∂

∂ , yang akan menghasilkan sebuah sistem persamaan tidak linier atas θ dan ψ,

sehingga penyelesaiannya harus menggunakan fasilitas komputer, dengan menggunakan

program buatan atau paket seperti SPSS, STATISTICA atau MINITAB.

Contoh numerik

Sudah dikemukan bahwa data pada Tabel 2.1 jika modelnya AR(1) tidak cukup baik

dan signifikans sebagai model ramalan, maka bagaimana jika modelnya MA(1) dengan

Persamaan (2.5) ? Dengan menggunakan paket program SPSS diperoleh hasil

>Warning # 16445 >Since there is no seasonal component in the model, the seasonality of the >data will be ignored. MODEL: MOD_1

26

Model Description: Variable: NILAI Regressors: NONE Non-seasonal differencing: 0 No seasonal component in model. Parameters: MA1 ________ < value originating from estimation > CONSTANT ________ < value originating from estimation > 95.00 percent confidence intervals will be generated. Split group number: 1 Series length: 84 No missing data. Melard's algorithm will be used for estimation. Termination criteria: Parameter epsilon: .001 Maximum Marquardt constant: 1.00E+09 SSQ Percentage: .001 Maximum number of iterations: 10 Initial values: MA1 .01249 CONSTANT 12.30773 Marquardt constant = .001 Adjusted sum of squares = 4986.5381 Conclusion of estimation phase. Estimation terminated at iteration number 1 because: Sum of squares decreased by less than .001 percent. FINAL PARAMETERS: Number of residuals 84 Standard error 7.7981582 Log likelihood -290.71745 AIC 585.43491 SBC 590.29654 Analysis of Variance: DF Adj. Sum of Squares Residual Variance Residuals 82 4986.5319 60.811272

Variables in the Model: B SEB T-RATIO APPROX. PROB. MA1 .011329 .11049041 .102533 .91858376 CONSTANT 12.307698 .84132438 14.628957 .00000000 Covariance Matrix: MA1 MA1 .01220813 Correlation Matrix: MA1 MA1 1.0000000 Regressor Covariance Matrix: CONSTANT CONSTANT .70782671 Regressor Correlation Matrix: CONSTANT CONSTANT 1.0000000

27

Dari hasil perhitungan diperoleh ∧θ = 12,307698 dan

∧ψ = 0,01220813 , sehingga model

MA(1)-nya adalah

tX∧

= 12,307698 + Zt + 0,01220813Zt-1

dengan kekeliruan baku model, sε = 7,981582, dan kekeliruan baku regresi,

sψ = 0,11049041, tetapi model ini tidak cukup signifikans karena

T-RATIO = 0,102533= 0,102533 lebih kecil dari nilai kritisnya (sudah

dikemukakan nilainya antara 1,29 dengan 1,30). Untuk lebih jelas dapat ditelaah dari

gambar peta data dengan nilai ramalan berdasarkan model MA(1) di bawah ini.

WAKTU

SEP 1996

APR 1996

NOV 1995

JUN 1995

JAN 1995

AUG 1994

MAR 1994

OCT 1993

MAY 1993

DEC 1992

JUL 1992

FEB 1992

SEP 1991

APR 1991

NOV 1990

JUN 1990

JAN 1990

Val

ue

40

30

20

10

0

NILAI


RIMA, MOD_3 CON

Gambar 2.7 Peta data pada Tabel 2.1 dengan ramalannya berdasarkan model MA(1) dengan konstanta

Sajian Gambar 2.7 ini identik dengan Gambar 2.6, berarti model MA(1) dan AR(1)

dengan konstanta tidak cukup baik dijadikan model ramalan, dan seperti sudah

dikemukakan hal kemungkinannya karena data tersebut tidak stasioner dalam varians.

Model AR(k) dan MA(p) adalah model-model stasioner (model untuk data yang

stasioner dalam rata-rata hitung dan varians) dan berkebalikan, sehingga kedua model ini

dapat digabungkan dengan cara dijumlahkan menjadi model ARMA(k,p) dengan

persamaan

Xt = η + γ1Xt-1 + γ2Xt-2 + . . . + γkXt-k + Zt - ψ1Zt-1 - ψ2Zt-2 - . . . - ψpZt-p

28

Seperti halnya pada model MA(p), penaksiran parameter model, η , γ1 , γ2 , . . . , γk , ψ1 ,

ψ2 , . . . , ψp harus dilakukan dengan proses iterasi.

Contoh numerik

Untuk data pada Tabel 2.1 jika modelnya AR(1) atau MA(1) tidak cukup baik jika

digunakan sebagai model ramalan, maka bagaimana jika kedua model itu digabungkan

sehingga menjadi model ARMA(1,1) ?

Dari perhitungan dengan menggunakan paket program SPSS diperoleh hasil sebagai

berikut

>Warning # 16445 >Since there is no seasonal component in the model, the seasonality of the >data will be ignored. MODEL: MOD_4 Model Description: Variable: NILAI Regressors: NONE Non-seasonal differencing: 0 No seasonal component in model. Parameters: AR1 ________ < value originating from estimation > MA1 ________ < value originating from estimation > CONSTANT ________ < value originating from estimation > 95.00 percent confidence intervals will be generated. Split group number: 1 Series length: 84 No missing data. Melard's algorithm will be used for estimation. Termination criteria: Parameter epsilon: .001 Maximum Marquardt constant: 1.00E+09 SSQ Percentage: .001 Maximum number of iterations: 10 Initial values: AR1 -.98613 MA1 -.97410 CONSTANT 12.30677 Marquardt constant = .001 Adjusted sum of squares = 5029.3661 Iteration History: Iteration Adj. Sum of Squares Marquardt Constant 1 4978.3456 .0010000 2 4968.8609 .0001000 3 4963.1842 .0000100 4 4958.5226 1.0000000 Conclusion of estimation phase. Estimation terminated at iteration number 5 because:

29

All parameter estimates changed by less than .001 FINAL PARAMETERS: Number of residuals 84 Standard error 7.8026009 Log likelihood -290.48741 AIC 586.97482 SBC 594.26727 Analysis of Variance: DF Adj. Sum of Squares Residual Variance Residuals 81 4958.3794 60.880580 Variables in the Model: B SEB T-RATIO APPROX. PROB. AR1 -.973643 .14755992 -6.598292 .00000000 MA1 -.995934 .31112205 -3.201104 .00195633 CONSTANT 12.308017 .86091338 14.296464 .00000000 Covariance Matrix: AR1 MA1 AR1 .02177393 .04426428 MA1 .04426428 .09679693 Correlation Matrix: AR1 MA1 AR1 1.0000000 .9641714 MA1 .9641714 1.0000000 Regressor Covariance Matrix: CONSTANT CONSTANT .74117185 Regressor Correlation Matrix: CONSTANT CONSTANT 1.0000000 >Warning # 16567. Command name: ARIMA >Our tests have determined that the estimated model lies close to the >boundary of the invertibility region. Although the moving average >parameters are probably correctly estimated, their standard errors and >covariances should be considered suspect. Dari hasil perhitungan diperoleh persamaan ARMA(1,1) untuk data pada Tabel 2.1

adalah

tX∧

= 12.308017 − 0,973643 Xt-1 + Zt − 0,995934 Zt-1

dan jika memperhatikan nilai |T-RATIO| untuk koefisien AR(1) dan MA(1) yang

keduanya lebih besar dari nilai kritisnya, maka model ARMA(1,1) cukup berarti untuk

menjadi model ramalan, tetapi tidak cukup baik sebab kekeliruan residunya masih besar

yaitu sama dengan 7,8026009. Untuk lebih jelas dapat ditelaah dari gambar peta data

nilai aktual dengan nilai ramalan dengan model ARMA(1,1) di bawah ini

30

WAKTU

SEP 1996

APR 1996

NOV 1995

JUN 1995

JAN 1995

AUG 1994

MAR 1994

OCT 1993

MAY 1993

DEC 1992

JUL 1992

FEB 1992

SEP 1991

APR 1991

NOV 1990

JUN 1990

JAN 1990

Val

ue

40

30

20

10

0

NILAI


RIMA, MOD_4 CON

Gambar 2.8 Peta nilai data pada Tabel 2.1 dengan nilai ramalannya

berdasarkan model ARMA(1,1) dengan konstanta

Gambar 2.8 ini identik dengan Gambar 2.7 dan 2.6, yang berarti model ARMA(1,1)

dengan konstanta juga belum cukup berarti sebagai model ramalan.

Dalam hal data tidak stasioner, proses stasioneritas harus dilakukan dulu sebelum

analisis regresi deret waktu. Proses stasioneritas dilakukan bergantung pada kondisi

ketidak-stasionerannya, jika data tidak stasioner dalam

1. rata-rata hitung (trend tidak sejajar sumbu waktu), dengan trendnya linier, maka

proses stasioneritas adalah proses diferensi, sedangkan jika tidak linier maka proses

linieritas trend harus dilakukan dulu sebelum proses diferensi.

2. varians, maka proses stasioneritasnya adalah transformasi stabilisasi varians.

3. rata-rata hitung dan varians, maka transformasi stabilisasi varians harus dilakukan

lebih dulu, dan proses diferensi dilakukan pada data hasil transformasi jika trendnya

linier, sedangkan jika tidak linier maka proses linieritas harus dilakukan sebelum

proses diferensi. Proses diferensi dan linieritas dilakukan pada data hasil

transformasi.

Misalkan X1 , X2 , . . . , data deret waktu dengan trendnya linier. Jika dilakukan

proses diferensi dengan orde-q, Yt = (1 – B)qXt, sehingga Y1 , Y2 , . . . merupakan data

deret waktu stasioner, maka model ARMA(k,p) pada Yt

Yt = η + γ1Yt-1 + γ2 Yt-2 + . . . + γkYt-k + Zt + ψ1Zt-1 + ψ2Zt-2 + . . . + ψpZt-p (2.6)

dinamakan model ARIMA(k,q,p) untuk Xt.

31

Model ARIMA(k,q,p) merupakan model umum dari regresi deret waktu., sebab

ARIMA(k,0,0) sama dengan AR(k), ARIMA(0,0,p) sama dengan MA(p), dan

ARIMA(k,0,p) sama dengan ARMA(k,p).

Contoh numerik

Jika melihat gambar peta data pada Tabel 2.1 (Gambar 2.3) yang menyajikan sebuah

kondisi stasioner lemah dalam rata-rata hitung, dan hasil perhitungan untuk membangun

model AR(1), MA(1) dan ARMA(1,1), yang menyimpulkan model AR(1) dan MA(1)

tidak cukup signifikans dan baik, sedangkan untuk model ARMA(1,1) cukup signifikans

tetapi tidak cukup baik untuk digunakan sebagai model ramalan, maka bagaimana jika

modelnya ARIMA(1,1,1) ?

Dari hasil perhitungan dengan program SPSS diperoleh hasil

>Warning # 16445 >Since there is no seasonal component in the model, the seasonality of the >data will be ignored. MODEL: MOD_5 Model Description: Variable: NILAI Regressors: NONE Non-seasonal differencing: 1 No seasonal component in model. Parameters: AR1 ________ < value originating from estimation > MA1 ________ < value originating from estimation > CONSTANT ________ < value originating from estimation > 95.00 percent confidence intervals will be generated. Split group number: 1 Series length: 84 No missing data. Melard's algorithm will be used for estimation. Termination criteria: Parameter epsilon: .001 Maximum Marquardt constant: 1.00E+09 SSQ Percentage: .001 Maximum number of iterations: 10 Initial values: AR1 .02455 MA1 .76994 CONSTANT -.03589 Marquardt constant = .001 Adjusted sum of squares = 5809.8278 Iteration History: Iteration Adj. Sum of Squares Marquardt Constant 1 5327.3932 .00100 2 5323.6742 1.00000

32

3 5279.4585 10.00000 4 5279.0049 1.00000 5 5235.8021 10.00000 6 5230.7028 100.00000 7 5197.5647 10.00000 Conclusion of estimation phase. Estimation terminated at iteration number 8 because: All parameter estimates changed by less than .001 FINAL PARAMETERS: Number of residuals 83 Standard error 7.8706922 Log likelihood -289.46337 AIC 584.92674 SBC 592.18327 Analysis of Variance: DF Adj. Sum of Squares Residual Variance Residuals 80 5197.4643 61.947795 Variables in the Model: B SEB T-RATIO APPROX. PROB. AR1 .01733612 .11565746 .1498919 .88122714 MA1 .99417363 .38265241 2.5981115 .01115554 CONSTANT -.03645576 .03634471 -1.0030554 .31885849 Covariance Matrix: AR1 MA1 AR1 .01337665 .01403384 MA1 .01403384 .14642287 Correlation Matrix: AR1 MA1 AR1 1.0000000 .3171017 MA1 .3171017 1.0000000 Regressor Covariance Matrix: CONSTANT CONSTANT .00132094 Regressor Correlation Matrix: CONSTANT CONSTANT 1.0000000 >Warning # 16567. Command name: ARIMA >Our tests have determined that the estimated model lies close to the >boundary of the invertibility region. Although the moving average >parameters are probably correctly estimated, their standard errors and >covariances should be considered suspect. Dari hasil pehitungan diperoleh, persamaan ARIMA(1,1,1) untuk data pada Tabel 2.1

adalah

tY∧

= - 0,03645576 + 0,01733612 Yt-1 + Zt + 0,99417363 Zt-1

dengan Yt = Xt – Xt-1

33

Jika menelaah nilai |T-RATIO| AR(1) yang lebih kecil nilai kritisnya, dan |T-RATIO|

MA(1) yang lebih besar dari nilai kritisnya, dengan kekeliruan baku yang sama, sama

dengan 7,8706922 maka model ARIMA(1,1,1) dengan konstanta belum cukup

signifikans dan baik untuk digunakan sebagai model ramalan. Untuk lebih jelasnya dapat

ditelaah pada gambar peta nilai aktual dengan nilai ramalannya di bawah ini.

WAKTU

SEP 1996

APR 1996

NOV 1995

JUN 1995

JAN 1995

AUG 1994

MAR 1994

OCT 1993

MAY 1993

DEC 1992

JUL 1992

FEB 1992

SEP 1991

APR 1991

NOV 1990

JUN 1990

JAN 1990

Val

ue

40

30

20

10

0

NILAI


RIMA, MOD_5 CON

Gambar 2.9 Peta data pada Tabel 2.1 dengan nilai ramalannya

berdasarkan model ARIMA(1,1,1) dengan konstanta

Dari hasil telaah banding peta data nilai aktual dengan nilai ramalan berdasarkan model

AR(1), MA(1), ARMA(1,1), dan ARIMA(1,1,1) menyimpulkan stabilitas varians

diperlukan untuk memperkecil bias dan kekeliruan baku model, sehingga model regresi

akan menjadi lebih baik dan berarti untuk dijadikan model ramalan.

2.4. Identifikasi Model

Sudah dikemukakan model ARIMA(k,q,p) adalah model umum dari model regresi

deret waktu. Yang menjadi persoalan dalam analisisnya adalah menentukan nilai k, q,

dan p sehingga diperoleh model yang cukup baik untuk peramalan. Identifikasi model

perlu dilakukan sebelum analisis regresi deret waktu, untuk menelaah keberartian

autokorelasi dan kestasioneran data, sehingga perlu-tidaknya transformasi stabilisasi

varians, linieritas trend, dan proses diferensi dilakukan. Jika dimiliki sampel data deret

waktu x1 , x2 , ... , xn , maka langkah-langkah yang harus dilakukan untuk identifikasi

model adalah

34

1. Petakan data atas waktu dan telaah karakter data untuk menentukan perlu-tidaknya

transformasi stabilisasi varians dan/atau proses diferensi dilakukan.

Memetakan data atas waktu merupakan tahap awal dari analisis data deret waku,

sebab pada peta data ini dapat ditelaah mengenai karakter dari komponen trend,

keberadaan komponen musiman, data pencilan, ketidak-stabilan varians, normalitas

data, dan penomena lain mengenai ketidak stasioneran data.

Dalam hal data tidak stasioner dalam rata-rata hitung dan varians, maka seperti sudah

dikemukan, proses stasionerisasi yang pertama harus dilakukan adalah

menstasionerkan varians, selanjutnya menstasionerkan rata-rata hitung dari data yang

sudah distasionerkan variansnya. Menstasionerkan rata-rata hitung dilakukan

berdasarkan proses diferensi, sedangkan menstasionerkan varians dilakukan

berdasarkan tranformasi stabilisasi varians, seperti transformasi kuasa Box-Coc (Box-

Cocs power transformation) atau transformasi logaritmis.

2. Menghitung dan menelaah ACF dan PACF data sampel asli (data sebelum dilakukan

proses transformasi untuk mendapatkan informasi mengenai orde dari proses

diferensi. Informasi umum yang bisa digunakan untuk memperkirakan orde diferensi

adalah, jika ACF sampel membangun sebuah pola yang menurun secara perlahan

pada nilai-nilainya, dan PACF sampel membangun sebuah pola yang nilainya

terpotong secara signifikans setelah lag-1 (perbedaan nilai antara PACF lag-1 dengan

lag-2 dan sesudahnya sangat besar), hal ini mengindikasikan proses diferensi perlu

dilakukan. Seperti sudah dikemukakan, proses diferensi dilakukan jika komponen

trendnya linier, sehingga jika tidak linier maka sebelum proses diferensi dilakukan

harus dilakukan dulu proses linieritas, sebab jika tidak dilakukan maka orde

diferensinya akan besar yang menyebabkan akan mengurangi banyaknya nilai data,

karena jika orde diferensi q maka data akan berkurang sebanyak q buah.

3. Hitung dan telaah ACF dan PACF data hasil trasformasi dan/atau diferensi (jika ada

perlakuan transformasi dan/atau diferensi), untuk memperkirakan orde autoregresi

dan rata-rata bergerak yang akan diambil. Pedoman umum untuk menelaah apakah

orde dari model regresi deret waktu stasioner sudah cukup baik berdasarkan ACF dan

PACF-nya, sebagai berikut

35

Tabel 2.2 Karakter teoritis ACF dan PACF untuk model stasioner

Model ACF PACF AR(k) berpola eksponensial atau

gelombang sinus damped perbedaan nilai antara lag-1 dengan nilai sesudah lag-k cukup besar (cut off after lag-k)

MA(p) perbedaan nilai antara lag-1 dengan nilai sesudah lag-p cukup besar (cut off after lag-p)

berpola eksponensial atau gelombang sinus damped

ARMA(k,p) berpola menurun secara cepat sesudah lag-(p-k)

berpola menurun secara cepat sesudah lag-(k-p)

Dalam analisis regresi deret waktu, berdasarkan pengalaman, untuk mendapatkan

hasil yang cukup memuaskan, ukuran sampel, n ≥ 50, dengan lag ACF dan PACF,

k ≤ ¼n.

4. Uji signifikansi konstanta trend deterministik (konstanta model) ARIMA(k,q,p), η,

seperti pada Persamaan (2.6) jika q > 0.

Dalam analisis regresi biasa, parameter konstanta disertakan pada model jika

berdasarkan data yang dianalisis diperlukan untuk menelaah karakter rata-rata umum

dari variabel responnya. Misalnya regresi tinggi atas umur, dalam modelnya harus

disertakan konstanta model, sebab tinggi (variabel respon) sudah memiliki nilai pada

saat umur sama dengan 0 (saat dilahirkan). Tetapi dalam analisis regresi deret waktu,

konstanta model dilibatkan jika diperlukan saja, sehingga pada umumnya model

regresi deret waktu tanpa konstanta, sebab biasanya dengan ditiadakannya konstanta

model, sajian mengenai signifikansi koefisien regresi menjadi lebih tegas. Misalkan

untuk data pada Tabel 2.1, jika konstanta model dilibatkan pada model

ARIMA(1,1,1) diperoleh persamaan

tY∧

= - 0,03645576 + 0,01733612 Yt-1 + Zt + 0,99417363 Zt-1

dengan Yt = Xt – Xt-1 , Xt variabel pengamatan data deret waktu

dengan kekeliruan baku model, se = 7,87069222 , kekeliruan baku koefisien AR(1),

sγ = 0,11565746 dan kekeliruan baku koefisien MA(1), sψ = 0,38265241. Dan

berdasarkan hasil analisis variansnya, koefisien AR(1) tidak signifikans dan koefisien

36

MA(1) signifikans. Jika ARIMA(1,1,1) dihitung tanpa konstanta dengan

menggunakan paket program SPSS, maka diperoleh hasil sebagai berikut.

MODEL: MOD_9 Model Description: Variable: NILAI Regressors: NONE Non-seasonal differencing: 1 No seasonal component in model. Parameters: AR1 ________ < value originating from estimation > MA1 ________ < value originating from estimation > 95.00 percent confidence intervals will be generated. Split group number: 1 Series length: 84 No missing data. Melard's algorithm will be used for estimation. Termination criteria: Parameter epsilon: .001 Maximum Marquardt constant: 1.00E+09 SSQ Percentage: .001 Maximum number of iterations: 10 Initial values: AR1 .02453 MA1 .76987 Marquardt constant = .001 Adjusted sum of squares = 5811.7615 Iteration History: Iteration Adj. Sum of Squares Marquardt Constant 1 5349.2493 .0010000 2 5264.4191 1.0000000 3 5261.4542 .1000000 4 5261.3602 .0100000 Conclusion of estimation phase. Estimation terminated at iteration number 5 because: Sum of squares decreased by less than .001 percent. FINAL PARAMETERS: Number of residuals 83 Standard error 7.8709506 Log likelihood -289.97878 AIC 583.95757 SBC 588.79525 Analysis of Variance: DF Adj. Sum of Squares Residual Variance Residuals 81 5261.3295 61.951864 Variables in the Model: B SEB T-RATIO APPROX. PROB. AR1 .00453761 .11273806 .0402491 .96799355 MA1 .99347746 .17840472 5.5686725 .00000032 Covariance Matrix:

37

AR1 MA1 AR1 .01270987 .00517211 MA1 .00517211 .03182824 Correlation Matrix: AR1 MA1 AR1 1.0000000 .2571525 MA1 .2571525 1.0000000 >Warning # 16567. Command name: ARIMA >Our tests have determined that the estimated model lies close to the >boundary of the invertibility region. Although the moving average >parameters are probably correctly estimated, their standard errors and >covariances should be considered suspect. Dari hasil perhitungan tersurat, jika konstanta model ditiadakan, maka persamaannya

tY∧

= 0,00453761Yt-1 + Zt + 0,99347746Zt-1

dengan Yt = Xt – Xt-1 , Xt variabel pengamatan data deret waktu

dengan kekeliruan baku model, sε = 7,709506 , kekeliruan baku koefisien AR(1),

sγ = 0,11273806 , dan kekeliruan baku koefisien MA(1), sψ = 0,17840472 . Jika menelaah

analisis variansnya dengan membandingkan nilai mutlak T-RATIO dengan nilai

kritisnya, yang menyimpulkan koefisien AR(1) tidak signifikans dan koefisien MA(1)

signifikans, yang berarti model ARIMA(1,1,1) tanpa konstanta identik dengan

ARIMA(1,1,1) dengan konstanta. Hal ini menyimpulkan untuk data pada Tabel 2.1.

meniadakan konstanta model tidak meningkatkan signifikansi koefisien regresi. Untuk

lebih jelasnya dapat ditelaah dari gambar-gambar di bawah ini

WAKTU

SEP 1996

APR 1996

NOV 1995

JUN 1995

JAN 1995

AUG 1994

MAR 1994

OCT 1993

MAY 1993

DEC 1992

JUL 1992

FEB 1992

SEP 1991

APR 1991

NOV 1990

JUN 1990

JAN 1990

Val

ue

40

30

20

10

0

NILAI


RIMA, MOD_5 CON

Gambar 2.10a

Peta data pada Tabel 2.1 dengan nilai ramalannya berdasarkan model ARIMA(1,1,1) dengan konstanta

WAKTU

SEP 1996

APR 1996

NOV 1995

JUN 1995

JAN 1995

AUG 1994

MAR 1994

OCT 1993

MAY 1993

DEC 1992

JUL 1992

FEB 1992

SEP 1991

APR 1991

NOV 1990

JUN 1990

JAN 1990

Val

ue

40

30

20

10

0

NILAI


RIMA, MOD_9 NOCON

Gambar 2.10b Peta data pada Tabel 2.1 dengan nilai

ramalannya berdasarkan model ARIMA(1,1,1) tanpa konstanta

38

Kedua gambar ini menyajikan sebuah kondisi yang identik, sehingga uji keberartian

untuk konstanta model perlu dilakukan.

2.5. Transformasi Stabilitas Varians

Proses diferensi untuk menstasionerkan data umumnya “berhasil” jika data tidak

stasioner dalam rata-rata hitung (terdapat komponen trend), sedangkan jika tidak

stasioner dalam varians maka proses diferensi tidak selalu baik digunakan untuk

menstasionerkannya, sebab ordenya bisa tinggi, sehingga akan banyak data yang hilang.

Menstasionerkan varians harus dilakukan berdasarkan proses transformasi dengan

konsepsi sebagai berikut. Berdasarkan deskripsinya, varians adalah jumlah kuadrat

simpangan terhadap nilai rata-rata hitung yang dibagi oleh banyaknya data (ukuran

sampel atau populasi), sehingga jika xt , t = 1, 2, . . . n, sampel data deret waktu maka

2n

1t

2t

2n

1tt x

1n1

x1n

1)xx(

1n1

)x.(var−

−−

=−−

= ��==

Formulasi varians tersebut jika disajikan dalam bentuk fungsi riel, maka deskripsinya

sebagai berikut, jika µt parameter rata-rata hitung untuk data deret waktu pada waktu t,

Xt, maka

var.Xt = cf(µt)

c , c > 0 , konstanta nonstokastik, dan f(µt) : fungsi atas µt.

Jika T operator transformasi stabilisasi varians, maka T(Xt) , t = 1, 2, . . . barisan data

dengan varians konstan, dan jika disajikan dalam deret Taylor di sekitar titik µt, maka

T(Zt) ≅ T(µt) + T′(µt)(Xt − µt)

≅ : notasi “hampir sama dengan”, T′(µt) turunan (diferensiasi) orde-1 dari T(Zt) di titik µt

dan

var. T(Zt) = varT(µt) + var.T′(µt)(Xt − µt) = {T′(µt)}2 var.Xt = c{T′(µt)}2f(µt)

Karena var. T(Zt) konstan, T dapat dipilih sedemikian rupa sehingga

)(f

1)(T

t

t µ=µ′

atau

39

t

t

t d)(f

1)(T µ

µ=µ (2.7)

Persamaan (2.7) adalah formulasi umum untuk transformasi stabilitas varians,

sehingga bentuk tranformasi data bergantung pada bentuk f(µt) (bentuk ketidak

stasioneran dalam varians). Pada umumnya ada tiga bentuk transformasi stabilitas

varians yang sering digunakan, yaitu

1. Jika simpangan baku data proporsional pada tarafnya, var.Xt = c2µt2 atau

f(µt) = 2tµ = µt , maka

T(µt) = tt

d1 µ

µ = ln(µt) + K , K konstanta riel

Dalam hal ini transformasi stabilitas varians adalah transformasi logaritma natural

(walaupun untuk beberapa data kemungkinan tidak relevan),

Xt dittransformasikan menjadi ln (Xt) , jika Xt > 0.

2. Jika varians data proporsional pada tarafnya, var.Xt = cµt atau f(µt) = t

1

µ, maka

T(µt) = tt

t

2d1 µ=µµ + K , K konstanta riel

Dalam hal ini tranformasi stabilitas varians adalah transformasi akar kuadrat,

Xt ditransformasikan menjadi tX , jika Xt > 0.

3. Jika varians data proporsional pada kuadrat tarafnya, var.Xt = c2µt2 atau

f(µt) = 2

t4

t

11

µ=

µ, maka

T(µt) = t

t2t

1d

1µ

−=µµ

+ K , K konstanta riel

Dalam hal ini tranformasi stabilitas varians adalah transformasi perbandingan

terbalik (reciprocal),

Xt ditransformasikan menjadi tX

1.

40

Transformasi stabilitas varians yang lain dan lebih umum adalah tranformasi kuasa

(power tranformation), yang dikenalkan dan dikembangkan oleh G. E. P. Box dan D. R.

Cox sekitar tahun 1964. Persamaan dari tranformasi ini adalah

T(Xt) = Xt(λ) = λ

−λ 1X t

λ dinamakan parameter tranformasi.

Jika tranformasi kuasa ini dihubungkan dengan bentuk transformasi stabilitas varians

yang lain, maka diperoleh tabel kesetaraan seperti di bawah ini

Tabel 2.3

Hubungan nilai λλλλ dengan kesetaraan transformasi stabilitas varians

Nilai λλλλ Kesetaraan transformasi,

T(Xt) =

-1,0 tX

1

-0,5 tX

1

0,0 Ln (Xt)

0,5 tX

1,0 Xt

Beberapa catatan penting sehubungan dengan transformasi stabilitas varians,

1. Bentuk-bentuk transformasi yang telah dikemukakan secara umum hanya

didefinisikan untuk data deret waktu positif, terutama transformasi logaritma natural

dan akar kuadrat. Tetapi batasan tersebut bukan hal yang mengikat, sebab dalam

analisis data deret waktu jika dimiliki data baru maka data tersebut akan langsung

dilibatkan dalam model tanpa memperhatikan pengaruhnya pada struktur korelasi

deret data, sehingga jika dimiliki data dengan nilai negatif dan yang disyaratkan nilai

positif, maka yang diambil nilai mutlaknya.

2. Transformasi stabilitas varians harus dilakukan sebelum proses diferensi dan analisis

regresi deret waktu.

41

3. Parameter transformasi kuasa, λ, dapat ditaksir berdasarkan data sampel dengan

menggunakan metode penaksiran statistis, misalnya metode kemungkinan

maksimum.

4. Transformasi pada data deret waktu (jika diperlukan), bukan hanya transformasi

stabilitas varians, juga transformasi pendekatan distribusi normal, jika data belum

berdistribusi normal.

Contoh numerik

Sudah ditunjukan dengan gambar peta data, ACF dan PACF, data pada Tabel 2.1

menunjukan tidak stasioner dalam varians, sehingga untuk keperluan analisis regresi

deret waktu perlu dilakukan stabilitas varians, dan sudah dicoba, analisis tanpa

menstabilkan variansnya diperoleh hasil yang kurang baik. Untuk menelaah pengaruh

transformasi stabilitas varians dan transformasi mana yang cocok untuk data pada

Tabel 2.1 agar diperoleh model yang cukup baik, berikut ini dilakukan proses

transformasi logaritma natural, akar kuadrat, dan perbandingan terbalik. Proses

perhitungan dan pemetaan data aktual dengan hasil transformasi, dilakukan dengan

menggunakan paket program EXCEL hasilnya seperti di bawah ini.

0

5

10

15

20

25

30

35

1 8 15 22 29 36 43 50 57 64 71 78

NILAI

Ln(NILAI)

Gambar 2.11a

Peta data pada Tabel 2.1 dengan hasil transformasi logaritma natural

0

5

10

15

20

25

30

35

1 9 17 25 33 41 49 57 65 73 81

NILAI

Akar(NILAI)

Gambar 2.11a

Peta data pada Tabel 2.1 dengan hasil transformasi akar kuadrat

42

0

5

10

15

20

25

30

35

1 8 15 22 29 36 43 50 57 64 71 78

NILAI

1/NILAI

Gambar 2.11a

Peta data pada Tabel 2.1 dengan hasil transformasi perbandingan terbalik

dan nilai koefisien variasinya seperti di bawah ini,

Tabel II.4 Nilai koefisien variasi

Kelompok nilai hasil Koefisien variasi

Pengamatan 62,98333 Tranformasi logaritma 25,75863 Transformasi akar 30,543878 Tranformasi perbandingan terbalik 65,0978

Dari ketiga bentuk transformasi stabilitas varians untuk data pada Tabel 2.1, transformasi

logaritma natural yang paling baik, karena memberikan nilai koefisien variansi yang

paling kecil. Jika diinginkan koefisien variansi yang lebih kecil lagi, maka gunakan

transformasi Box-Coc, dengan memilih bermacam-macam nilai λ atau menaksirnya

berdasarkan data sampel.

2.6. Analisis Residual

Setelah model regresi dibangun berdasarkan sebuah sampel, selanjutnya adalah

menghitung penaksir (ramalan) nilai-nilai pengamatan, hal ini diperlukan untuk menelaah

besarnya kekeliruan jika model tersebut digunakan sebagai model ramalan. Besaran yang

digunakan sebagai acuan untuk menyimpulkan bahwa model yang dibangun cocok dan

baik untuk peramalan, adalah residu (Rt), yaitu selisih antara nilai pengamatan (xt)

dengan nilai ramalannya( tx∧

), Rt = xt − tx∧

.

43

Karena kekeliruan (error, et) merupakan variabel acak tidak terukur, untuk menelaah

dipenuhi-tidaknya asumsi pada model, yaitu rata-rata sama dengan 0, varians konstan,

dan tidak berautokorelsi, residu ( Rt ) digunakan sebagai variabel penelaahnya. Sebuah

model ramalan disebut cocok dan baik, jika

1. taksiran koefisien regresi signifikans,

2. kekeliruan baku, yang diukur oleh simpangan baku residu, nilainya kecil,

3. asumsi pada kekeliruan dipenuhi, dan

4. tidak ada pencilan, yang dalam prakteknya model tanpa pencilan sulit dihindari,

sehingga jika ada maka dilakukan telaahan khusus mengenai keberadaannya.

Untuk menelaah secara “visual” apakah sebuah model regresi baik dan cocok untuk

digunakan sebagai model ramalan, dapat dilakukan berdasarkan diagram pencar (scatter

diagram) nilai pengamatan atau nilai ramalan dengan nilai residunya. Kesimpulan yang

dapat dikemukakan sehubungan dengan pola pencaran titik adalah sebagai berikut.

1. Sebuah model disebut baik dan cocok jika gambar menyajikan sebuah pencaran titik

yang berada pada “pita tipis yang meliput secara acak dan seimbang” garis rata-rata

hitung kekeliruan yang sejajar sumbu residu.

2. Jika pencaran titik meliput seimbang garis rata-rata yang sejajar sumbu residu, tetapi

membangun pola “terompet”, maka model cocok tetapi asumsi varians konstan

(homogen) tidak dipenuhi.

3. Jika pencaran titik berada pada “pita tipis” yang meliput tidak seimbang garis rata-

rata dan sejajar sumbu residu, maka model cocok tetapi asumsi kekeliruan sama

dengan 0 tidak dipenuhi.

4. Jika pencaran titik meliput seimbang garis rata-rata yang sejajar sumbu residu, tetapi

membangun sebuah pola siklometri, maka model cocok tetapi asumsi kekeliruan

saling bebas tidak dipenuhi.

Sebagai ilustrasi disajikan gambar-gambar di bawah ini untuk bahan telaahan

44

xt ( tx∧

)

rata-rata Rt

Gambar 2.12a Model cocok dan baik untuk peramalan

xt ( tx∧

)

rata-rata

Rt

Gambar 2.12b Model cocok dan baik tetapi memiliki pencilan

xt ( tx∧

)

rata-rata

Rt

Gambar 2.12c

Model cocok untuk peramalan tetapi tidak baik karena varians kekeliruan tidak homogen (konstan)

45

xt ( tx∧

)

rata-rata

Rt

Gambar 2.12d

Model cocok untuk peramalan tetapi tidak baik karena rata-rata hitung kekeliruan tidak sama dengan 0

xt ( tx∧

)

rata-rata

Rt

Gambar 2.12e Model cocok untuk peramalan tetapi tidak baik karena kekeliruannya berautokorelasi

Chatfield (1984), Box dan Jenkins (1976) mengemukakan, konsepsi analisis residual

pada regresi biasa seperti yang telah dikemukakan, berlaku jika variabel respon (variabel

tidak bebas) tidak berautokorelasi, dan tidak ada multikolinieritas pada variabel

explanatory (variabel bebas). Sedangkan dalam analisis data deret waktu, jika data

berautokorelasi pada lag-k, maka terdapat hubungan fungsional antara Xt , Xt-1 , . . . , Xt-k

dan pada saat dibangun model regresinya, Xt sebagai variabel respon, Xt-1 , Xt-2 , . . . , Xt-k

sebagai variabel explanatory, sehingga jika pada identifikasi model, pengambilan nilai

lag tidak cocok (kurang dari k), maka akan terjadi pelanggaran konsepsi analisis regresi

biasa, karena adanya multikolinieritas pada Xt-1 , Xt-2 , . . . , Xt-k , dan ketidak bebasan

(berautokorelasi) pada Xt.

Penggunaan analisis residual dalam regresi deret waktu dilakukan untuk dua telaahan

utama, yaitu memeriksa kecocokan autokorelasi dan menguji kecocokan dan kebaikan

model. Jika dalam analisis regresi biasa peta residual ditelaah salah satu saja, yaitu peta

46

residual antara nilai pengamatan dengan residu atau nilai ramalan dengan residu, sebab

hasilnya akan identik. Tetapi dalam analisis data deret waktu peta residual harus ditelaah

untuk keduanya, sebab peta residual nilai pengamatan dengan residu untuk menelaah

kecocokan model dan peta residual nilai ramalan dengan residu untuk menelaah kebaikan

model. Selain itu perlu juga ditelaah pola nilai pengamatan dengan ramalannya.

47

BAB 3

PERAMALAN

Peramalan (forecasting) merupakan sasaran dari analisis data dalam kawasan waktu,

yang diperlukan untuk perancangan (planing) dan proses kontrol. Peramalan data deret

waktu banyak dilakukan pada masalah-masalah manajemen, sistem inventory,

pengontrolan kualitas, dan analisis investasi.

Banyak prosedur peramalan data deret waktu yang bisa dilakukan, dan secara umum

dapat diklasifikasikan atas tiga macam, yaitu peramalan secara

1. subjektif.

Peramalan secara subjektif dilakukan hanya dengan mengandalkan daya intuisi dan

kemampuan daya nalar, sehingga pengalaman dan keakhlian dalam menangani

persoalan data deret waktu sangat menentukan akurasi hasil. Peramalan subjektif

bukan sebuah metode statistis atau matematis yang bisa dipelajari secara keilmuan,

sehingga metode ini tidak dijadikan objek dalam analisis data deret waktu.

2. univariat.

Peramalan univariat adalah peramalan yang didasarkan pada sampel data deret waktu

univariat, dengan memperhatikan model hubungan antar pengamatan dan proses

ekstrapolasi atau transformasi data. Proses peramalan ini banyak digunakan dalam

persoalan bidang ekonomi, dan perdagangan. Peramalan mengenai hasil penjualan

suatu produk biasa dinamakan naive atau projeksi. Peramalan univariat merupakan

metode peramalan prinsipal dalam analisis data deret waktu.

3. multivariat.

Seperti sudah dikemukakan, analisis data deret waktu merupakan analisis univariat,

sehingga jika dimiliki data deret waktu multivariat, maka proses yang dilakukan

adalah

1. mentransformasikan pengamatan multivariat menjadi sebuah model univariat,

atau

2. mengadaptasi peramalan univariat dalam sistem multivariat, sehingga analisis

dilakukan dalam bentuk persamaan (model) matriks atau vektor.

48

Peramalan multivariat pada prinsipnya adalah pengembangan dari peramalan

univariat.

Walaupun prosedur peramalan diklasifikasikan dalam tiga macam, tetapi dalam

prakteknya analisis peramalan merupakan kombinasi dari minimal dua prosedur.

Misalnya, peramalan univariat sering dilakukan untuk mengembangkan atau

memperbaiki hasil dari peramalan subjektif, dan peramalan multivariat dilakukan sebagai

pengembangan dari peramalan univariat. Sebagai contoh, peramalan dalam bidang

pemasaran, model peramalan mengenai volume penjualan merupakan gabungan dari

peramalan mengenai frekuensi iklan, pangsa pasar, harga, bentuk, kualitas, dan variabel-

variabel lain yang berhubungan dengan volume penjualan.

Proses peramalan akan berhubungan dengan apa yang dinamakan waktu mendatang

(lead time) dan konsepsi peramalan jangka pendek (short term), yaitu peramalan

dengan lead time yang cukup kecil jika dibandingkan dengan panjang waktu pengamatan.

Misal dalam persoalan persediaan barang (stock control), peramalan jangka pendek

adalah peramalan ketersediaan barang dengan lead time antara waktu pemesanan sampai

pengantaran, yang biasanya memerlukan waktu beberapa minggu atau bulan.

Sebelum memilih prosedur peramalan yang akan dilakukan, perlu untuk

memperhatikan maksud dan tujuan peramalan, waktu, biaya, dan banyaknya data yang

tersedia untuk menentukan lead time yang layak diambil, sehingga proses peramalan

menjadi efektif dan efisien.

3.1. Esktrapolasi Trend

Ekstrapolasi trend adalah salah satu metode peramalan univariat yang paling

sederhana, dengan hanya memperhatikan bentuk trend dari peta data atas waktu, sehingga

untuk menentukan bentuk trendnya diperlukan daya intuisi dan nalar, selain keakhlian

dan pengalaman dalam persoalan analisis data deret waktu. Dengan metode ini yang

diperhatikan pada data hanya komponen trend, sehingga signifikansi autokorelasi

diabaikan. Peramalan dengan ekstrapolasi trend merupakan peramalan regresi sederhana

data atas waktu, dan dilakukan jika data stasioner dalam varians dan tidak

berautokorelasi. Prosesnya adalah sebagai berikut,

Documents

1-2bab