Upload
feno-mena-ahhad
View
20
Download
2
Embed Size (px)
DESCRIPTION
,1-2
Citation preview
1
BAB 1
PENDAHULUAN
Pada dasarnya setiap nilai dari hasil pengamatan (data), selalu dapat dikaitkan dengan
waktu pengamatannya. Hanya pada saat analisisnya, kaitan variabel waktu dengan
pengamatan sering tidak dipersoalkan. Dalam hal kaitan variabel waktu dengan
pengamatan diperhatikan, sehingga data dianggap sebagai fungsi atas waktu, maka data
seperti ini dinamakan Data Deret Waktu (Time series). Banyak persoalan dalam ilmu
terapan yang datanya merupakan data deret waktu, misalnya dalam bidang ilmu
a. ekonomi : banyak barang terjual dalam setiap hari, keuntungan perusahaan dalam
setiap tahun, total nilai ekspor dalam setiap bulan,
b. fisika : curah hujan bulanan, temperatur udara harian, gerak partikel,
c. demografi : pertumbuhan penduduk, mortalitas dan natalitas,
d. pengontrolan kualitas : proses pengontrolan kualitas produk, pengontrolan proses
produksi,
e. biomedis : denyut nadi, proses penyembuhan, pertumbuhan mikroba.
Karena data deret waktu merupakan regresi data atas waktu, dan salah satu segi
(aspect) pada data deret waktu adalah terlibatnya sebuah besaran yang dinamakan
Autokorelasi (autocorrelation), yang konsepsinya sama dengan korelasi untuk data
bivariat, dalam analisis regresi biasa. Signifikansi (keberartian) autokorelasi menentukan
analisis regresi yang harus dilakukan pada data deret waktu. Jika autokorelasi tidak
signifikans (dalam kata lain data deret waktu tidak berautokorelasi), maka analisis regresi
yang harus dilakukan adalah analisis regresi sederhana biasa, yaitu analisis regresi data
atas waktu. Sedangkan jika signifikans (berautokorelasi) harus dilakukan analisis
regresi data deret waktu, yaitu analisis regresi antar nilai pengamatan. Segi lain dalam
data deret waktu adalah kestasioneran data yang diklasifikasikan atas stasioner kuat
(stasioner orde pertama, strickly stationer) dan stasioner lemah (stasioner orde dua,
weakly stationer), dan kestasioner ini merupakan kondisi yang diperlukan dalam analisis
data deret waktu, karena akan memperkecil kekeliruan baku.
2
Dalam teori Statistika, setiap data deret waktu dibangun atas komponen trend (T),
siklis (S), musiman (M, untuk data bulanan), dan variasi residu (R). Bentuk hubungan
antara nilai data dengan komponen-komponennya tersebut bisa bermacam-macam, dan
bentuk hubungan yang sering digunakan adalah linier dan multiplikatif. Jika xt nilai data
pada waktu-t dan hubungan dengan komponennya linier, maka persamaannya
xt = Tt + St + Mt + Rt , jika t : bulanan (1.1)
xt = Tt + St + Rt , jika t : tahunan (1.2)
dan multiplikatif, maka persamaannya
xt = T.S.M.R , jika t : bulanan (1.3)
xt = T.S.R , jika t : tahunan (1.4)
Sebagai akibat dari terdapatnya komponen-komponen dalam data deret waktu dan
terjadinya hubungan antar komponen, adalah berautokorelasinya antar pengamatan
sehingga dapat dibangun sebuah hubungan fungsional yang dinamakan regresi deret
waktu.
1.1. Regresi Deret Waktu
Analisis data deret waktu merupakan telaahan khusus dari analisis regresi biasa,
seperti halnya analisis ekonometrika dan analisis disain eksperimen. Analisis regresi
deret waktu adalah analisis regresi dalam kondisi variabel respon berautokorelasi,
sehingga antar variabel respon dapat dibangun sebuah hubungan fungsional, yang dalam
analisis data deret waktu bentuk hubungannya selalu digunakan regresi linier.
Konsepsi analisis regresi linier biasa dapat digunakan secara utuh dalam analisis
regresi deret waktu, hanya proses perhitungan nilai penaksir parameternya tidak selalu
bisa dijadikan acuan. Dalam analisis regresi linier biasa, proses perhitungan taksiran
parameter selalu dapat dilakukan dengan menggunakan perhitungan matriks, sebab
sistem persamaan parameternya selalu merupakan sistem persamaan linier. Sedangkan
dalam analisis regresi deret waktu, ada beberapa model yang perhitungan taksiran
parameternya harus menggunakan metoda iterasi atau rekursif, sehingga sebagian besar
persoalan analisis regresi deret waktu harus diselesaikan dengan menggunakan fasilitas
komputer.
3
Dalam analisis data deret waktu, jika pengamatan berautokorelasi maka model
hubungan fungsionalnya dibangun berdasarkan kondisi kestasioner data, sehingga model
regresi deret waktu dikelompokan atas regresi deret waktu stasioner dan regresi deret
waktu tidak stasioner. Model regresi deret waktu tidak stasioner identik dengan model
regresi deret waktu stasioner, yang terlebih dulu data distasionerkan melalui proses
diferensi. Jika data deret waktu Xt , t = 1, 2, . . . berautokorelasi maka model regresi
antar pengamatan (autoregresi) disajikan dalam persamaan
Xt = µ + γ1Xt-1 + γ2Xt-2 + . . . + γkXt-k + Zt (1.5)
dengan Zt kekeliruan model yang diasumsikan berdistribusi identik independen dengan
rata 0 dan varians konstan σ2, yang dalam analisis data deret waktu Zt biasa disebut white
noise, µ , γ1 , . . . , γk parameter autoregresi.
Model autoregresi dengan Persamaan (1.5) dinamakan Autoregresi Lag-k dan disingkat
AR(k).
Dalam analisis data deret waktu, untuk menyajikan Xt-i , i = 1, 2 , . . . , k biasa
digunakan operator backshift B, dengan menuliskan Xt-i = BiXt, sehingga model AR(k)
jika disajikan dalam operator backshift maka persamaannya menjadi
Xt = µ + γ1BXt + γ2B2Xt + . . . + γkBkXt + Zt (1.6)
atau
Xt - γ1BXt - γ2B2Xt - . . . - γkBkXt = µ + Zt
Γk(B)Xt = µ + Zt
dengan Γk(B) = 1 - γ1B - γ2B2 - . . . - γkBk
Karena Γk(B) ≠ 0, secara matematis persamaan Γk(B)Xt = µ + Zt setara dengan
tkk
t Z)B(
1)B(
XΓ
+Γ
µ=
Xt = Γk-1(B)µ + Γk
-1(B)Zt = θ + Γk-1(B)Zt (1.7)
sehingga jika didefinisikan Γk-1(B) = Ψp(B) = 1 - ψ1B - ψ2B2 - . . . - ψpBp maka
Persamaan (1.7) menjadi
Xt = θ + Ψp(B)Zt = θ + Zt - ψ1Zt-1 - ψ2Zt-2 - . . . - ψpZt-p (1.8)
Model dengan Persamaan (1.8) dinamakan model rata-rata bergerak (moving average)
orde-p disingkat MA(p). Jadi dalam hal ini model MA(p) merupakan model inversi dari
4
AR(k), yang berarti model AR(k) dan MA(p) merupakan model yang saling berkebalikan
(invertible)
Model AR(k) dan MA(p) merupakan model regresi deret waktu stasioner dan saling
berkebalikan, sehingga keduanya dapat digabungkan dengan cara dijumlahkan, dan
model yang diperoleh dinamakan model autoregresi rata-rata bergerak, disingkat
ARMA(k,p), dengan persamaan
Xt = η + γ1Xt-1 + γ2Xt-2 + . . . + γkXt-k + Zt - ψ1Zt-1 - ψ2Zt-2 - . . . -ψpZt-p (1.9)
atau
Xt - γ1Xt-1 - γ2Xt-2 - . . . - γkXt-k = η + Zt - ψ1Zt-1 - ψ2Zt-2 - . . . -ψpZt-p
Γk(B)Xt = η + Ψp(B)Zt
Karena AR(k) dan MA(p) adalah mode regresi deret waktu stasioner, maka ARMA(k,p)
juga model regresi deret waktu stasioner.
Jika data tidak stasioner, maka dapat distasionerkan melalui proses stasioneritas, yang
berupa proses diferensi jika trendnya linier, dan proses linieritas dengan proses diferensi
pada data hasil proses linieritas, jika trend data tidak linier. Model ARMA(k,p) untuk
data hasil proses diferensi dinamakan model autoregresi integrated rata-rata bergerak
disingkat ARIMA(k,q,p).
1.2. Proses Analisis Untuk Data Deret Waktu.
Dalam analisis data deret waktu, proses baku yang harus dilakukan adalah
1. Memetakan nilai data atas waktu, hal ini dilakukan untuk menelaah kestasioneran
data, sebab jika data tidak stasioner maka harus distasionerkan melalui proses
stasioneritas.
2. Menggambarkan korelogram (gambar fungsi autokorelasi), untuk menelaah apakah
autokorelasi signifikans atau tidak, dan perlu-tidaknya proses diferensi dilakukan.
Jika autokorelasi data tidak signifikans, analisis data cukup menggunakan analisis
regresi sederhana data atas waktu, sedangkan jika signifikans harus menggunakan
analisis regresi deret waktu. Jika data ditransformasikan, maka proses pemetaan data
dan penggambaran korelogram, sebaiknya dilakukan juga pada data hasil
5
transformasi, untuk menelaah apakah proses transformasi ini sudah cukup baik dalam
upaya menstasioner kan data.
3. Jika dari korelogram disimpulkan bahwa autokorelasi signifikans, maka bangun
model regresi deret waktunya, dan lakukan penaksirannya baik dalam kawasan waktu
maupun kawasan frekuensi.
4. Lakukan proses peramalan dengan metode yang sesuai dengan kondisi datanya, dan
untuk mendapatkan hasil yang memuaskan sebaiknya gunakan metode Box-Jenkins .
Semua proses tersebut dapat dilakukan dengan mengunakan kemasan program (software)
komputer, dan telah banyak kemasan program yang dapat digunakan diantaranya SPSS
dan STATISCA.
1.3. Sasaran Analisis Data Deret Waktu
Ada beberapa tujuan dalam analisis data deret waktu, yaitu
1.3.1. Deskripsi (description)
Jika ingin mempresentasikan karakter dari data yang dimiliki, seperti kestasioneran,
keberadaan komponen musiman, keberartian autokorelasi (sebab pada dasarnya setiap
data deret waktu berautokorelasi hanya autokorelasinya signifikans atau tidak ?), maka
tahap pertama dari analisis data deret waktu adalah menggambarkan peta data dan
korelogram, yang tujuannya,
1.3.1.1. gambar peta data atas waktu untuk menelaah kestasioneran dan keberaadaan
komponen musiman (jika datanya bulanan), dan
1.3.1.2. gambar korelogram untuk menelaah signifikansi autokorelasi dan perlu-tidaknya
transformasi data,
sehingga berdasarkan informasi visual tersebut dapat dirumuskan mengenai analisis data
yang harus dilakukan, yaitu analisis regresi sederhana data atas waktu, atau analisis
regresi deret waktu.
1.3.2. Menerangkan (explanation)
Jika variabel data deret waktu lebih dari satu buah, maka telaahan dilakukan untuk
menentukan apakah salah satu variabel dapat menjelaskan variabel lain, sehingga bisa
dibangun sebuah model regresi (fungsi transfer) untuk keperluan analisis data deret
6
waktu lebih lanjut ? Sebab pada dasarnya analisis data deret waktu adalah analisis data
univariat, sehingga jika datanya bivariat atau multivariat, maka bagaimana proses
univariatisasinya ?
1.3.3. Perkiraan (prediction)
Jika dimiliki sampel data deret waktu, dan diinginkan perkiraan nilai data berikutnya,
maka proses peramalan harus dilakukan. Peramalan adalah sasaran utama dari analisis
data deret waktu, yang prosesnya bisa berdasarkan karakter dari komponen data, atau
model regresi deret waktu. Pengertian perkiraan (prediction) dan peramalan
(forecasting) beberapa penulis ada yang membedakannya, sebab mereka berpendapat
perkiraan adalah penaksiran (estimation) nilai data dengan tidak memperhatikan model
hubungan (regresi) antar nilai data, tetapi peramalan adalah proses penaksiran nilai data
berdasarkan sebuah model hubungan fungsional antar nilai data. Tetapi kebanyakan
penulis berpendapat perkiraan dengan peramalan adalah dua proses analisis data yang
sama. Dalam buku ajar ini perkiraan bisa diidentikan dengan peramalan.
1.3.4. Kontrol (control)
Proses kontrol dilakukan untuk menelaah apakah model (regresi) ramalan (perkiraan)
yang ditentukan cukup baik untuk digunakan ? Dalam statistika, sebuah model baik
digunakan untuk peramalan, jika dipenuhi modelnya cocok dan asumsinya juga dipenuhi.
Sehingga proses kontrol terhadap model perlu dilakukan untuk menelaah dipenuhi-
tidaknya asumsi, kecocokan bentuk model yang dibangun, ada-tidaknya pencilan
(outliers), yang analisisnya dapat dilakukan berdasarkan karakter nilai residu atau analisis
varians.
Untuk bisa memahami dengan baik mengenai analisis data deret waktu, diperlukan
pemahaman mengenai analisis regresi biasa, sebab analisis data deret waktu adalah
analisis khusus dari analisis regresi biasa, yaitu analisis regresi dalam hal data responnya
berautokorelasi, sehingga konsepsi pada analisis regresi biasa berlaku dalam analisis
regresi deret waktu, tetapi belum tentu untuk sebaliknya.
7
BAB 2
ANALISIS DALAM KAWASAN WAKTU
Sudah dikemukakan pada Bab 1 bahwa data deret waktu adalah data yang merupakan
fungsi atas waktu, dan setiap data deret waktu dibangun oleh komponen trend, siklis,
musiman (untuk data bulanan), dan variasi residu. Sehingga berdasarkan konsepsi
tersebut, analisis data deret waktu dapat dilakukan dalam dua kawasan (domain), yaitu
kawasan waktu dan kawasan frekuensi. Dalam kawasan waktu adalah telaah signifikansi
autokorelasi, kestasioneran data, penaksiran parameter model regresi deret waktu, dan
peramalan (forecasting). Sedangkan dalam kawasan frekuensi adalah telaahan frekuensi
tersembunyi, yaitu frekuensi komponen siklis yang sulit diperoleh dalam kawasan waktu,
dengan tujuan untuk mengetahui hal-hal istimewa atau kondisi tertentu pada data.
Analisis dalam kawasan frekuensi dinamakan Analisis Spektral, dan analisis ini
dilakukan untuk memberikan informasi tambahan pada hasil analisis dalam kawasan
waktu.
2.1. Autokorelasi dan Autokorelasi Parsial
Konsepsi autokorelasi setara (identik) dengan korelasi Pearson untuk data bivariat.
Deskripsinya sebagai berikut, jika dimiliki sampel data deret waktu x1 , x2 , . . . , xn , dan
dapat dibangun pasangan nilai (x1 , xk+1) , (x2 , xk+2) , . . . , (xk , xn) , autokorelasilasi
lag-k, dari sampel data deret waktu adalah
( )( )
( ) ( )��
�−
=
−
=
−
=+
+
−−
−−==
kn
1t
2i
kn
1t
21t
kn
1t
2kt1t
kttk
xxxx
xxxx)X,X.(korr (2.1)
�=
=k
1tt1 x
k1
x , �+=
=n
1ktt2 x
k1
x
Dalam analisis data deret waktu untuk mendapatkan hasil yang baik, nilai n harus cukup
besar, dan autokorelasi disebut berarti jika nilai k cukup kecil dibandingkan dengan n,
sehingga bisa dianggap
8
n
xxxx
n
1tt
21
�==≈≈
dan Persamaan (2.1) menjadi
( )( )
( )�
�
=
−
=+
−
−−≈ n
1t
2t
kn
1tktt
k
xx
xxxxr
dan perumusan autokorelasi seperti ini yang digunakan dalam analisis data deret waktu.
Karena rk merupakan fungsi atas k, maka hubungan autokorelasi dengan lagnya
dinamakan Fungsi Autokorelasi (autocorrelation function, ACF), dan dinotasikan oleh
( )( )
( )�
�
=
−
=+
−
−−=ρ n
1t
2t
kn
1tktt
xx
xxxx)k( (2.2)
Konsepsi lain pada autokorelasi adalah autokorelasi parsial (partial autocorrelation),
yaitu korelasi antara Xt dengan Xt+k, dengan mengabaikan ketidak-bebasan Xt+1 , Xt+2 , . .
. , Xt+k-1, sehingga Xt dianggap sebagai konstanta, Xt = xt , t = t+1 , t+2 , . . . , t+k-1 .
Autokorelasi parsial Xt dengan Xt+k didefinisikan sebagai korelasi bersyarat,
ρkk = kor.(Xt,Xt+kXt+1 = xt+1 , Xt+2 = xt+2 , . . . , Xt+k-1 = xt+k-1) (2.3)
Seperti halnya autokorelasi yang merupakan fungsi atas lagnya, yang hubungannya
dinamakan fungsi autokorelasi (ACF), autokorelasi parsial juga merupakan fungsi atas
lagnya, dan hubungannya dinamakan Fungsi Autokorelasi Parsial (partial
autocorrelation function, PACF). Gambar dari ACF dan PACF dinamakan korelogram
(correlogram) dan dapat digunakan untuk menelaah signifikansi autokorelasi dan
kestasioneran data. Jika gambar ACF membangun sebuah histogram yang menurun (pola
eksponensial), maka autokorelasi signifikans atau data berautokorelasi, dan jika diikuti
oleh gambar PACF yang histogramnya langsung terpotong pada lag-2, maka data tidak
stasioner, dan dapat distasionerkan melalui proses diferensi.
Jika dimiliki sampel data deret waktu, x1 , x2 , . . . , xn , maka yang harus dihitung
untuk mendapatkan autokorelasi sampel lag-k secara “manual” adalah,
9
1. rata-rata sampel, �=
=n
1ttx
n1
x
2. autokovarians sampel lag-k, ( )( )�−
=+ −−
−=
kn
1tkttk xxxx
kn1
s
3. autokorelasi sampel lag-k, 0
kk s
sr =
Sedangkan untuk menghitung autokorelasi parsial sampel lag-k, adalah sebagai berikut
1. bangun kombinasi linier Xt+k dengan Xt+k-1 = xt+k-1 , Xt+k-2 = xt+k-2 , . . . , Xt+1 = xt+1,
dengan persamaan
Xt+k = β1xt+k-1 + β2xt+k-2 + . . . + βk-1xt+1 , βi , 1 ≤ i ≤ k-1 , koefisien model.
2. lakukan proses penaksiran untuk βi , berdasarkan metode kuadrat rata-rata hitung,
yaitu meminimumkan E(Xt+k - β1xt+k-1 - β2xt+k-2 - . . . - βk-1xt+1), dengan asumsi
E(Xt) = 0. Proses minimisasi dilakukan dengan menggunakan perhitungan
diferensiasi biasa, sehingga jika ri , 1ki1 −≤≤ , autokorelasi sampel lag-i , maka
penaksir βi , ∧β , diperoleh berdasarkan persamaan matriks
���������
�
�
���������
�
�
β
β
β
��������
�
�
��������
�
�
=
��������
�
�
��������
�
�
−
∧
∧
∧
−−−
−−
−−
−1k
2
1
14k3k2k
3k4k11
2k3k21
1k
2
1
.
.
.
1r...rrr..................
rr...r1rrr...rr1
r...
rr
Dengan menggunakan metode Cramer, jika dinotasikan
��������
�
�
��������
�
�
=
−−−
−−
−−
1r...rrr..................
rr...r1rrr...rr1
m
14k3k2k
3k4k11
2k3k21
,
��������
�
�
��������
�
�
=
−1k
2
1
r...
rr
r
dan
10
�����������
�
�
�����������
�
�
=
−−−−−−
−−−−−−−
−−
−−
−−
1...rrr...rrr...rrr...rr........................
r...rr...1rrr...rr...r1rr...rrr...r1
m
2ik1kik3k2k
3ik2k1ik4k3k
4k2i312
3k1i211
2ki12i1
i
yaitu matriks yang diperoleh dari m dengan mengganti kolom ke-i oleh r ,
maka m
m ii =β
∧, dengan mi dan m masing-masing determinan dari mi dan m,
Berdasarkan Persamaan (2.3), maka autokorelasi parsial populasi dihitung berdasarkan
persamaan
��
���
� −��
���
� −
��
���
� −��
���
� −=ρ
+∧
+
∧
+∧
+
∧
ktkttt
ktkttt
kk
XX.varXX.var
XXXX.kov
sehingga autokorelasi parsial sampel, dihitung berdasarkan persamaan
( )
( )′��
���
� β−β−
′��
���
� β−β−=
β−−β−
β−−β−=
−
∧∧
−
∧∧
−−
∧∧−
∧
−
∧
1k11-k1
1k111-kk
1k1k11
11k1k1kkk
...1r . . . r 1
...1r . . . r r
r...r1
r...rrr (2.4)
Persamaan (2.4) jika dikaitkan dengan nilai-nilai i
∧β yang dihitung berdasarkan
perhitungan determinan matriks, maka sajian dalam persamaan determinannya
11
1r...rrr..................
rr...r1rrr...rr1rr...rrr..................
rr...r1rrr...rr1
r
11k2k1k
2k3k11
1k2k21
k13k2k1k
23k11
12k21
kk
−−−
−−
−−
−−−
−
−
=
Menghitung autokorelasi parsial antara Xt dengan Xt+k dapat juga dilakukan sebagai
berikut. Bangun model regresi linier tanpa konstanta dengan Xt+k sebagai variabel tidak
bebas dan Xt+k-1 , Xt+k-2 , . . . , Xt sebagai variabel bebas,
Xt+k = φk1Xt+k-1 + φk2Xt+k-2 + . . . + φkkXt + εt+k
φki , i = 1, 2, . . . , k , parameter model ;
εt+k kekeliruan yang diasumsikan berdistribusi normal identik independen dengan rata-
rata 0, varians konstan σ2, dan tidak berkorelasi dengan Xt+k-i , i = 1, 2, . . . ,k ;
Dengan tidak mengabaikan keumuman, diasumsikan E(Xt+k) = 0 untuk setiap t dan k.
Selanjutnya perkalikan Xt+k-i dengan persamaan regresi
γi = φk1γi-1 + φk2γi-2 + φkkγi-k
untuk setiap i = 1, 2, . . . , k, dan hitung nilai ekspetasinya, yang hasilnya akan
membangun sebuah sistem persamaan linier
ρi = φk1ρi-1 + φk2ρi-2 + φkkρi-k , i = 1, 2, . . . , k
dengan menggunakan metode Cramer, maka akan diperoleh jawab
φ11 = ρ1
12
11
1
1
1
21
1
22
ρρρρρ
=φ
11
1
11
22
11
21
311
21
11
33
ρρρρρρρρρρρρρ
=φ
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
1...1...
.....................1...1...1......
.....................1...1...1
13k2k1k
14k3k2k
3k4k32
2k3k11
1k2k21
k13k2k1k
1k24k3k2k
34k32
23k11
12k21
kk
ρρρρρρρρ
ρρρρρρρρρρρρρρρρρ
ρρρρρ
ρρρρρρρρρρρρ
=φ
−−−
−−−
−−
−−
−−
−−−
−−−−
−
−
−
Sehingga jika ρi ditaksir oleh i
∧ρ = ri (autokorelasi sampel), maka φii ditaksir oleh
kkii
∧∧ρ=φ = rii (autokorelasi parsial sampel), i = 1, 2, . . . , k. Berdasarkan paparan
mengenai kedua konsepsi perhitungan autokorelasi parsial tersebut, dapat disimpulkan
autokorelasi parsial antara Xt dengan Xt+k adalah penaksir koefisien regresi ke-k, dari
model regresi dengan persamaan
13
Xt+k = φk1Xt+k-1 + φk2Xt+k-2 + . . . + φkkXt + εt+k
kkkkkk r=ρ=φ∧∧
Untuk menghitung autokorelasi dan autokorelasi parsial banyak kemasan program
(software) komputer yang dapat digunakan, seperti SPSS, MINITAB, dan STATISTICA,
sehingga jika para pengguna analisis data deret waktu tidak memahami konsepsi
perhitungan dan pembuatan program komputer untuk perhitungannya, bisa menggunakan
salah satu kemasan program tersebut untuk keperluan analisisnya.
Contoh numerik :
Perhatikan data pada Tabel 2.1 di bawah ini
Tabel 2.1 Data Volume Penjualan
(dalam ribuan unit)
Tahun Bulan 1990 1991 1992 1993 1994 1995 1996
Januari 12,35 10,12 9,25 2,75 5,80 12,25 10,85 Pebruari 9,78 8,75 5,45 10,19 11,09 8,75 7,50 Maret 10,25 19,75 5,89 4,35 7,00 8,00 12,67 April 2,75 25,30 5,55 30,25 12,20 6,75 29,77 Mei 25,24 12,10 10,25 5,25 11,20 30,45 12,20 Juni 20,25 30,00 6,75 5,25 5,00 10,25 12,25 Juli 11,25 10,25 10,00 30,25 2,75 30,30 12,25 Agustus 12,20 10,35 30,33 12,25 10,00 10,50 12,25 September 20,25 25,05 12,33 8,75 7,75 5,55 4,25 Oktober 10,00 12,25 30,25 24,20 20,10 12,25 5,75 Nopember 8,75 9,90 10,25 25,22 2,57 5,75 7,50 Desember 10,80 8,90 9,25 5,50 4,75 10,25 10,00
Jika autokorelasi dan autokorelasi parsial dihitung dengan menggunakan paket program
SPSS untuk 16 lag yang pertama (default-nya proram) diperoleh hasil seperti dibawah in.
MODEL: MOD_1. Autocorrelations: NILAI Auto- Stand. Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob. +----+----+----+----+----+----+----+----+ 1 -.012 .107 . * . .014 .907 2 .039 .107 . I* . .149 .928 3 .116 .106 . I** . 1.356 .716 4 -.094 .105 . **I . 2.161 .706 5 -.232 .105 *.***I . 7.084 .214 6 -.036 .104 . *I . 7.204 .302 7 -.103 .103 . **I . 8.204 .315
14
8 -.151 .103 .***I . 10.364 .240 9 .100 .102 I** . 11.323 .254 10 -.073 .101 *I . 11.844 .296 11 .155 .101 I***. 14.227 .221 12 .022 .100 . * . 14.276 .283 13 .044 .099 . I* . 14.476 .341 14 -.027 .098 . *I . 14.553 .409 15 .031 .098 . I* . 14.655 .477 16 -.080 .097 . **I . 15.331 .501 Plot Symbols: Autocorrelations * Two Standard Error Limits . Total cases: 84 Computable first lags: 83 Partial Autocorrelations: NILAI Pr-Aut- Stand. Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 +----+----+----+----+----+----+----+----+ 1 -.012 .109 . * . 2 .039 .109 . I* . 3 .117 .109 . I** . 4 -.094 .109 . **I . 5 -.249 .109 *.***I . 6 -.055 .109 . *I . 7 -.062 .109 . *I . 8 -.112 .109 . **I . 9 .071 .109 . I* . 10 -.109 .109 . **I . 11 .150 .109 . I***. 12 -.051 .109 . *I . 13 -.001 .109 . * . 14 -.060 .109 . *I . 15 .002 .109 . * . 16 -.029 .109 . *I . Plot Symbols: Autocorrelations * Two Standard Error Limits . Total cases: 84 Computable first lags: 83
dan gambar ACF dengan PACF-nya seperti di bawah di bawah ini
16151413121110987654321
Lag Number
1.0
0.5
0.0
-0.5
-1.0
AC
F
Lower ConfidenceLimit
Upper ConfidenceLimit
Coefficient
Nilai
Gambar 2.1a ACF Nilai Data Pada Tabel 2.1
16151413121110987654321
Lag Number
1.0
0.5
0.0
-0.5
-1.0
Part
ial A
CF
Lower ConfidenceLimit
Upper ConfidenceLimit
Coefficient
Nilai
Gambar 2.1b
PACF Nilai Data Pada Tabel 2.1
15
Jika ditelaah, gambar ACF dan PACF keduanya membangun pola alternating (tanda
dan nilai autokorelasi berubah secara acak sesuai dengan berjalannya nilai lag), hal ini
mengindikasikan data tidak stasioner dalam varians, dan stasioner lemah dalam rata-rata
hitung. Sedangkan signifikansi autokorelasi kemungkinannya lemah (nilai lagnya cukup
besar jika dibandingkan dengan ukuran sampelnya)
Jika hasil telaahan secara “visual” tidak cukup menyakinkan, maka dapat dilakukan
pengujian hipotesis statistis untuk keberartian autokorelasi.
2.2. Stasioneritas
Kestasioneran data merupakan kondisi yang diperlukan dalam analisis regresi deret
waktu karena dapat memperkecil kekeliruan model, sehingga jika data tidak stasioner,
maka harus dilakukan transformasi stasioneritas melalui proses diferensi, jika trendnya
linier, sedangkan jika tidak linier, maka transformasinya harus dilakukan dulu
transformasi linieritas trend melalui proses logaritma natural jika trendnya eksponensial,
dan proses pembobotan (penghalusan eksponensial sederhana) jika bentuknya yang lain,
yang selanjutnya proses diferensi pada data hasil proses linieritas.
Berdasarkan deskripsinya, bentuk kestasioneran ada dua, yaitu stasioner kuat
(strickly stationer), atau stasioner orde pertama (primary stationer) dan stasioner
lemah (weakly stationer), atau stasioner orde kedua (secondary stationer). Deskripsi
umum kestasioneran adalah sebagai berikut, data deret X1 , X2 , . . . disebut stasioner kuat
jika distribusi gabungan n21 ttt X, . . . , X , X sama dengan distribusi gabungan
ktktkt n21X, . . . , X , X +++ , untuk setiap nilai t1, t2, . . . , tn dan k. Sedangkan disebut
stasioner lemah, jika rata-rata hitung data konstan, E(Xt) = µ, dan autokovariansnya
merupakan fungsi dari lag, ρk = f(k). Sedangkan ketidakstasioner data diklasifikasikan
atas tiga bentuk yaitu
1. tidak stasioner dalam rata-rata hitung, jika trend tidak datar (tidak sejajar sumbu
waktu) dan data tersebar pada “pita” yang meliput secara seimbang trendnya.
16
2. tidak stasioner dalam varians, jika trend datar atau hampir datar tapi data tersebar
membangun pola melebar atau menyempit yang meliput secara seimbang trendnya
(pola terompet).
3. tidak stasioner dalam rata-rata hitung dan varians, jika trend tidak datar dan data
membangun pola terompet.
Untuk menelaah ketidak-stasioneran data secara visual, tahap pertama dapat
dilakukan pada peta data atas waktu, karena biasanya “mudah”, dan jika belum
mendapatkan kejelasan, maka tahap berikutnya ditelaah pada gambar ACF dengan
PACF. Telaahan pada gambar ACF, jika data tidak stasioner maka gambarnya akan
membangun pola,
1. menurun, jika data tidak stasioner dalam rata-rata hitung (trend naik atau turun),
2. alternating, jika data tidak stasioner dalam varians,
3. gelombang, jika data tidak stasioner dalam rata-rata hitung dan varians.
Gambar-gambar di bawah ini menyajikan kasus data tidak stasioner dan bentuk ACF-nya
276
271
266
261
256
251
246
241
236
231
226
221
216
211
206
201
196
191
186
181
176
171
166
161
156
151
146
141
136
131
126
121
116
111
106
101
96
91
86
81
76
71
66
61
56
51
46
41
36
31
26
21
16
11
61
Case Number
0.600
0.500
0.400
0.300
0.200
0.100
0.000
Val
ue c
rest
Gambar 2.2a Data tidak stasioner dalam rata-rata hitung
16151413121110987654321
Lag Number
1.0
0.5
0.0
-0.5
-1.0
AC
F
Lower ConfidenceLimit
Upper ConfidenceLimit
Coefficient
crest
Gambar 2.2b ACF dari Gambar 2.2a
17
CREST
Lag Number
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Par
tial A
CF
1.0
.5
0.0
-.5
-1.0
Confidence Limits
Coefficient
Gambar 2.2c
PACF dari Gambar 2.2a
216
211
206
201
196
191
186
181
176
171
166
161
156
151
146
141
136
131
126
121
116
111
106
101
96
91
86
81
76
71
66
61
56
51
46
41
36
31
26
21
16
11
61
Case Number
40000
30000
20000
10000
Val
ue c
onne
ct
Gambar 2.2d Data tidak stasioner dalam rata-rata
hitung dan varians
16151413121110987654321
Lag Number
1.0
0.5
0.0
-0.5
-1.0
AC
F
Lower ConfidenceLimit
Upper ConfidenceLimit
Coefficient
connect
Gambar 2.2e ACF dari Gambar 2.2d
CONNECT
Lag Number
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Par
tial A
CF
1.0
.5
0.0
-.5
-1.0
Confidence Limits
Coefficient
Gambar 2.2f
PACF dari Gambar 2.2d
119
117
115
113
111
109
107
105
103
101
99
97
95
93
91
89
87
85
83
81
79
77
75
73
71
69
67
65
63
61
59
57
55
53
51
49
47
45
43
41
39
37
35
33
31
29
27
25
23
21
19
17
15
13
11
97531
Case Number
80.0
70.0
60.0
50.0
40.0
30.0
20.0
10.0
Val
ue o
zone
Gambar 2.2g Data tidak stasioner dalam varians
16151413121110987654321
Lag Number
1.0
0.5
0.0
-0.5
-1.0
ACF
Lower ConfidenceLimit
Upper ConfidenceLimit
Coefficient
ozone
Gambar 2.2h ACF dari Gambar 2.2g
18
OZONE
Lag Number
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Par
tial A
CF
1.0
.5
0.0
-.5
-1.0
Confidence Limits
Coefficient
Gambar 2.2i
PACF dari Gambar 2.2g
Untuk ilustrasi perhatikan data pada Tabel 2.1. Jika digambarkan, peta data atas
waktu gambarnya seperti di bawah ini
WAKTU
SEP 1996
APR 1996
NOV 1995
JUN 1995
JAN 1995
AUG 1994
MAR 1994
OCT 1993
MAY 1993
DEC 1992
JUL 1992
FEB 1992
SEP 1991
APR 1991
NOV 1990
JUN 1990
JAN 1990
Val
ue N
ILA
I
40
30
20
10
0
Gambar 2.3
Peta data pada Tabel 2.1
Gambar 2.3 terlihat identik dengan Gambar 2.2e, menyajikan pola trend yang hampir
mendatar (sejajar sumbu waktu) dan variasi data terletak pada sebuah “pita yang meliput
tidak seimbang” trend data, hal ini mengindikasikan bahwa data stasioner lemah dalam
rata-rata hitung, tapi tidak stasioner dalam varians. Ketidak stasioneran dalam varians
jelas terlihat pada gambar ACF dan PACF-nya (Gambar 2.1a dan 2.1b), yang keduanya
menyajikan pola hampir alternating. Untuk lebih memperjelas pendapat tersebut,
perhatikan gambar-gambar hasil diferensi orde-1 dari data pada Tabel 2.1 berikut ini.
19
WAKTU
SEP 1996
APR 1996
NOV 1995
JUN 1995
JAN 1995
AUG 1994
MAR 1994
OCT 1993
MAY 1993
DEC 1992
JUL 1992
FEB 1992
SEP 1991
APR 1991
NOV 1990
JUN 1990
JAN 1990
Val
ue D
IFF(
NIL
AI,1
)
30
20
10
0
-10
-20
-30
Gambar 2.4
Peta data pada Tabel 2.1 hasil diferensi orde-1
DIFF(NILAI,1)
Lag Number
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
AC
F
1.0
.5
0.0
-.5
-1.0
Confidence Limits
Coefficient
Gambar 2.5a ACF data pada Tabel 2.1 hasil diferensi
orde-1
DIFF(NILAI,1)
Lag Number
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Par
tial A
CF
1.0
.5
0.0
-.5
-1.0
Confidence Limits
Coefficient
Gambar 2.5b PACF data pada Tabel 2.1 hasil diferensi
orde-1
Gambar 2.4 menyajikan pola data dengan trend mendatar dan pola “terompet di sisi kiri
dan kanan”, hal ini berarti dengan didiferensi orde-1 data yang tadinya stasioner lemah
dalam rata-rata hitung menjadi stasioner kuat dalam rata-rata hitung. Selanjutnya dari
gambar ACF (Gambar 2.5a) yang membangun pola alternating dan PACF (Gambar 2.5b)
pola “hampir gelombang”, hal ini menunjukan bahwa proses diferensi belum bisa
menstabilkan varians, tetapi tidak perlu dilakukan lagi (cukup orde-1), yang harus
dilakukan adalah transformasi stabilitas varians.
20
Seperti halnya dengan telaahan keberatian autokorelasi, jika telaahan ketidak
stasioneran secara “visual” kurang meyakinkan, maka pengujian hipotesis statistis untuk
kestasioneran data perlu dilakukan.
2.3. Model Regresi Deret Waktu
Jika data deret waktu berautokorelasi pada lag-k, maka selanjutnya membangun
model hubungan fungsional antar pengamatan (model regresi deret waktu, model
autoregresi), dan pada Bab 1 sudah dikemukakan model regresi deret waktu dari data
yang berautokorelasi pada lag-k, dinamakan model autoregresi order-k (lag-k), ditulis
AR(k), yang persamaannya
Xt = µ + γ1Xt-1 + γ2Xt-2 + γkXt-k + Zt
dengan Zt kekeliruan yang diasumsikan berdistribusi normal identik independen dengan
rata 0 dan varians konstan σ2, dan dalam analisis data deret waktu Zt dinamakan proses
acak atau white noise, µ , γ1 , . . . , γk parameter autoregresi.
Untuk menentukan nilai taksiran parameter model berdasarkan sampel data deret
waktu, x1 , x2 , . . . , x2, prosesnya seperti pada analisis regresi multipel biasa, sebab
model AR(k) setara dengan model regresi multipel biasa atas k variabel bebas, yang
dalam regresi deret waktu sebagai variabel bebasnya adalah, Xt-1 , Xt-2 , . . . , Xt-k dan
variabel tidak bebasnya Xt, sehingga langkah-langkah perhitungan secara “manual”
sebagai berikut,
1. bangun pasangan pengamatan, (Xt , Xt-1 , . . . , Xt-k) dan sajikan pada tabel seperti di
bawah ini
Xt Xt-1 . . . Xt-k
xn xn-1 . . . xn-k
xn-1 xn-2 . . . xn-1-k
. . . .
. . . .
. . . . xk+1 xk . . . x1
21
2. bangun matriks
��������
�
�
��������
�
�
=
+
−
1k
1n
n
x...
xx
Y ,
��������
�
�
��������
�
�
=
−
−−−−
−−−
11kk
k1n3n2n
kn2n1n
x......xx1..................
x......xx1x......xx1
X ,
��������
�
�
��������
�
�
γ
γµ
=β
k
1
.
.
.
3. hitung XX′ , ( ) 1XX −′ , dan YX′
4. sehingga penaksir β , ( ) YXXX 1 ′′=β −∧
Misal untuk model AR(1), dengan persamaan
Xt = µ + γXt-1 + Zt , t = 1 , 2 , . . . , n (2.4)
Pada persamaan ini
��������
�
�
��������
�
�
=
−
2
1n
n
x...
xx
Y ,
��������
�
�
��������
�
�
=
−
−
1
2n
1n
x1......
x1x1
X , ���
����
�
γµ
=β ,
����
�
�
����
�
� −=′
��
�−
=
−
=
−
=1n
1t
2t
1n
1tt
1n
1tt
xx
x)1n(XX
( )����
�
�
����
�
�
−−
−
��
���
�−−
=′�
��
��−
=
−
=
−
=
−
=
−
=
−
)1n(x
xx
xx)1n(
1XX 1n
1tt
1n
1tt
1n
1t
2t
21n
1tt
1n
1t
2t
1 ,
����
�
�
����
�
�
=′�
�
=−
=n
2tt1t
n
2tt
xx
xYX
sehingga
����
�
�
����
�
�
−+−
−
��
���
�−−
=��
�
�
��
�
�
γ
µ=β���
����
�� =−
=
−
=
=−
−
==
−
=
−
=
−
=
∧
∧∧
n
2tt1t
n
2tt
1n
1tt
n
2tt1t
1n
1tt
n
2tt
1n
1t
2t
21n
1tt
1n
1t
2t
xx)1n(xx
xxxxx
xx)1n(
1
atau
22
21n
1tt
1n
1t
2t
n
2tt1t
1n
1tt
n
2tt
1n
1t
2t
xx)1n(
xxxxx
��
���
�−−
−=µ
��
����−
=
−
=
=−
−
==
−
=∧
, 21n
1tt
1n
1t
2t
n
2tt1t
n
2tt
1n
1tt
xx)1n(
xx)1n(xx
��
���
�−−
−+−=γ
��
���−
=
−
=
=−
=
−
=∧
Contoh numerik
Jika data pada Tabel 2.1 modelnya AR(1) dengan Persamaan (2.4), maka
Y : vektor berukuran 83x1, dengan elemen-elemennya nilai data dari bulan Pebruari
1990 sampai dengan Desember 1996
X : matriks berukuran 83x2, dengan elemen-elemen kolom ke-1 semuanya sama dengan
1, dan kolom ke-2 nilai data dari bulan Januari 1990 sampai dengan Nopember 1996
sehingga jika dihitung dengan menggunakan paket program MINITAB, diperoleh hasil
( ) ���
����
�=′
17710.9 1033.821033.8 84.00
XX , ( ) ���
����
�=′ −
0.0002005 0.0024678-0.0024678- 0.0422766
XX 1 , ���
����
�=′
12537.71021.5
YX
���
����
�=β
∧
0.0125-12.4611
atau ∧µ = 12,4611 , 1
∧γ = -0,0125 , dan model ramalannya
tX∧
= 12,4611 – 0,0125Xt-1
Untuk menghitung model ramalan ini dapat juga digunakan paket program SPSS
yang hasilnya akan lebih baik, karena ada sajian analisis variansnya. Misalnya untuk
data pada Tabel 2.1, jika dianggap modelnya AR(1) dengan Persamaan (2.4) dan
dianalisis dengan paket program SPSS, diperoleh hasil sebagai berikut,
>Warning # 16445 >Since there is no seasonal component in the model, the seasonality of the >data will be ignored. MODEL: MOD_1 Model Description: Variable: NILAI Regressors: NONE Non-seasonal differencing: 0 No seasonal component in model. Parameters: AR1 ________ < value originating from estimation > CONSTANT ________ < value originating from estimation > 95.00 percent confidence intervals will be generated. Split group number: 1 Series length: 84
23
No missing data. Melard's algorithm will be used for estimation. Termination criteria: Parameter epsilon: .001 Maximum Marquardt constant: 1.00E+09 SSQ Percentage: .001 Maximum number of iterations: 10 Initial values: AR1 -.01249 CONSTANT 12.30771 Marquardt constant = .001 Adjusted sum of squares = 4986.4749 Conclusion of estimation phase. Estimation terminated at iteration number 1 because: Sum of squares decreased by less than .001 percent. FINAL PARAMETERS: Number of residuals 84 Standard error 7.7981124 Log likelihood -290.71697 AIC 585.43394 SBC 590.29558 Analysis of Variance: DF Adj. Sum of Squares Residual Variance Residuals 82 4986.4748 60.810558 Variables in the Model: B SEB T-RATIO APPROX. PROB. AR1 -.012357 .11048249 -.111841 .91122242 CONSTANT 12.307710 .84058082 14.641912 .00000000 Covariance Matrix: AR1 AR1 .01220638 Correlation Matrix: AR1 AR1 1.0000000 Regressor Covariance Matrix: CONSTANT CONSTANT .70657612 Regressor Correlation Matrix: CONSTANT CONSTANT 1.0000000
Dari hasil perhitungan diperoleh taksiran µ dan γ, masing-masing∧µ = 12,307710 dan
∧γ = -0,012357, dengan kekeliruan baku (simpangan baku kekeliruan, std error) model,
se = 7,7981124, dan kekeliruan baku regresi, sγ = 0,11048249. Jika melihat nilai mutlak
T-RATIO, T-RATIO = -0,111841 = 0,111841 , yang jika dibandingkan dengan
nilai kritisnya untuk taraf signifikans, α = 0,05 (sesuai dengan defaultnya SPSS), derajat
bebas, DF = 82, nilainya antara 1,29 dengan 1,30 (1,29 < T-TABEL <1,30), maka
24
T-RATIO < T-TABEL, yang berarti model AR(1) tidak signifikans untuk digunakan
sebagai model ramalan. Untuk lebih jelas dapat dilihat peta nilai data dengan nilai
ramalannya untuk model AR(1) di bawah ini
WAKTU
SEP 1996
APR 1996
NOV 1995
JUN 1995
JAN 1995
AUG 1994
MAR 1994
OCT 1993
MAY 1993
DEC 1992
JUL 1992
FEB 1992
SEP 1991
APR 1991
NOV 1990
JUN 1990
JAN 1990
Val
ue
40
30
20
10
0
NILAI
Fit for NILAI from A
RIMA, MOD_2 CON
Gambar 2.6 Peta data pada Tabel 2.1 dengan nilai ramalannya
berdasarkan model AR(1) dengan konstanta
Dari Gambar 2.6 terlihat perbedaan yang mencolok antara peta nilai aktual yang
berupa gambar spektrum dengan peta nilai ramalan yang hampir mendatar. Ketidak
berartian model AR(1) dengan konstanta untuk data Pada Tabel 2.1, kemungkinannya
karena data tidak stasioner dalam varians, sebab seperti sudah dikemukan, analisis regresi
deret waktu dilakukan jika data stasioner, sehingga transformasi stabilisasi varians harus
dilakukan dulu sebelum membangun model regresi deret waktu.
Pada Bab 1 juga sudah dikemukakan, model AR(k) memiliki model kebalikan yaitu
model rata-rata bergerak, MA(p), dengan persamaan
Xt = θ + Ψ(B)Zt = θ + Zt - ψ1Zt-1 - ψ2Zt-2 - . . . - ψpZt-p
θ , ψ1 , ψ2 , . . . , ψp parameter regresi.
Tidak seperti pada model AR(k) yang penaksiran parameternya dapat dilakukan seperti
pada analisis regresi multipel biasa, penaksiran parameter dalam model MA(p) harus
dilakukan dengan metode iterasi, yang proses perhitungannya harus menggunakan
fasilitas komputer beserta bahasa pemogramannya. Misal untuk model MA(1),
Xt = θ + Zt + ψZt (2.5)
25
untuk menentukan taksiran θ dan ψ, berdasarkan sampel data deret waktu x1 , x2 , . . . , xn
prosesnya sebagai berikut :
x1 = θ + z1 + ψz0 = θ + z1 �
z1 = x1 - θ
x2 = θ + z2 + ψz1 = θ + z2 + ψ(x1 - θ) �
z2 = x2 - θ - ψ(x1 - θ) = x2 - ψx1 + (ψ - 1)θ
x3 = θ + z3 + ψz2 = θ + z3 + ψ{x2 - ψx1 + (ψ - 1)θ} �
z3 = x3 - θ - ψ{x2 - ψx1 + (ψ - 1)θ} = x3 - ψx2 + ψ2x1 + {ψ(ψ - 1) – 1}θ
= x3 - ψx2 + ψ2x1 + (ψ2 - ψ - 1)θ
…………………………………………………………………………..
………………………………………………………………………….
………………………………………………………………………….
xn = θ + zn + ψzn-1
= θ + zn + ψ[xn-1 - ψxn-2 + . . . +(-1)i+1ψi-1xn-i + . . . +(-1)nψn-2x1 + {ψn-2 - ψn-3 + . . . +
(-1)i-1ψn-i-1 + . . . + (-1)n-2ψ –1}θ] �
zn = xn - ψxn-1 + ψ2xn-2 - . . . -(-1)i+1ψixn-i + . . . +(-1)nψn-1x1 + (ψn-1 - ψn-2 + . . . +
(-1)iψn-i + . . . + (-1)n-1ψ –1}θ]
selanjutnya bangun jumlah kuadrat �=
=n
1i
2izJ dan perhitungan diferensiasi 0
J =θ∂
∂ ,
0J =ψ∂
∂ , yang akan menghasilkan sebuah sistem persamaan tidak linier atas θ dan ψ,
sehingga penyelesaiannya harus menggunakan fasilitas komputer, dengan menggunakan
program buatan atau paket seperti SPSS, STATISTICA atau MINITAB.
Contoh numerik
Sudah dikemukan bahwa data pada Tabel 2.1 jika modelnya AR(1) tidak cukup baik
dan signifikans sebagai model ramalan, maka bagaimana jika modelnya MA(1) dengan
Persamaan (2.5) ? Dengan menggunakan paket program SPSS diperoleh hasil
>Warning # 16445 >Since there is no seasonal component in the model, the seasonality of the >data will be ignored. MODEL: MOD_1
26
Model Description: Variable: NILAI Regressors: NONE Non-seasonal differencing: 0 No seasonal component in model. Parameters: MA1 ________ < value originating from estimation > CONSTANT ________ < value originating from estimation > 95.00 percent confidence intervals will be generated. Split group number: 1 Series length: 84 No missing data. Melard's algorithm will be used for estimation. Termination criteria: Parameter epsilon: .001 Maximum Marquardt constant: 1.00E+09 SSQ Percentage: .001 Maximum number of iterations: 10 Initial values: MA1 .01249 CONSTANT 12.30773 Marquardt constant = .001 Adjusted sum of squares = 4986.5381 Conclusion of estimation phase. Estimation terminated at iteration number 1 because: Sum of squares decreased by less than .001 percent. FINAL PARAMETERS: Number of residuals 84 Standard error 7.7981582 Log likelihood -290.71745 AIC 585.43491 SBC 590.29654 Analysis of Variance: DF Adj. Sum of Squares Residual Variance Residuals 82 4986.5319 60.811272
Variables in the Model: B SEB T-RATIO APPROX. PROB. MA1 .011329 .11049041 .102533 .91858376 CONSTANT 12.307698 .84132438 14.628957 .00000000 Covariance Matrix: MA1 MA1 .01220813 Correlation Matrix: MA1 MA1 1.0000000 Regressor Covariance Matrix: CONSTANT CONSTANT .70782671 Regressor Correlation Matrix: CONSTANT CONSTANT 1.0000000
27
Dari hasil perhitungan diperoleh ∧θ = 12,307698 dan
∧ψ = 0,01220813 , sehingga model
MA(1)-nya adalah
tX∧
= 12,307698 + Zt + 0,01220813Zt-1
dengan kekeliruan baku model, sε = 7,981582, dan kekeliruan baku regresi,
sψ = 0,11049041, tetapi model ini tidak cukup signifikans karena
T-RATIO = 0,102533= 0,102533 lebih kecil dari nilai kritisnya (sudah
dikemukakan nilainya antara 1,29 dengan 1,30). Untuk lebih jelas dapat ditelaah dari
gambar peta data dengan nilai ramalan berdasarkan model MA(1) di bawah ini.
WAKTU
SEP 1996
APR 1996
NOV 1995
JUN 1995
JAN 1995
AUG 1994
MAR 1994
OCT 1993
MAY 1993
DEC 1992
JUL 1992
FEB 1992
SEP 1991
APR 1991
NOV 1990
JUN 1990
JAN 1990
Val
ue
40
30
20
10
0
NILAI
Fit for NILAI from A
RIMA, MOD_3 CON
Gambar 2.7 Peta data pada Tabel 2.1 dengan ramalannya berdasarkan model MA(1) dengan konstanta
Sajian Gambar 2.7 ini identik dengan Gambar 2.6, berarti model MA(1) dan AR(1)
dengan konstanta tidak cukup baik dijadikan model ramalan, dan seperti sudah
dikemukakan hal kemungkinannya karena data tersebut tidak stasioner dalam varians.
Model AR(k) dan MA(p) adalah model-model stasioner (model untuk data yang
stasioner dalam rata-rata hitung dan varians) dan berkebalikan, sehingga kedua model ini
dapat digabungkan dengan cara dijumlahkan menjadi model ARMA(k,p) dengan
persamaan
Xt = η + γ1Xt-1 + γ2Xt-2 + . . . + γkXt-k + Zt - ψ1Zt-1 - ψ2Zt-2 - . . . - ψpZt-p
28
Seperti halnya pada model MA(p), penaksiran parameter model, η , γ1 , γ2 , . . . , γk , ψ1 ,
ψ2 , . . . , ψp harus dilakukan dengan proses iterasi.
Contoh numerik
Untuk data pada Tabel 2.1 jika modelnya AR(1) atau MA(1) tidak cukup baik jika
digunakan sebagai model ramalan, maka bagaimana jika kedua model itu digabungkan
sehingga menjadi model ARMA(1,1) ?
Dari perhitungan dengan menggunakan paket program SPSS diperoleh hasil sebagai
berikut
>Warning # 16445 >Since there is no seasonal component in the model, the seasonality of the >data will be ignored. MODEL: MOD_4 Model Description: Variable: NILAI Regressors: NONE Non-seasonal differencing: 0 No seasonal component in model. Parameters: AR1 ________ < value originating from estimation > MA1 ________ < value originating from estimation > CONSTANT ________ < value originating from estimation > 95.00 percent confidence intervals will be generated. Split group number: 1 Series length: 84 No missing data. Melard's algorithm will be used for estimation. Termination criteria: Parameter epsilon: .001 Maximum Marquardt constant: 1.00E+09 SSQ Percentage: .001 Maximum number of iterations: 10 Initial values: AR1 -.98613 MA1 -.97410 CONSTANT 12.30677 Marquardt constant = .001 Adjusted sum of squares = 5029.3661 Iteration History: Iteration Adj. Sum of Squares Marquardt Constant 1 4978.3456 .0010000 2 4968.8609 .0001000 3 4963.1842 .0000100 4 4958.5226 1.0000000 Conclusion of estimation phase. Estimation terminated at iteration number 5 because:
29
All parameter estimates changed by less than .001 FINAL PARAMETERS: Number of residuals 84 Standard error 7.8026009 Log likelihood -290.48741 AIC 586.97482 SBC 594.26727 Analysis of Variance: DF Adj. Sum of Squares Residual Variance Residuals 81 4958.3794 60.880580 Variables in the Model: B SEB T-RATIO APPROX. PROB. AR1 -.973643 .14755992 -6.598292 .00000000 MA1 -.995934 .31112205 -3.201104 .00195633 CONSTANT 12.308017 .86091338 14.296464 .00000000 Covariance Matrix: AR1 MA1 AR1 .02177393 .04426428 MA1 .04426428 .09679693 Correlation Matrix: AR1 MA1 AR1 1.0000000 .9641714 MA1 .9641714 1.0000000 Regressor Covariance Matrix: CONSTANT CONSTANT .74117185 Regressor Correlation Matrix: CONSTANT CONSTANT 1.0000000 >Warning # 16567. Command name: ARIMA >Our tests have determined that the estimated model lies close to the >boundary of the invertibility region. Although the moving average >parameters are probably correctly estimated, their standard errors and >covariances should be considered suspect. Dari hasil perhitungan diperoleh persamaan ARMA(1,1) untuk data pada Tabel 2.1
adalah
tX∧
= 12.308017 − 0,973643 Xt-1 + Zt − 0,995934 Zt-1
dan jika memperhatikan nilai |T-RATIO| untuk koefisien AR(1) dan MA(1) yang
keduanya lebih besar dari nilai kritisnya, maka model ARMA(1,1) cukup berarti untuk
menjadi model ramalan, tetapi tidak cukup baik sebab kekeliruan residunya masih besar
yaitu sama dengan 7,8026009. Untuk lebih jelas dapat ditelaah dari gambar peta data
nilai aktual dengan nilai ramalan dengan model ARMA(1,1) di bawah ini
30
WAKTU
SEP 1996
APR 1996
NOV 1995
JUN 1995
JAN 1995
AUG 1994
MAR 1994
OCT 1993
MAY 1993
DEC 1992
JUL 1992
FEB 1992
SEP 1991
APR 1991
NOV 1990
JUN 1990
JAN 1990
Val
ue
40
30
20
10
0
NILAI
Fit for NILAI from A
RIMA, MOD_4 CON
Gambar 2.8 Peta nilai data pada Tabel 2.1 dengan nilai ramalannya
berdasarkan model ARMA(1,1) dengan konstanta
Gambar 2.8 ini identik dengan Gambar 2.7 dan 2.6, yang berarti model ARMA(1,1)
dengan konstanta juga belum cukup berarti sebagai model ramalan.
Dalam hal data tidak stasioner, proses stasioneritas harus dilakukan dulu sebelum
analisis regresi deret waktu. Proses stasioneritas dilakukan bergantung pada kondisi
ketidak-stasionerannya, jika data tidak stasioner dalam
1. rata-rata hitung (trend tidak sejajar sumbu waktu), dengan trendnya linier, maka
proses stasioneritas adalah proses diferensi, sedangkan jika tidak linier maka proses
linieritas trend harus dilakukan dulu sebelum proses diferensi.
2. varians, maka proses stasioneritasnya adalah transformasi stabilisasi varians.
3. rata-rata hitung dan varians, maka transformasi stabilisasi varians harus dilakukan
lebih dulu, dan proses diferensi dilakukan pada data hasil transformasi jika trendnya
linier, sedangkan jika tidak linier maka proses linieritas harus dilakukan sebelum
proses diferensi. Proses diferensi dan linieritas dilakukan pada data hasil
transformasi.
Misalkan X1 , X2 , . . . , data deret waktu dengan trendnya linier. Jika dilakukan
proses diferensi dengan orde-q, Yt = (1 – B)qXt, sehingga Y1 , Y2 , . . . merupakan data
deret waktu stasioner, maka model ARMA(k,p) pada Yt
Yt = η + γ1Yt-1 + γ2 Yt-2 + . . . + γkYt-k + Zt + ψ1Zt-1 + ψ2Zt-2 + . . . + ψpZt-p (2.6)
dinamakan model ARIMA(k,q,p) untuk Xt.
31
Model ARIMA(k,q,p) merupakan model umum dari regresi deret waktu., sebab
ARIMA(k,0,0) sama dengan AR(k), ARIMA(0,0,p) sama dengan MA(p), dan
ARIMA(k,0,p) sama dengan ARMA(k,p).
Contoh numerik
Jika melihat gambar peta data pada Tabel 2.1 (Gambar 2.3) yang menyajikan sebuah
kondisi stasioner lemah dalam rata-rata hitung, dan hasil perhitungan untuk membangun
model AR(1), MA(1) dan ARMA(1,1), yang menyimpulkan model AR(1) dan MA(1)
tidak cukup signifikans dan baik, sedangkan untuk model ARMA(1,1) cukup signifikans
tetapi tidak cukup baik untuk digunakan sebagai model ramalan, maka bagaimana jika
modelnya ARIMA(1,1,1) ?
Dari hasil perhitungan dengan program SPSS diperoleh hasil
>Warning # 16445 >Since there is no seasonal component in the model, the seasonality of the >data will be ignored. MODEL: MOD_5 Model Description: Variable: NILAI Regressors: NONE Non-seasonal differencing: 1 No seasonal component in model. Parameters: AR1 ________ < value originating from estimation > MA1 ________ < value originating from estimation > CONSTANT ________ < value originating from estimation > 95.00 percent confidence intervals will be generated. Split group number: 1 Series length: 84 No missing data. Melard's algorithm will be used for estimation. Termination criteria: Parameter epsilon: .001 Maximum Marquardt constant: 1.00E+09 SSQ Percentage: .001 Maximum number of iterations: 10 Initial values: AR1 .02455 MA1 .76994 CONSTANT -.03589 Marquardt constant = .001 Adjusted sum of squares = 5809.8278 Iteration History: Iteration Adj. Sum of Squares Marquardt Constant 1 5327.3932 .00100 2 5323.6742 1.00000
32
3 5279.4585 10.00000 4 5279.0049 1.00000 5 5235.8021 10.00000 6 5230.7028 100.00000 7 5197.5647 10.00000 Conclusion of estimation phase. Estimation terminated at iteration number 8 because: All parameter estimates changed by less than .001 FINAL PARAMETERS: Number of residuals 83 Standard error 7.8706922 Log likelihood -289.46337 AIC 584.92674 SBC 592.18327 Analysis of Variance: DF Adj. Sum of Squares Residual Variance Residuals 80 5197.4643 61.947795 Variables in the Model: B SEB T-RATIO APPROX. PROB. AR1 .01733612 .11565746 .1498919 .88122714 MA1 .99417363 .38265241 2.5981115 .01115554 CONSTANT -.03645576 .03634471 -1.0030554 .31885849 Covariance Matrix: AR1 MA1 AR1 .01337665 .01403384 MA1 .01403384 .14642287 Correlation Matrix: AR1 MA1 AR1 1.0000000 .3171017 MA1 .3171017 1.0000000 Regressor Covariance Matrix: CONSTANT CONSTANT .00132094 Regressor Correlation Matrix: CONSTANT CONSTANT 1.0000000 >Warning # 16567. Command name: ARIMA >Our tests have determined that the estimated model lies close to the >boundary of the invertibility region. Although the moving average >parameters are probably correctly estimated, their standard errors and >covariances should be considered suspect. Dari hasil pehitungan diperoleh, persamaan ARIMA(1,1,1) untuk data pada Tabel 2.1
adalah
tY∧
= - 0,03645576 + 0,01733612 Yt-1 + Zt + 0,99417363 Zt-1
dengan Yt = Xt – Xt-1
33
Jika menelaah nilai |T-RATIO| AR(1) yang lebih kecil nilai kritisnya, dan |T-RATIO|
MA(1) yang lebih besar dari nilai kritisnya, dengan kekeliruan baku yang sama, sama
dengan 7,8706922 maka model ARIMA(1,1,1) dengan konstanta belum cukup
signifikans dan baik untuk digunakan sebagai model ramalan. Untuk lebih jelasnya dapat
ditelaah pada gambar peta nilai aktual dengan nilai ramalannya di bawah ini.
WAKTU
SEP 1996
APR 1996
NOV 1995
JUN 1995
JAN 1995
AUG 1994
MAR 1994
OCT 1993
MAY 1993
DEC 1992
JUL 1992
FEB 1992
SEP 1991
APR 1991
NOV 1990
JUN 1990
JAN 1990
Val
ue
40
30
20
10
0
NILAI
Fit for NILAI from A
RIMA, MOD_5 CON
Gambar 2.9 Peta data pada Tabel 2.1 dengan nilai ramalannya
berdasarkan model ARIMA(1,1,1) dengan konstanta
Dari hasil telaah banding peta data nilai aktual dengan nilai ramalan berdasarkan model
AR(1), MA(1), ARMA(1,1), dan ARIMA(1,1,1) menyimpulkan stabilitas varians
diperlukan untuk memperkecil bias dan kekeliruan baku model, sehingga model regresi
akan menjadi lebih baik dan berarti untuk dijadikan model ramalan.
2.4. Identifikasi Model
Sudah dikemukakan model ARIMA(k,q,p) adalah model umum dari model regresi
deret waktu. Yang menjadi persoalan dalam analisisnya adalah menentukan nilai k, q,
dan p sehingga diperoleh model yang cukup baik untuk peramalan. Identifikasi model
perlu dilakukan sebelum analisis regresi deret waktu, untuk menelaah keberartian
autokorelasi dan kestasioneran data, sehingga perlu-tidaknya transformasi stabilisasi
varians, linieritas trend, dan proses diferensi dilakukan. Jika dimiliki sampel data deret
waktu x1 , x2 , ... , xn , maka langkah-langkah yang harus dilakukan untuk identifikasi
model adalah
34
1. Petakan data atas waktu dan telaah karakter data untuk menentukan perlu-tidaknya
transformasi stabilisasi varians dan/atau proses diferensi dilakukan.
Memetakan data atas waktu merupakan tahap awal dari analisis data deret waku,
sebab pada peta data ini dapat ditelaah mengenai karakter dari komponen trend,
keberadaan komponen musiman, data pencilan, ketidak-stabilan varians, normalitas
data, dan penomena lain mengenai ketidak stasioneran data.
Dalam hal data tidak stasioner dalam rata-rata hitung dan varians, maka seperti sudah
dikemukan, proses stasionerisasi yang pertama harus dilakukan adalah
menstasionerkan varians, selanjutnya menstasionerkan rata-rata hitung dari data yang
sudah distasionerkan variansnya. Menstasionerkan rata-rata hitung dilakukan
berdasarkan proses diferensi, sedangkan menstasionerkan varians dilakukan
berdasarkan tranformasi stabilisasi varians, seperti transformasi kuasa Box-Coc (Box-
Cocs power transformation) atau transformasi logaritmis.
2. Menghitung dan menelaah ACF dan PACF data sampel asli (data sebelum dilakukan
proses transformasi untuk mendapatkan informasi mengenai orde dari proses
diferensi. Informasi umum yang bisa digunakan untuk memperkirakan orde diferensi
adalah, jika ACF sampel membangun sebuah pola yang menurun secara perlahan
pada nilai-nilainya, dan PACF sampel membangun sebuah pola yang nilainya
terpotong secara signifikans setelah lag-1 (perbedaan nilai antara PACF lag-1 dengan
lag-2 dan sesudahnya sangat besar), hal ini mengindikasikan proses diferensi perlu
dilakukan. Seperti sudah dikemukakan, proses diferensi dilakukan jika komponen
trendnya linier, sehingga jika tidak linier maka sebelum proses diferensi dilakukan
harus dilakukan dulu proses linieritas, sebab jika tidak dilakukan maka orde
diferensinya akan besar yang menyebabkan akan mengurangi banyaknya nilai data,
karena jika orde diferensi q maka data akan berkurang sebanyak q buah.
3. Hitung dan telaah ACF dan PACF data hasil trasformasi dan/atau diferensi (jika ada
perlakuan transformasi dan/atau diferensi), untuk memperkirakan orde autoregresi
dan rata-rata bergerak yang akan diambil. Pedoman umum untuk menelaah apakah
orde dari model regresi deret waktu stasioner sudah cukup baik berdasarkan ACF dan
PACF-nya, sebagai berikut
35
Tabel 2.2 Karakter teoritis ACF dan PACF untuk model stasioner
Model ACF PACF AR(k) berpola eksponensial atau
gelombang sinus damped perbedaan nilai antara lag-1 dengan nilai sesudah lag-k cukup besar (cut off after lag-k)
MA(p) perbedaan nilai antara lag-1 dengan nilai sesudah lag-p cukup besar (cut off after lag-p)
berpola eksponensial atau gelombang sinus damped
ARMA(k,p) berpola menurun secara cepat sesudah lag-(p-k)
berpola menurun secara cepat sesudah lag-(k-p)
Dalam analisis regresi deret waktu, berdasarkan pengalaman, untuk mendapatkan
hasil yang cukup memuaskan, ukuran sampel, n ≥ 50, dengan lag ACF dan PACF,
k ≤ ¼n.
4. Uji signifikansi konstanta trend deterministik (konstanta model) ARIMA(k,q,p), η,
seperti pada Persamaan (2.6) jika q > 0.
Dalam analisis regresi biasa, parameter konstanta disertakan pada model jika
berdasarkan data yang dianalisis diperlukan untuk menelaah karakter rata-rata umum
dari variabel responnya. Misalnya regresi tinggi atas umur, dalam modelnya harus
disertakan konstanta model, sebab tinggi (variabel respon) sudah memiliki nilai pada
saat umur sama dengan 0 (saat dilahirkan). Tetapi dalam analisis regresi deret waktu,
konstanta model dilibatkan jika diperlukan saja, sehingga pada umumnya model
regresi deret waktu tanpa konstanta, sebab biasanya dengan ditiadakannya konstanta
model, sajian mengenai signifikansi koefisien regresi menjadi lebih tegas. Misalkan
untuk data pada Tabel 2.1, jika konstanta model dilibatkan pada model
ARIMA(1,1,1) diperoleh persamaan
tY∧
= - 0,03645576 + 0,01733612 Yt-1 + Zt + 0,99417363 Zt-1
dengan Yt = Xt – Xt-1 , Xt variabel pengamatan data deret waktu
dengan kekeliruan baku model, se = 7,87069222 , kekeliruan baku koefisien AR(1),
sγ = 0,11565746 dan kekeliruan baku koefisien MA(1), sψ = 0,38265241. Dan
berdasarkan hasil analisis variansnya, koefisien AR(1) tidak signifikans dan koefisien
36
MA(1) signifikans. Jika ARIMA(1,1,1) dihitung tanpa konstanta dengan
menggunakan paket program SPSS, maka diperoleh hasil sebagai berikut.
MODEL: MOD_9 Model Description: Variable: NILAI Regressors: NONE Non-seasonal differencing: 1 No seasonal component in model. Parameters: AR1 ________ < value originating from estimation > MA1 ________ < value originating from estimation > 95.00 percent confidence intervals will be generated. Split group number: 1 Series length: 84 No missing data. Melard's algorithm will be used for estimation. Termination criteria: Parameter epsilon: .001 Maximum Marquardt constant: 1.00E+09 SSQ Percentage: .001 Maximum number of iterations: 10 Initial values: AR1 .02453 MA1 .76987 Marquardt constant = .001 Adjusted sum of squares = 5811.7615 Iteration History: Iteration Adj. Sum of Squares Marquardt Constant 1 5349.2493 .0010000 2 5264.4191 1.0000000 3 5261.4542 .1000000 4 5261.3602 .0100000 Conclusion of estimation phase. Estimation terminated at iteration number 5 because: Sum of squares decreased by less than .001 percent. FINAL PARAMETERS: Number of residuals 83 Standard error 7.8709506 Log likelihood -289.97878 AIC 583.95757 SBC 588.79525 Analysis of Variance: DF Adj. Sum of Squares Residual Variance Residuals 81 5261.3295 61.951864 Variables in the Model: B SEB T-RATIO APPROX. PROB. AR1 .00453761 .11273806 .0402491 .96799355 MA1 .99347746 .17840472 5.5686725 .00000032 Covariance Matrix:
37
AR1 MA1 AR1 .01270987 .00517211 MA1 .00517211 .03182824 Correlation Matrix: AR1 MA1 AR1 1.0000000 .2571525 MA1 .2571525 1.0000000 >Warning # 16567. Command name: ARIMA >Our tests have determined that the estimated model lies close to the >boundary of the invertibility region. Although the moving average >parameters are probably correctly estimated, their standard errors and >covariances should be considered suspect. Dari hasil perhitungan tersurat, jika konstanta model ditiadakan, maka persamaannya
tY∧
= 0,00453761Yt-1 + Zt + 0,99347746Zt-1
dengan Yt = Xt – Xt-1 , Xt variabel pengamatan data deret waktu
dengan kekeliruan baku model, sε = 7,709506 , kekeliruan baku koefisien AR(1),
sγ = 0,11273806 , dan kekeliruan baku koefisien MA(1), sψ = 0,17840472 . Jika menelaah
analisis variansnya dengan membandingkan nilai mutlak T-RATIO dengan nilai
kritisnya, yang menyimpulkan koefisien AR(1) tidak signifikans dan koefisien MA(1)
signifikans, yang berarti model ARIMA(1,1,1) tanpa konstanta identik dengan
ARIMA(1,1,1) dengan konstanta. Hal ini menyimpulkan untuk data pada Tabel 2.1.
meniadakan konstanta model tidak meningkatkan signifikansi koefisien regresi. Untuk
lebih jelasnya dapat ditelaah dari gambar-gambar di bawah ini
WAKTU
SEP 1996
APR 1996
NOV 1995
JUN 1995
JAN 1995
AUG 1994
MAR 1994
OCT 1993
MAY 1993
DEC 1992
JUL 1992
FEB 1992
SEP 1991
APR 1991
NOV 1990
JUN 1990
JAN 1990
Val
ue
40
30
20
10
0
NILAI
Fit for NILAI from A
RIMA, MOD_5 CON
Gambar 2.10a
Peta data pada Tabel 2.1 dengan nilai ramalannya berdasarkan model ARIMA(1,1,1) dengan konstanta
WAKTU
SEP 1996
APR 1996
NOV 1995
JUN 1995
JAN 1995
AUG 1994
MAR 1994
OCT 1993
MAY 1993
DEC 1992
JUL 1992
FEB 1992
SEP 1991
APR 1991
NOV 1990
JUN 1990
JAN 1990
Val
ue
40
30
20
10
0
NILAI
Fit for NILAI from A
RIMA, MOD_9 NOCON
Gambar 2.10b Peta data pada Tabel 2.1 dengan nilai
ramalannya berdasarkan model ARIMA(1,1,1) tanpa konstanta
38
Kedua gambar ini menyajikan sebuah kondisi yang identik, sehingga uji keberartian
untuk konstanta model perlu dilakukan.
2.5. Transformasi Stabilitas Varians
Proses diferensi untuk menstasionerkan data umumnya “berhasil” jika data tidak
stasioner dalam rata-rata hitung (terdapat komponen trend), sedangkan jika tidak
stasioner dalam varians maka proses diferensi tidak selalu baik digunakan untuk
menstasionerkannya, sebab ordenya bisa tinggi, sehingga akan banyak data yang hilang.
Menstasionerkan varians harus dilakukan berdasarkan proses transformasi dengan
konsepsi sebagai berikut. Berdasarkan deskripsinya, varians adalah jumlah kuadrat
simpangan terhadap nilai rata-rata hitung yang dibagi oleh banyaknya data (ukuran
sampel atau populasi), sehingga jika xt , t = 1, 2, . . . n, sampel data deret waktu maka
2n
1t
2t
2n
1tt x
1n1
x1n
1)xx(
1n1
)x.(var−
−−
=−−
= ��==
Formulasi varians tersebut jika disajikan dalam bentuk fungsi riel, maka deskripsinya
sebagai berikut, jika µt parameter rata-rata hitung untuk data deret waktu pada waktu t,
Xt, maka
var.Xt = cf(µt)
c , c > 0 , konstanta nonstokastik, dan f(µt) : fungsi atas µt.
Jika T operator transformasi stabilisasi varians, maka T(Xt) , t = 1, 2, . . . barisan data
dengan varians konstan, dan jika disajikan dalam deret Taylor di sekitar titik µt, maka
T(Zt) ≅ T(µt) + T′(µt)(Xt − µt)
≅ : notasi “hampir sama dengan”, T′(µt) turunan (diferensiasi) orde-1 dari T(Zt) di titik µt
dan
var. T(Zt) = varT(µt) + var.T′(µt)(Xt − µt) = {T′(µt)}2 var.Xt = c{T′(µt)}2f(µt)
Karena var. T(Zt) konstan, T dapat dipilih sedemikian rupa sehingga
)(f
1)(T
t
t µ=µ′
atau
39
t
t
t d)(f
1)(T µ
µ=µ (2.7)
Persamaan (2.7) adalah formulasi umum untuk transformasi stabilitas varians,
sehingga bentuk tranformasi data bergantung pada bentuk f(µt) (bentuk ketidak
stasioneran dalam varians). Pada umumnya ada tiga bentuk transformasi stabilitas
varians yang sering digunakan, yaitu
1. Jika simpangan baku data proporsional pada tarafnya, var.Xt = c2µt2 atau
f(µt) = 2tµ = µt , maka
T(µt) = tt
d1 µ
µ = ln(µt) + K , K konstanta riel
Dalam hal ini transformasi stabilitas varians adalah transformasi logaritma natural
(walaupun untuk beberapa data kemungkinan tidak relevan),
Xt dittransformasikan menjadi ln (Xt) , jika Xt > 0.
2. Jika varians data proporsional pada tarafnya, var.Xt = cµt atau f(µt) = t
1
µ, maka
T(µt) = tt
t
2d1 µ=µµ + K , K konstanta riel
Dalam hal ini tranformasi stabilitas varians adalah transformasi akar kuadrat,
Xt ditransformasikan menjadi tX , jika Xt > 0.
3. Jika varians data proporsional pada kuadrat tarafnya, var.Xt = c2µt2 atau
f(µt) = 2
t4
t
11
µ=
µ, maka
T(µt) = t
t2t
1d
1µ
−=µµ
+ K , K konstanta riel
Dalam hal ini tranformasi stabilitas varians adalah transformasi perbandingan
terbalik (reciprocal),
Xt ditransformasikan menjadi tX
1.
40
Transformasi stabilitas varians yang lain dan lebih umum adalah tranformasi kuasa
(power tranformation), yang dikenalkan dan dikembangkan oleh G. E. P. Box dan D. R.
Cox sekitar tahun 1964. Persamaan dari tranformasi ini adalah
T(Xt) = Xt(λ) = λ
−λ 1X t
λ dinamakan parameter tranformasi.
Jika tranformasi kuasa ini dihubungkan dengan bentuk transformasi stabilitas varians
yang lain, maka diperoleh tabel kesetaraan seperti di bawah ini
Tabel 2.3
Hubungan nilai λλλλ dengan kesetaraan transformasi stabilitas varians
Nilai λλλλ Kesetaraan transformasi,
T(Xt) =
-1,0 tX
1
-0,5 tX
1
0,0 Ln (Xt)
0,5 tX
1,0 Xt
Beberapa catatan penting sehubungan dengan transformasi stabilitas varians,
1. Bentuk-bentuk transformasi yang telah dikemukakan secara umum hanya
didefinisikan untuk data deret waktu positif, terutama transformasi logaritma natural
dan akar kuadrat. Tetapi batasan tersebut bukan hal yang mengikat, sebab dalam
analisis data deret waktu jika dimiliki data baru maka data tersebut akan langsung
dilibatkan dalam model tanpa memperhatikan pengaruhnya pada struktur korelasi
deret data, sehingga jika dimiliki data dengan nilai negatif dan yang disyaratkan nilai
positif, maka yang diambil nilai mutlaknya.
2. Transformasi stabilitas varians harus dilakukan sebelum proses diferensi dan analisis
regresi deret waktu.
41
3. Parameter transformasi kuasa, λ, dapat ditaksir berdasarkan data sampel dengan
menggunakan metode penaksiran statistis, misalnya metode kemungkinan
maksimum.
4. Transformasi pada data deret waktu (jika diperlukan), bukan hanya transformasi
stabilitas varians, juga transformasi pendekatan distribusi normal, jika data belum
berdistribusi normal.
Contoh numerik
Sudah ditunjukan dengan gambar peta data, ACF dan PACF, data pada Tabel 2.1
menunjukan tidak stasioner dalam varians, sehingga untuk keperluan analisis regresi
deret waktu perlu dilakukan stabilitas varians, dan sudah dicoba, analisis tanpa
menstabilkan variansnya diperoleh hasil yang kurang baik. Untuk menelaah pengaruh
transformasi stabilitas varians dan transformasi mana yang cocok untuk data pada
Tabel 2.1 agar diperoleh model yang cukup baik, berikut ini dilakukan proses
transformasi logaritma natural, akar kuadrat, dan perbandingan terbalik. Proses
perhitungan dan pemetaan data aktual dengan hasil transformasi, dilakukan dengan
menggunakan paket program EXCEL hasilnya seperti di bawah ini.
0
5
10
15
20
25
30
35
1 8 15 22 29 36 43 50 57 64 71 78
NILAI
Ln(NILAI)
Gambar 2.11a
Peta data pada Tabel 2.1 dengan hasil transformasi logaritma natural
0
5
10
15
20
25
30
35
1 9 17 25 33 41 49 57 65 73 81
NILAI
Akar(NILAI)
Gambar 2.11a
Peta data pada Tabel 2.1 dengan hasil transformasi akar kuadrat
42
0
5
10
15
20
25
30
35
1 8 15 22 29 36 43 50 57 64 71 78
NILAI
1/NILAI
Gambar 2.11a
Peta data pada Tabel 2.1 dengan hasil transformasi perbandingan terbalik
dan nilai koefisien variasinya seperti di bawah ini,
Tabel II.4 Nilai koefisien variasi
Kelompok nilai hasil Koefisien variasi
Pengamatan 62,98333 Tranformasi logaritma 25,75863 Transformasi akar 30,543878 Tranformasi perbandingan terbalik 65,0978
Dari ketiga bentuk transformasi stabilitas varians untuk data pada Tabel 2.1, transformasi
logaritma natural yang paling baik, karena memberikan nilai koefisien variansi yang
paling kecil. Jika diinginkan koefisien variansi yang lebih kecil lagi, maka gunakan
transformasi Box-Coc, dengan memilih bermacam-macam nilai λ atau menaksirnya
berdasarkan data sampel.
2.6. Analisis Residual
Setelah model regresi dibangun berdasarkan sebuah sampel, selanjutnya adalah
menghitung penaksir (ramalan) nilai-nilai pengamatan, hal ini diperlukan untuk menelaah
besarnya kekeliruan jika model tersebut digunakan sebagai model ramalan. Besaran yang
digunakan sebagai acuan untuk menyimpulkan bahwa model yang dibangun cocok dan
baik untuk peramalan, adalah residu (Rt), yaitu selisih antara nilai pengamatan (xt)
dengan nilai ramalannya( tx∧
), Rt = xt − tx∧
.
43
Karena kekeliruan (error, et) merupakan variabel acak tidak terukur, untuk menelaah
dipenuhi-tidaknya asumsi pada model, yaitu rata-rata sama dengan 0, varians konstan,
dan tidak berautokorelsi, residu ( Rt ) digunakan sebagai variabel penelaahnya. Sebuah
model ramalan disebut cocok dan baik, jika
1. taksiran koefisien regresi signifikans,
2. kekeliruan baku, yang diukur oleh simpangan baku residu, nilainya kecil,
3. asumsi pada kekeliruan dipenuhi, dan
4. tidak ada pencilan, yang dalam prakteknya model tanpa pencilan sulit dihindari,
sehingga jika ada maka dilakukan telaahan khusus mengenai keberadaannya.
Untuk menelaah secara “visual” apakah sebuah model regresi baik dan cocok untuk
digunakan sebagai model ramalan, dapat dilakukan berdasarkan diagram pencar (scatter
diagram) nilai pengamatan atau nilai ramalan dengan nilai residunya. Kesimpulan yang
dapat dikemukakan sehubungan dengan pola pencaran titik adalah sebagai berikut.
1. Sebuah model disebut baik dan cocok jika gambar menyajikan sebuah pencaran titik
yang berada pada “pita tipis yang meliput secara acak dan seimbang” garis rata-rata
hitung kekeliruan yang sejajar sumbu residu.
2. Jika pencaran titik meliput seimbang garis rata-rata yang sejajar sumbu residu, tetapi
membangun pola “terompet”, maka model cocok tetapi asumsi varians konstan
(homogen) tidak dipenuhi.
3. Jika pencaran titik berada pada “pita tipis” yang meliput tidak seimbang garis rata-
rata dan sejajar sumbu residu, maka model cocok tetapi asumsi kekeliruan sama
dengan 0 tidak dipenuhi.
4. Jika pencaran titik meliput seimbang garis rata-rata yang sejajar sumbu residu, tetapi
membangun sebuah pola siklometri, maka model cocok tetapi asumsi kekeliruan
saling bebas tidak dipenuhi.
Sebagai ilustrasi disajikan gambar-gambar di bawah ini untuk bahan telaahan
44
xt ( tx∧
)
rata-rata Rt
Gambar 2.12a Model cocok dan baik untuk peramalan
xt ( tx∧
)
rata-rata
Rt
Gambar 2.12b Model cocok dan baik tetapi memiliki pencilan
xt ( tx∧
)
rata-rata
Rt
Gambar 2.12c
Model cocok untuk peramalan tetapi tidak baik karena varians kekeliruan tidak homogen (konstan)
45
xt ( tx∧
)
rata-rata
Rt
Gambar 2.12d
Model cocok untuk peramalan tetapi tidak baik karena rata-rata hitung kekeliruan tidak sama dengan 0
xt ( tx∧
)
rata-rata
Rt
Gambar 2.12e Model cocok untuk peramalan tetapi tidak baik karena kekeliruannya berautokorelasi
Chatfield (1984), Box dan Jenkins (1976) mengemukakan, konsepsi analisis residual
pada regresi biasa seperti yang telah dikemukakan, berlaku jika variabel respon (variabel
tidak bebas) tidak berautokorelasi, dan tidak ada multikolinieritas pada variabel
explanatory (variabel bebas). Sedangkan dalam analisis data deret waktu, jika data
berautokorelasi pada lag-k, maka terdapat hubungan fungsional antara Xt , Xt-1 , . . . , Xt-k
dan pada saat dibangun model regresinya, Xt sebagai variabel respon, Xt-1 , Xt-2 , . . . , Xt-k
sebagai variabel explanatory, sehingga jika pada identifikasi model, pengambilan nilai
lag tidak cocok (kurang dari k), maka akan terjadi pelanggaran konsepsi analisis regresi
biasa, karena adanya multikolinieritas pada Xt-1 , Xt-2 , . . . , Xt-k , dan ketidak bebasan
(berautokorelasi) pada Xt.
Penggunaan analisis residual dalam regresi deret waktu dilakukan untuk dua telaahan
utama, yaitu memeriksa kecocokan autokorelasi dan menguji kecocokan dan kebaikan
model. Jika dalam analisis regresi biasa peta residual ditelaah salah satu saja, yaitu peta
46
residual antara nilai pengamatan dengan residu atau nilai ramalan dengan residu, sebab
hasilnya akan identik. Tetapi dalam analisis data deret waktu peta residual harus ditelaah
untuk keduanya, sebab peta residual nilai pengamatan dengan residu untuk menelaah
kecocokan model dan peta residual nilai ramalan dengan residu untuk menelaah kebaikan
model. Selain itu perlu juga ditelaah pola nilai pengamatan dengan ramalannya.
47
BAB 3
PERAMALAN
Peramalan (forecasting) merupakan sasaran dari analisis data dalam kawasan waktu,
yang diperlukan untuk perancangan (planing) dan proses kontrol. Peramalan data deret
waktu banyak dilakukan pada masalah-masalah manajemen, sistem inventory,
pengontrolan kualitas, dan analisis investasi.
Banyak prosedur peramalan data deret waktu yang bisa dilakukan, dan secara umum
dapat diklasifikasikan atas tiga macam, yaitu peramalan secara
1. subjektif.
Peramalan secara subjektif dilakukan hanya dengan mengandalkan daya intuisi dan
kemampuan daya nalar, sehingga pengalaman dan keakhlian dalam menangani
persoalan data deret waktu sangat menentukan akurasi hasil. Peramalan subjektif
bukan sebuah metode statistis atau matematis yang bisa dipelajari secara keilmuan,
sehingga metode ini tidak dijadikan objek dalam analisis data deret waktu.
2. univariat.
Peramalan univariat adalah peramalan yang didasarkan pada sampel data deret waktu
univariat, dengan memperhatikan model hubungan antar pengamatan dan proses
ekstrapolasi atau transformasi data. Proses peramalan ini banyak digunakan dalam
persoalan bidang ekonomi, dan perdagangan. Peramalan mengenai hasil penjualan
suatu produk biasa dinamakan naive atau projeksi. Peramalan univariat merupakan
metode peramalan prinsipal dalam analisis data deret waktu.
3. multivariat.
Seperti sudah dikemukakan, analisis data deret waktu merupakan analisis univariat,
sehingga jika dimiliki data deret waktu multivariat, maka proses yang dilakukan
adalah
1. mentransformasikan pengamatan multivariat menjadi sebuah model univariat,
atau
2. mengadaptasi peramalan univariat dalam sistem multivariat, sehingga analisis
dilakukan dalam bentuk persamaan (model) matriks atau vektor.
48
Peramalan multivariat pada prinsipnya adalah pengembangan dari peramalan
univariat.
Walaupun prosedur peramalan diklasifikasikan dalam tiga macam, tetapi dalam
prakteknya analisis peramalan merupakan kombinasi dari minimal dua prosedur.
Misalnya, peramalan univariat sering dilakukan untuk mengembangkan atau
memperbaiki hasil dari peramalan subjektif, dan peramalan multivariat dilakukan sebagai
pengembangan dari peramalan univariat. Sebagai contoh, peramalan dalam bidang
pemasaran, model peramalan mengenai volume penjualan merupakan gabungan dari
peramalan mengenai frekuensi iklan, pangsa pasar, harga, bentuk, kualitas, dan variabel-
variabel lain yang berhubungan dengan volume penjualan.
Proses peramalan akan berhubungan dengan apa yang dinamakan waktu mendatang
(lead time) dan konsepsi peramalan jangka pendek (short term), yaitu peramalan
dengan lead time yang cukup kecil jika dibandingkan dengan panjang waktu pengamatan.
Misal dalam persoalan persediaan barang (stock control), peramalan jangka pendek
adalah peramalan ketersediaan barang dengan lead time antara waktu pemesanan sampai
pengantaran, yang biasanya memerlukan waktu beberapa minggu atau bulan.
Sebelum memilih prosedur peramalan yang akan dilakukan, perlu untuk
memperhatikan maksud dan tujuan peramalan, waktu, biaya, dan banyaknya data yang
tersedia untuk menentukan lead time yang layak diambil, sehingga proses peramalan
menjadi efektif dan efisien.
3.1. Esktrapolasi Trend
Ekstrapolasi trend adalah salah satu metode peramalan univariat yang paling
sederhana, dengan hanya memperhatikan bentuk trend dari peta data atas waktu, sehingga
untuk menentukan bentuk trendnya diperlukan daya intuisi dan nalar, selain keakhlian
dan pengalaman dalam persoalan analisis data deret waktu. Dengan metode ini yang
diperhatikan pada data hanya komponen trend, sehingga signifikansi autokorelasi
diabaikan. Peramalan dengan ekstrapolasi trend merupakan peramalan regresi sederhana
data atas waktu, dan dilakukan jika data stasioner dalam varians dan tidak
berautokorelasi. Prosesnya adalah sebagai berikut,