View
7
Download
0
Category
Preview:
Citation preview
4
II. TINJAUAN PUSTAKA
2.1 Pencilan
2.1.1 Definisi Pencilan
Menurut Ferguson (1961), pencilan didefinisikan sebagai suatu data yang
menyimpang dari sekumpulan data yang lain. Menurut Barnett (1981), pencilan
adalah pengamatan yang tidak mengikuti sebagian besar pola dan terletak jauh dari
pusat data. Menurut R.K Sembiring (1950) Pencilan adalah pengamatan yang jauh
dari pusat data yang mungkin berpengaruh besar terhadap koefesien regresi
(Soemartini, 2007).
Menurut Hair, dkk. (1995), Pencilan adalah data yang muncul yang memiliki
karakteristik unik yang terlihat sangat jauh berbeda dari observasi-observasi
lainnya dan muncul dalam bentuk nilai ekstrim baik untuk sebuah variabel tunggal
atau variabel kombinasi
(Cogito Ergo Sum, 2010).
2.1.2 Pendeteksian Pencilan
Terdapat banyak cara untuk mengidentifikasi adanya pencilan atau tidak pada
sekumpulan data. Di sini, akan dijelaskan dua cara untuk mengidentifikasi
pencilan, diantaranya adalah diagram pencar, boxplot.
5
1. Diagram Pencar
Untuk melihat apakah terdapat pencilan atau tidak pada sekumpulan data dapat
dilakukan dengan memplot data dengan observasi ke-i (i=1, 2, 3, ..., n)seperti
pada gambar dibawah ini :
Dari contoh di atas, dapat dilihat bahwa terdapat salah satu data yaitu observasi
ke-28 yang mengindikasikan pencilan.
Kelemahan data dari metode ini adalah keputusan bahwa data adalah suatu
pencilan sangat tergantung pada judgement peneliti. Oleh karena itu dibutuhkan
seseorang yang ahli dan berpengalaman dalam menginterpretasikan plot tersebut.
2. Boxplot
Pencilan dapat dideteksi dengan menggunakan boxplot. Metode ini sangat
terkenal dalam mendeteksi pencilan. Metode ini menggunakan nilai quartil.
Quartil 1,2,dan 3 akan membagi sebuah urutan data menjadi empat bagian.
6
Jangkauan (Interquartile (IQR)) didefinisikan sebagai selisih antara quartil 1 dan
quartil 3, atau IQR = Q3-Q1.
Menurut Soemartini (2007), Data-data pencilan dapat ditentukan, yaitu nilai yang
kurang dari 1.5*IQR terhadap quartil 1 dan nilai yang lebih dari 1.5*IQR terhadap
quartil 3.
2.1.3 Pengaruh Pencilan (Outlier)
Pencilan (outlier) berpengaruh terhadap proses analisa data, salah satunya
terhadap nilai mean dan standar deviasi. Oleh karena itu, keberadaan pencilan
(outlier) dalam suatu pola data harus dihindari. Pencilan (outlier) dapat
menyebabkan hal-hal berikut :
1. Variance data menjadi besar
2. Interval data dan range menjadi lebar
3. Mean tidak dapat menunjukkan nilai yang sebenarnya (bias), dan
7
4. Pada beberapa analisa data, outlier dapat menyebabkan kesalahan dalam
pengambilan keputusan dan kesimpulan.
2.2 Analisis Regresi
Analisis Regresi adalah salah satu metode statistika yang dapat dipergunakan
untuk menyelidiki atau membangun model hubungan antara beberapa variabel
(Usman, 2001).
Model regresi linier, biasa dituliskan sebagai berikut:
y = xβ + e dengan ε ~ N(0, σ2 I)
Dimana: y = vektor n x 1 variabel tak bebas
x = matriks n x k variabel bebas
β = vektor k x 1 koefisien variabel bebas
ε = vektor n x 1 variabel acak galat dengan E( ) = 0 dan matriks ragam
peragam I22 )(
Menurut Myers (1990), asumsi-asumsi pada analisis regresi adalah sebagai
berikut :
1. Galat menyebar normal.
),0(N~ 2
I
2. Ragam galat homogen.
n,.....,2,1i;)(Var 2
i
3. Nilai i adalah bebas satu dengan yang lainnya.
8
0)(E i dan 22
i )(E
4. X dan Y terkait secara linier. Untuk setiap nilai X dihubungkan maka akan
membentuk garis lurus.
Dalam analisis regresi, terdapat dua model regresi, yaitu :
1. Model Regresi Linier Sederhana
ii10i XY
2. Model Regresi Linier Berganda
ikiki22i110i X........XXY
Dimana :
k10 ....,,........., Koefisien Regresi
Xi = Variabel bebas (Regressor)
Yi = Variabel tak bebas (Regressand)
i = Galat atau Error
(Myers, 1990).
2.3 Metode Kuadrat Terkecil (MKT)
Metode Kuadrat Terkecil (MKT) atau sering juga disebut dengan metode OLS
(Ordinari Least Square) diperkenalkan oleh Carl Friedrick Gauss seorang
matematikawan Jerman. Metode Kuadrat Terkecil (MKT) merupakan salah satu
metode penduga parameter ( bo,b1) yang terbaik karena bersifat tak bias dan
konsisten. Metode kuadrat terkecil akan menghasilkan ragam(varian) minimum
9
bagi parameter regresi Prinsip dasar metode kuadrat terkecil adalah dengan
meminimumkan jumlah kuadrat galat (JKG minimum), sehingga menghasilkan
penduga yang mempunyai kesalahan terkecil.
Dengan menggunakan Persamaan linier untuk pendugaan garis regresi linier,
metode kuadrat terkecil dapat diuraikan dengan notasi matematika yaitu sebagai
berikut:
yi= bo+ b1xi
Jarak vertikal antara titik observasi (xi,yi) dan titik (xi, iy ) pada garis dugaan
dapat ditulis :
iiiii xbbyatauyy ˆˆˆ0
Jumlah kuadrat dari semua jarak ini ditulis:
2
1
1
2
1
)()ˆ( io
n
i
ii
n
i
i xbbyyy
Solusi dari metode kuadrat terkecil dapat dilakukan sebagai berikut:
2
1
1
1, )()( io
n
i
io xbbybbS
0)(2 1
1
),( 10
io
n
i
i
o
bbxbby
db
dS
10
0)(2 1
11
),( 10
iio
n
i
i
bbxxbby
db
dS
Dengan menyederhanakan kedua persamaan ini maka diperoleh:
n
i
i
n
i
io yxbnb11
1
i
n
i
i
n
i
i
n
i
i xyxbxb
11
2
1
1
0 ...... (Persamaan normal kuadrat terkecil)
n
i
i
n
i
ii
XX
YYXX
b
1
2
11
)(
))((
n
i
n
i
ii
n
i
n
i
i
n
i
iii
nXX
nYXYX
b
1
2
1
2
1 111
/)(
/))((
dan XbYbo 1
Persamaan garis kuadrat terkecil yang didapat adalah:
Xbby o 1ˆ atau )(ˆ
1 XXbYy
Persamaan garis diatas dapat digunakan untuk memprediksi Y oleh nilai X yang
berpadanan.
Selama asumsi-asumsi regresi dipenuhi oleh data, maka dugaan metode kuadrat
terkecil bersifat tak bias dengan varians minimum. Karena memenuhi kedua sifat
ini maka MKT dikenal sebagai penduga yang BLUE ( Best Linear Unbiased
Estimator).
11
2.4 Mean Square Error (MSE)
Jika penduga tak bias dari , maka 2))ˆ((E sama dengan ragam penduga
. Tetapi, jika suatu penduga yang bias dari , maka 2))ˆ((E disebut
Mean Square Error (MSE) atau kuadrat tengah galat dari penduga .
MSE ( ) = 2))ˆ((E
Bukti :
MSE ( ) = )ˆ2ˆ(E 22
= ))ˆ(E2)ˆ(E 22
= {2222 ))ˆ(E())ˆ(E{(})ˆ(E2)ˆ(E }
= {22 ))ˆ(E()ˆ(E } + {
22 )ˆ(E2))ˆ(E( }
= {22 ))ˆ(E()ˆ(E } + {
2))ˆ(E( }
= Var ( ) + (Bias ( ))2
2.5 Robust
Regresi robust diperkenalkan oleh Andrews (1972) dan merupakan metode regresi
yang digunakan ketika distribusi dari error tidak normal dan atau adanya beberapa
pencilan yang berpengaruh pada model (Ryan, 1997). Metode ini merupakan alat
12
penting untuk menganalisa data yang dipengaruhi oleh pencilan , sehingga
dihasilkan model yang robust atau resistance terhadap pencilan.
Prosedur robust ditunjukan untuk mengakomodasi adanya keanehan data,
sekaligus meniadakan identifikasi adanya data pencilan, dan juga bersifat otomatis
dalam menanggulangi data pencilan. Beberapa metode penduga dalam regresi
robust diantaranya Penduga M, Least Trimmed Square (LTS), Penduga MM,
Penduga S, dan Least Mean Square (LMS).
2.6 Penduga-MM
Penduga MM (MM-estimator) diperkenalkan oleh Yohai (1987), yaitu sebuah
metode yang secara simultan mempunyai dua sifat, yaitu penduga yang bersifat
breakdown point tinggi dan efisiensi tinggi, atau dengan kata lain Penduga MM
(MM-estimator) bertujuan menghasilkan sebuah penduga yang breakdown point
tinggi serta mempertahankan efisiensi baik, dimana breakdown point dan efisiensi
merupakan sifat terpenting dalam penduga robust.
Breakdown point adalah jumlah maksimum data terkontaminasi (pencilan) yang
dapat ditoleransi oleh suatu metode. Adapun yang termasuk breakdown point
tinggi diantaranya, Least Median Square (LMS), Least Trimmed Square (LTS),
Penduga S, dan Penduga MM. Dikatakan breakdown point terkecil jika nilai
breakdown pointnya 1/n. Adapun yang termasuk breakdown point terkecil
diantaranya, Metode Kuadrat Terkecil (MKT), dan penduga M (Montgomeri
et.al.,1992).
13
Efisiensi sampel terbatas dari penduga robust didefinisikan sebagai perbandingan
nilai Kuadrat Tengah Galat (KTG) atau Mean Square Error (MSE) antara Metode
Kuadrat Terkecil (MKT) dengan penduga robust
(Montgomeri et.al.,1992).
Yohai (1987) memperkenalkan penduga MM dalam tiga tahap, diantaranya :
1. Menghitung nilai penduga awal. Penduga awal yang digunakan adalah
penduga LTS (Least Median Square).
Perhitungan penduga LTS, yaitu meminimumkan jumlah kuadrat galat
terhadap subhimpunan data berukuran h yang dapat dirumuskan sebagai
berikut.:
LTS =
h
1i
2
iemin
= 2
i
h
1i
i )yy(min
= 2
h
1i
i )xy(min
, dengan h memenuhi nh4
)1pn3(
Solusi pada persamaan di atas dapat diperoleh dengan menggunakan
turunan atau differensial seperti pada penyelesaian penduga MKT. Hanya
pada LTS persamaan tersebut dihitung pada subhimpunan data terbaik yang
berukuran h.
14
2. Menghitung parameter skala dari penduga M, menggunakan galat
berdasarkan penduga awal.
Persamaan yang digunakan untuk solusi penyelesaiannya, yaitu sebagai
berikut:
)1m(ˆ
= median
6745.0
| e|
= median
6745 0.
| ˆxy| m
LTSi ; i = 1, 2, ..., n ; m= iterasi 0, 1,2,..,m
3. Menghitung penduga akhir berdasarkan residual penduga awal dengan
menggunakan rumus penduga M.
Prinsip dasar penduga-M adalah meminimumkan fungsi objektif:
n
1i
i
ˆ
e
2
ii
2
ii
2
)i( )xy()yy(e
Jika turunan dari , maka fungsi objektif diatas akan menjadi bentuk
persamaan :
0xˆ
ei
n
1i
i
dalam perhitungan fungsi psi ( ) juga digunakan fungsi pembobot (weight)
yang dinotasikan :
)e(
)e(w
i
ii
15
Dengan fungsi pembobot iw , maka persamaannya menjadi:
0xˆ
ew i
in
1i
i
Jika dibuat dalam bentuk matriks maka Persamaan penduga M adalah sebagai
berikut.
y)w'x)xw'x(ˆ)m(
1
)m()1m(
; dengan
lainnya ;
c < | ˆe | ;
o
c
ˆe
1w
i
22
i
m
Setelah menyelesaikan fungsi diatas, maka akan didapat parameter penduga
M, dan akan menjadi solusi nilai penduga MM.
Recommended