Upload
others
View
16
Download
2
Embed Size (px)
Citation preview
PEMODELAN ROBUST GEOGRAPHICALLY WEIGHTED
REGRESSION (RGWR) PADA DATA YANG MENGANDUNG
PENCILAN
(Studi Kasus Indeks Pembangunan Manusia Provinsi Jawa Timur
Tahun 2015)
SKRIPSI
oleh:
FEBAWANTI
135090500111013
PROGRAM STUDI STATISTIKA
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BRAWIJAYA
MALANG
2017
i
PEMODELAN ROBUST GEOGRAPHICALLY WEIGHTED
REGRESSION (RGWR) PADA DATA YANG MENGANDUNG
PENCILAN
(Studi Kasus Indeks Pembangunan Manusia Provinsi Jawa
Timur Tahun 2015)
SKRIPSI
Sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains
dalam bidang Statistika
oleh:
FEBAWANTI
135090500111013
PROGRAM STUDI STATISTIKA
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BRAWIJAYA
MALANG
2017
ii
LEMBAR PENGESAHAN SKRIPSI
PEMODELAN ROBUST GEOGRAPHICALLY WEIGHTED
REGRESSION PADA DATA YANG MENGANDUNG
PENCILAN
(STUDI KASUS INDEKS PEMBANGUNAN MANUSIA
PROVINSI JAWA TIMUR TAHUN 2015)
oleh:
FEBAWANTI
135090500111013
Setelah dipertahankan di depan Majelis Penguji
pada tanggal 12 Juli 2017
dan dinyatakan memenuhi syarat untuk memperoleh gelar
Sarjana Sains dalam bidang Statistika
Dosen Pembimbing
Prof. Dr. Ir. Henny Pramoedyo, MS
NIP. 195707051981031009
Mengetahui,
Ketua Jurusan Matematika
Fakultas MIPA
Universitas Brawijaya
Ratno Bagus Edy Wibowo, S.Si., MSi. Ph.D
NIP. 197509082000031003
iii
LEMBAR PERNYATAAN
Saya yang bertanda tangan di bawah ini :
Nama : Febawanti
NIM : 135090500111013
Jurusan : Matematika
Penulisan Skripsi berjudul :
PEMODELAN ROBUST GEOGRAPHICALLY WEIGHTED
REGRESSION PADA DATA YANG MENGANDUNG
PENCILAN
(Studi Kasus Indeks Pembangunan Manusia Provinsi Jawa
Timur Tahun 2015)
Dengan ini menyatakan bahwa :
1. Isi dari Skripsi yang saya buat adalah benar-benar karya
sendiri dan tidak menjiplak karya orang lain, selain nama-
nama termaktub di isi dan tertulis di daftar pustaka dalam
Skripsi ini.
2. Apabila dikemudian hari ternyata Skripsi yang saya tulis
terbukti hasil jiplakan, maka saya akan bersedia
menanggung segala resiko yang akan saya terima.
Demikian pernyataan ini dibuat dengan segala kesadaran.
Malang, 12 Juli 2017
Yang menyatakan,
Febawanti
NIM. 135090500111013
iv
PEMODELAN ROBUST GEOGRAPHICALLY WEIGHTED
REGRESSION (RGWR) PADA DATA YANG
MENGANDUNG PENCILAN
Febawanti, Henny Pramoedyo
Jurusan Matematika, Fakultas Matematika dan Ilmu
Pengetahuan Alam, Universitas Brawijaya, Malang
ABSTRAK
Model Geographically Weighted Regression (GWR)
merupakan pengembangan dari model regresi klasik atau bentuk
lokal regresi yang mempertimbangkan pengaruh lokasi dari titik
pengamatan yang menghasilkan penduga parameter model yang
bersifat lokal untuk setiap titik atau lokasi di mana data tersebut
dikumpulkan. Dalam melakukan analisis data terkadang
ditemukan outlier, adanya outlier dapat berdampak pada hasil
pendugaan parameter yaitu menghasilkan penduga parameter yang
bersifat bias. Salah satu metode pendugaan parameter utnuk
mendapatkan penduga yang lebih kekar terhadap keberadaan
outlier adalah metode M-estimation. Penelitian ini bertujuan untuk
mendapatkan model GWR yang lebih kekar terhadap keberadaan
outlier. Pemodelan ini diaplikasikan pada data Indeks
Pembangunan Manusia (IPM) Provinsi Jawa Timur tahun 2015.
Peubah respon yang digunakan pada penelitian ini adalah Indeks
Pembangunan Manusia dan peubah predictor yaitu Angka
Harapan Hidup (AHH) dalam %, Rata-Rata Lama Sekolah (RLS)
dalam tahun, Harapan Lama Sekolah (HLS) dalam tahun,
pengeluaran per kapita dalam ratusan ribu rupiah. Model GWR
dengan metode M-estimation memberikan hasil dengan nilai R2
lebih dari 50% pada semua titik pengamatan.
Kata Kunci : GWR, M-estimation, IPM
v
ROBUST GEOGRAPHICALLY WEIGHTED REGRESSION
(RGWR) MODELLING ON DATA WITH OUTLIER
Febawanti, Henny Pramoedyo
Mathematic Department, Faculty of Sciences, Brawijaya
University, Malang
ABSTRACT
Geographically Weighted Regression (GWR) model is a
regression model of development or local forms of regression that
consider the influence of the location of the point of observation that
produces the penduga parameter of the model that is local to each point
or the location where the data is collected. In doing data analysis
sometimes found an outlier, the presence of outlier can have an impact
on the results of prediction parameters i.e. generate penduga
parameters that are biased. One of the parameter prediction method to
get a more burly penduga against the existence of an outlier is a
method of M-estimation. This research aims to gain a more hefty
GWR model against the existence of an outlier. This was applied to
modeling data infant mortality (IPM) East Java province by 2015. The
response variables were used in this research is Human
Develompment Index and predictor variables is Life Expentancy (%),
Mean Years of Schooling (years), Expected Years of Schooling
(years), and Expenditure per Capita (hundred thousand rupiah). GWR
model with M-estimation methods give value of R2 of all observation
more than 50%.
Keywords : GWR, M-estimation, human development index
vi
KATA PENGANTAR
Puji dan Syukur ke hadirat Allah SWT atas Rahmat,
Taufiq dan Hidayah-Nya sehingga penulis dapat menyelesaikan
Skripsi. Skripsi ini disusun untuk memenuhi salah satu syarat
akademik dalam menempuh jenjang pendidikan Sarjana Statistika,
Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas
Brawijaya Malang. Selama menyusun skripsi ini, penulis
mendapat banyak bantuan dan dukungan, untuk itu penulis ingin
menyampaikan rasa terima kasih kepada:
1. Prof. Dr. Ir. Henny Pramoedyo, MS dosen pembimbing skripsi
yang telah memberikan bimbingan, saran dan arahan dalam
menyelesaikan skripsi ini.
2. Rahma Fitriani, S.Si., M.Sc., Ph.D ketua Program Studi Statistika
Universitas Brawijaya dan selaku dosen penguji I.
3. Achmad Effendi, S.Si., M.Sc., Ph.D selaku dosen penguji II.
4. Ratno Bagus Edy Wibowo, S.Si., M.Si., Ph.D, ketua Jurusan
Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam
Universtas Brawijaya.
5. Orang tua, keluarga tersayang serta teman-teman terutama fairuz,
retno, fifty, silfi, siti, sabrina, fitri, hannah, ellina dan event yang
selalu mendoakan dan memberikan dukungan moral maupun
materi.
Penulis menyadari bahwa skripsi ini masih mengandung
banyak kekurangan. Oleh karena itu, saran dan kritik sangat
diharapkan. Semoga skripsi ini memberikan manfaat bagi
pembaca.
Malang, Juli 2017
Penulis
vii
DAFTAR ISI
HALAMAN JUDUL i
LEMBAR PENGESAHAN SKRIPSI ii
LEMBAR PERNYATAAN iii
ABSTRAK iv
ABSTRACT v
KATA PENGANTAR vi
DAFTAR ISI vii
DAFTAR GAMBAR ix
DAFTAR TABEL xi
DAFTAR LAMPIRAN xiii
BAB I. PENDAHULUAN
1.1. Latar Belakang ............................................................................ 1
1.2. Rumusan Masalah....................................................................... 3
1.3. Batasan Masalah ......................................................................... 3
1.4. Tujuan ......................................................................................... 3
1.5. Manfaat ....................................................................................... 4
BAB II. TINJAUAN PUSTAKA
2.1. Pencilan (outlier) ........................................................................ 5
2.2. Pendeteksian Pencilan ................................................................. 5
2.3. M-estimation .............................................................................. 8
2.3.1. Fungsi Objektif ..................................................................... 8
2.3.2. NMAD (Normalized Median Absolute Deviation) ............... 8
2.3.3. Regresi Robust M-estimation ............................................... 9
2.4. Data Spasial ............................................................................... 11
2.4.1. Pendefinisian Data Spasial .................................................. 11
2.4.2. Sumber Data Spasial ........................................................... 12
2.4.3. Penyajian Data Spasial ........................................................ 12
2.5. Pengujian Keragaman Spasial (Heterogenitas Spasial) ............ 13
2.6. Pembentukan Pembobot ........................................................... 13
2.6.1. Bandwidth............................................................................ 13
2.6.2. Pembobot (Weighted) ......................................................... 14
2.7. Model Geographically Weighted Regression ............................ 15
2.7.1. Geographically Weighted Regression ................................ 15
Halaman
viii
2.7.2. Pendugaan Parameter Model Geographically Weighted
Regression .......................................................................... 16
2.7.3. Pengujian Parameter Model Geographically Weighted
Regression .......................................................................... 17
2.8. Pemodelan Robust Geographically Weighted Regression ......... 18
2.8.1. Pendugaan Parameter dengan Metode M-Estimation .......... 19
2.8.2. Pengujian Parameter Model Robust Geographically
Weighted Regression (RGWR) ............................................ 24
2.9. Koefisien Determinasi ............................................................... 25
2.10. Indeks Pembangunan Manusia ............................................ 26
BAB III. METODOLOGI
3.1. Sumber Data ............................................................................. 29
3.2. Prosedur Pemodelan RGWR..................................................... 29
BAB IV. HASIL DAN PEMBAHASAN
4.1. Analisis Deskriptif ................................................................... 35
4.2. Pendeteksian Pencilan .............................................................. 36
4.3. Pengujian Keragaman Spasial................................................... 38
4.4. Jarak Euclidean ......................................................................... 38
4.5. Penentuan Pembobot Spasial .................................................... 39
4.5.1. Bandwidth ........................................................................... 39
4.5.2. Pembobot (Weighted) ......................................................... 39
4.6. Pendugaan Parameter Model Robust Geographically Weighted
Regression ................................................................................. 40
4.7. Pengujian Parameter Model Robust Geographically Weighted
Regression ................................................................................. 41
4.8. Koefisien Determinasi ............................................................. 42
4.9. Pemetakan dan Pemetaan Hasil Model Robust Geographically
Weighted Regression ................................................................. 42
BAB V. KESIMPULAN DAN SARAN
5.1. Kesimpulan ............................................................................... 47
5.2. Saran ......................................................................................... 47
DAFTAR PUSTAKA 49
LAMPIRAN 51
ix
DAFTAR GAMBAR
Gambar 2.1. Hubungan Bandwidth dengan Fungsi Pembobot ......... 14
Gambar 3.1. Diagram Alir Pemodelan RGWR ................................ 32
Gambar 4.1. Pemetakan IPM Jawa Timur ....................................... 43
Gambar 4.2. Pemetaan Hasil Model RGWR .................................... 44
Halaman
x
xi
DAFTAR TABEL
Tabel 2.1. Fungsi Objektif dan Pembobot Setiap Metode ................ 8
Tabel 2.2. Analysis of Variance ..................................................... 25
Tabel 3.1. Data Indeks Pembangunan Manusia dan Faktor yang
Mempengaruhi .............................................................. 29
Tabel 4.1. Analisis Deskriptif Setiap Peubah ................................. 35
Tabel 4.2. Nilai Leverage ............................................................... 36
Tabel 4.3. Nilai DFFITS ................................................................. 37
Tabel 4.4. Jarak Euclidean Kota Malang Dengan Wilayah Lain di
Provinsi Jawa Timur ...................................................... 38
Tabel 4.5. Pembobot Untuk Kabupaten Pacitan ............................. 39
Tabel 4.6. Ringkasan Penduga Parameter RGWR ......................... 40
Tabel 4.7. Analysis of Variance ...................................................... 42
Tabel 4.8. Hasil Pemetakan IPM kab / kota di Jawa Timur
Tahun 2015 .................................................................... 43
Tabel 4.9. Hasil Pemetaan Model RGWR ...................................... 45
xii
xiii
DAFTAR LAMPIRAN
Lampiran 1. Data Indeks Pembangunan Manusia (IPM)
Jawa Timur Tahun 2015 ............................................. 53
Lampiran 2. Penentuan Pembobot Spasial ...................................... 55
Lampiran 3. Hasil Analisis Regresi Linier Berganda ...................... 56
Lampiran 4. Source Code Pemodelan Robust Geographically
Weighted Regression ................................................... 57
Lampiran 5. Pendugaan Parameter Model RGWR .......................... 60
Lampiran 6. Sisaan dan R2 Untuk Setiap Titik Pengamatan ........... 66
Lampiran 7. Peubah yang Signifikan Untuk Setiap Kabupaten / Kota
di Jawa Timur Dengan Pemodelan RGWR ................. 68
Halaman
67
1
BAB I
PENDAHULUAN
1.1. Latar Belakang
Analisis regresi merupakan analisis yang digunakan untuk
mengetahui hubungan sebab akibat antara peubah repon dengan satu
atau lebih peubah prediktor. Geographically Weighted Regression
(GWR) merupakan pengembangan dari model regresi klasik
(Fotheringham, Brundson dan Charlton, 2002). Geographically
Weighted Regression (GWR) adalah bagian dari analisis spasial
dengan pembobot berdasarkan jarak atau letak geografis lokasi
pengamatan. Pada metode GWR hasil analisis merupakan model dari
setiap lokasi pengamatan, satu lokasi pengamatan dengan lokasi
pengamatan lain akan menghasilkan model yang berbeda yaitu sesuai
dengan pembobot yang digunakan. Berdasarkan Hukum Tobler
“Segala sesuatu saling berhubungan satu dengan yang lainnya dan
sesuatu yang berdekatan lebih erat hubungannya dibandingkan dengan
sesuatu yang berjauhan”(Anselin, 1988). Hukum tersebut merupakan
dasar pengkajian permasalan data yang memiliki pengaruh lokasi atau
spasial.
Data yang diperoleh berdasarkan setiap lokasi pengamatan
terkadang terdapat pengamatan yang nilainya jauh lebih tinggi atau
lebih rendah dari pengamatan lainnya tergantung pada kondisi
geografis suatu lokasi. Keberadaan outlier, yaitu data yang memiliki
karakteristik berbeda jauh dengan pengamatan lainnya dan muncul
dalam nilai ekstrim, menyimpang dari pola yang terbentuk oleh
sebagian data akan berpengaruh terhadap proses pendugaan
parameter. Outlier dapat menyebabkan ragam menjadi lebih besar,
rata-rata tidak dapat menunjukkan nilai sebenarnya (bias) dan dapat
menyebabkan kesalahan dalam mengambil keputusan serta
kesimpulan.
Penerapan metode statistika ke dalam permasalahan yang ada di
kehidupan bermanfaat untuk membantu menemukan pemecahan dari
permasalahan tersebut. Penerapan ilmu statistika dapat membantu
mengatasi masalah di berbagai bidang kerja, baik bidang industri,
perbankan, maupun pemerintahan. Pada pemerintahan penerapan ilmu
statistika sangat penting dalam mendapatkan dan mengolah data yang
berguna untuk membantu pemerintah menentukan kebijakan yang
bertujuan untuk meningkatkan kesejahteraan masyarakat. Penetapan
2
strategi untuk meningkatkan kesejahteraan masyarakat, pada dasarnya
hal ini bertujuan agar perbaikan akan lebih terarah, fokus dan tepat
jika dilakukan dengan metode yang tepat. Dalam permasalahan ini
kesejahteraan masyarakat dapat juga dipengaruhi oleh keadaan
geografis suatu wilayah itu sendiri dan dapat pula dipengaruhi
keadaan geografis wilayah lain yang berdekatan. Apabila hal tersebut
terjadi, maka untuk mempermudah menentukan strategi/kebijakan
perbaikan dapat dilakukan dengan analisis data spasial.
Data Indeks Pembangunan Manusia (IPM) Jawa Timur tahun
2015 dapat dikatakan sebagai data spasial. Indeks Pembangunan
Manusia (IPM) terdapat beberapa indikator yang mempengaruhi yaitu
Angka Harapan Hidup (AHH) dalam %, Rata-Rata Lama Sekolah
(RLS) dalam tahun, Harapan Lama Sekolah (HLS) dalam tahun,
pengeluaran per kapita dalam ratusan ribu rupiah (BPS, 2015).
Berdasarkan indikator tersebut, Indeks Pembangunan Manusia dapat
saling dipengaruhi oleh kondisi alam atau geografis di berbagai
kabupaten / kota di Jawa Timur. Setiap kabupaten / kota yang saling
berdekatan wilayahnya pasti akan memberikan pengaruh secara
spasial terhadap wilayah lain, seperti perbedaan sumber daya alam,
sumber daya manusia, ketersediaan kesempatan kerja, ketersediaan
fasilitas kesehatan dan lain-lain. Analisis data spasial dapat membantu
memperoleh keputusan yang tepat dalam menentukan
kebijakan/perbaikan untuk menurunkan Indeks Pembangunan
Manusia dengan lebih mudah. Pada data Indeks Pembangunan
Manusia dari setiap kabupaten / kota di Jawa Timur pasti terdapat
angka yang berbeda jauh dari pengamatan lainnya. Pengamatan ini
dapat disebut sebagai pencilan/outlier. Kondisi data berpencilan
tersebut menyebabkan analisis regresi linear lokal terboboti tidak
dapat menjelaskan keragaman dengan baik dan akan menghasilkan
penduga parameter regresi yang cenderung bias.
Pada penelitian sebelumnya Zhang dan Mei (2011) telah
melakukan pendugaan parameter GWR dengan Least Absolute
Deviation pada data yang mengandung pencilan, hasil penelitian
tersebut dinyatakan bahwa dengan LAD dapat mengurangi pengaruh
outlier terhadap pendugaan parameter. Namun untuk menyelesaikan
proses pendugaan dengan meminimumkan LAD harus dilakukan
dengan cara yang cukup rumit yaitu pemograman linier metode
simpleks.
Oleh karena itu, pada penelitian ini akan dilakukan pendugaan
model RGWR dengan metode M-estimation di mana proses
3
pendugaan parameter tidak teralu rumit seperti meminimumkan LAD.
Model RGWR yang dihasilkan diharapkan lebih robust terhadap
permasalahan yang disebabkan pencilan.
1.2. Rumusan Masalah
Berdasarkan uraian latar belakang, maka rumusan masalah yang
akan dibahas dalam penelitian ini adalah:
1. Bagaimana penerapan model Robust Geographically Weighted
Regression dengan metode M-estimation pada data yang
mengandung pencilan diterapkan pada data Indeks Pembangunan
Manusia (IPM) di Provinsi Jawa Timur tahun 2015?
2. Bagaimana hasil pemetaan model Robust Geographically
Weighted Regression pada data yang mengandung pencilan
diterapkan pada data Indeks Pembangunan Manusia (IPM) di
Provinsi Jawa Timur tahun 2015?
1.3. Batasan Masalah
Batasan masalah dalam penelitian ini adalah:
1. Data yang digunakan berupa data sekunder Indeks Pembangunan
Manusia (IPM) di Provinsi Jawa Timur tahun 2015 yang
bersumber dari publikasi BPS Jawa Timur.
2. Jarak yang digunakan pada penentuan pembobot adalah jarak
euclidean.
3. Penentuan bandwidth optimum dilakukan dengan
meminimumkan cross validation.
4. Penentuan pembobot spasial yaitu fungsi Fixed Bisquare Kernel.
5. Pendugaan parameter Robust Geographically Weighted
Regression dengan metode M-estimation dan pembobot
pendugaan M-estimation adalah Tukey Bisquare.
1.4. Tujuan
Tujuan dari penelitian ini adalah:
1. Menerapkan model Robust Geographically Weighted Regression
dengan metode M-estimation pada data yang mengandung
pencilan diterapkan pada data Indeks Pembangunan Manusia
(IPM) di Provinsi Jawa Timur tahun 2015.
2. Membentuk pemetaan berdasarkan hasil model Robust
Geographically Weighted Regression pada data yang
4
mengandung pencilan diterapkan pada data Indeks Pembangunan
Manusia (IPM) di Provinsi Jawa Timur tahun 2015.
1.5. Manfaat
Manfaat dari penelitian ini adalah mengembangkan ilmu yang
diperoleh dalam pendugaan parameter dengan metode pendugaan
parameter M-estimation dan penerapan model serta membentuk
pemetaan dari Robust Geographically Weighted Regression pada data
Indeks Pembangunan Manusia (IPM) Provinsi Jawa Timur tahun
2015.
5
BAB II
TINJAUAN PUSTAKA
2.1. Pencilan (Outlier)
Menurut Hampel, Rosseeaw dan Stahel dalam Olive (2006)
Pencilan adalah pengamatan yang menyimpang dari pola yang
terbentuk oleh sebagian besar data. Pencilan berpengaruh terhadap
proses analisis data, misalnya terhadap nilai mean dan standar deviasi.
Pencilan dapat menyebabkan ragam data menjadi besar, interval dan
range menjadi lebar, mean tidak menunjukkan nilai yang sebenarnya
(bias) dan pada beberapa kasus dapat menyebabkan kesalahan dalam
pengambilan keputusan dan kesimpulan. Penolakan atau proses
menghilangkan pencilan dari tahap analisis data bukanlah prosedur
yang bijaksana. Adakalanya pencilan memberikan informasi yang
tidak bisa diberikan oleh data lainnya, misalnya pencilan timbul akibat
keadaan yang tidak biasa mungkin saja sangat penting dan harus
diselidiki lebih lanjut. Pencilan seharusnya tetap dipertahankan jika
data pencilan tersebut memang representasi dari populasi.
2.2. Pendeteksian Pencilan
Outlier merupakan suatu pengamatan yang menyimpang jauh
dari hubungan linier yang dibentuk oleh mayoritas dari data. Berikut
merupakan metode yang dapat digunakan untuk mendeteksi
keberadaan pencilan:
1. Nilai Leverage
Leverage menggambarkan seberapa tidak biasnya kasus tersebut
dalam bentuk peubah prediktornya. Leverage hanya menggambarkan
yang terjadi pada peubah prediktor. Besarnya pengaruh suatu
observasi terhadap besarnya taksiran parameter antara lain dapat
dilihat dari jarak nilai x terhadap pusat nilai x semua pengamatan.
Suatu pengamatan yang mempunyai nilai x yang jauh dari pusat nilai
x dapat berpengaruh kuat dalam analisis regresi. Oleh karena itu, nilai
x yang jauh dari pusat perlu dideteksi, salah satunya dengan elemen
6
diagonal dari matriks 𝒉. Perhitungan 𝒉 dapat menggunakan
persamaan sebagai berikut:
𝒉 = 𝑋(𝑋𝑇𝑋)−1𝑋𝑇 (2.1)
Diagonal 𝒉 menyatakan jarak dai 𝑥𝑖 ke pusat nilai x dari
semua pengamatan. ℎ𝑖𝑖 disebut dengan leverage dari pengamatan ke-
i.
Nilai pengamatan yang berpotensi sebagai pencilan jika
diagonal 𝒉 >4
𝑛. Jika nilai diagonal 𝒉 besar, maka jarak 𝑥𝑖 terhadap
pusat x besar, sehingga pengamatan ke-i merupakan pencilan.
2. Scaled Residual
Scaled Residual merupakan residual yang nilainya telah
distandarkan. Ukuran yang diperoleh dari scaled residual ini akan
terbebas dari skala, sihngga dapat dipaki untuk menentukan apakah
pengamatan tersebut merupakan pencilan atau buka berdasarkan
scaled residuals. Terdapat beberapa ukuran dari scaled residual yaitu:
a. Standardized Residuals
Ragam residuals ditaksir dengan MSE. Standardized Residuals
dari pengamatan ke-i didefinisikan sebagai berikut :
𝑠𝑖 =𝑒𝑖
√𝑀𝑆𝐸, 𝑖 = 1,2, … , 𝑛 (2.2)
di mana 𝑒𝑖 = residual pengamatan ke-i, maka
𝑀𝑆𝐸 =∑ (𝑒𝑖−�̅�)2𝑛
𝑖=1
𝑛−𝑘 (2.3)
Suatu pengamatan terdeteksi sebagai pencilan jika mempunyai nilai
absolut dari stadardized residuals > 2.
b. Studentized Residuals
Studentized Residuals menggunakan exact variance residual
yaitu 𝑣𝑎𝑟(𝑒𝑖) = 𝜎2(1 − ℎ𝑖𝑖), ℎ𝑖𝑖 merupakan diagonal dari
matriks 𝒉 . Studentized Residuals didefinisikan sebagai berikut :
𝑟𝑖 =𝑒𝑖
√𝑀𝑆𝐸(1−ℎ𝑖𝑖), 𝑖 = 1,2,… , 𝑛 (2.4)
Dari rumus tersebut dapat dilihat bahwa ℎ𝑖𝑖 berpengaruh terhadap
𝑟𝑖. Jika ℎ𝑖𝑖 besar, maka 𝑟𝑖 juga besar. Suatu pengamatan dikatakan
terdeteksi sebagai pencilan jika |𝑟𝑖| > 2.
c. PRESS Residuals (deleted residuals)
PRESS Residuals melihat selisih antara nilai pengamatan ke-1, 𝑦𝑖
dengan taksiran 𝑦𝑖 yang didapat dari model tanpa menyertakan
pengamatan ke-i.
7
PRESS Residuals didefinisikan sebagai berikut :
𝑒(𝑖) = 𝑦𝑖 − �̂�(𝑖), 𝑖 = 1,2, … , 𝑛 (2.5)
3. Influence
Influence menggambarkan besaran dari perubahan koefisien
regresi jika outlier dihilangkan dari himpunan data. Terdapat dua
jenis ukuran pengaruh yang dapat digunakan yaitu, ukuran pengaruh
global (DFFITS) dan Cook’s D, yang memberikan informasi
mengenai bagaimana kasus ke-i mempengaruhi keseluruhan
karakteristik dari persamaan regresi.
Menurut Cohen (2003), ukuran pertama dalam mengukur
pengaruh global adalah DFFITS, yang didefinisikan sebagai berikut:
(𝐷𝐹𝐹𝐼𝑇𝑆)𝑖 = 𝑡𝑖 (ℎ𝑖𝑖
1−ℎ𝑖𝑖)1/2
(2.6)
dengan
𝑡𝑖 =�̂�𝑖−�̂�(𝑖)
√𝑀𝑆 (𝑖)ℎ𝑖𝑖 (2.7)
Untuk mengukur pengaruh global lainnya menggunakan Cook’sD
dengan persamaan sebagai berikut:
𝐶𝑜𝑜𝑘′𝑠𝐷𝑖 =∑ (�̂�𝑖−�̂�(𝑖))
2𝑛𝑖=1
(𝑘+1)𝑀𝑆 (2.8)
Melalui proses subtitusi persamaan 2.8 dan 2.7 maka persamaan
tersebut dapat ditulis sebagai berikut :
𝐶𝑜𝑜𝑘′𝑠𝐷𝑖 =(𝐷𝐹𝐹𝐼𝑇𝑆)𝑖
2𝑀𝑆 (𝑖)
(𝑘+1)𝑀𝑆 (2.9)
DFFITS dan Cook’sD keduanya dapat digunakan untuk
mmemberikan informasi mengenai pengaruh dari kasus ke-i yang
merupakan outlier. DFFITS bergantung pada ℎ𝑖𝑖, sehingga ukuran
deteksi pencilan dengan DFFITS memperhatikan nilai x dan y secara
simultan. Suatu observasi dikatakan berpotensi sebagai pencilan jika
|𝐷𝐹𝐹𝐼𝑇𝑆| > 2√𝑘
𝑛, dengan n meyatakan banyaknya observasi dan k
menyatakan banyaknya parameter dalam model. Untuk Cook’sD
digunakan nilai cut off 1, 0, atau dengan nilai kritis dan distribusi F
8
dengan 𝑑𝑓 = (𝑘 + 1, 𝑛 − 𝑘 − 1). Jika nilai Cook’sD melebihi nilai
kritis dari distribusi F maka dideteksi sebagai pencilan (Cohen, 2003).
2.3. M-estimation
2.3.1. Fungsi Objektif
Fungsi objektif adalah fungsi yang digunakan untuk mencari
pembobot pada regresi robust. Fungsi objektif dan fungsi pembobot
didefinisikan pada Tabel 2.1.
Tabel 2.1. Fungsi Objektif dan Pembobot setiap Metode
Metode Fungsi Objektif Fungsi Pembobot Interva
l
Least
Square
2
2
1)( iiLS uu 1)( iLS uw iu
Huber
2
2
2
1
2/)(
)(ccu
u
ui
i
iH
i
iuc
uw/
1H
cu i
cu i
Tukey
Bisquar
e
6/
11)(
2
32
6B
2
c
u c
uc
i
i
0
12
2
Bc
u
i
i
uw
cu i
cu i
di mana nilai c metode Huber dan Tukey Bisquare disebut tunning
constant. Diketahui bahwa tunning constant untuk metode Tukey
Bisquare adalah c = 4,685.
2.3.2. NMAD (Normalized Median Absolute Deviation)
Misalkan 𝑥1, 𝑥2, … , 𝑥𝑛 adalah nilai-nilai dari contoh acak dari
distribusi yang mempunyai mean 𝜇 dan variance 𝜎2. Dapat dituliskan
dalam bentuk berikut:
𝑥𝑖 = 𝜇 + 𝑢𝑖, 𝑖 = 1,2,… , 𝑛
Misalkan 𝑢𝑖 mempunyai distribusi 𝐹0, untuk setiap 𝑖 = 1,2, … , 𝑛
dan 𝑢𝑖 saling bebas. Didefinisikan 𝑀𝐴𝐷(𝑥) = 𝑀𝐴𝐷(𝑥1, 𝑥2, … , 𝑥𝑛) =𝑚𝑒𝑑{|𝑥 − 𝑚𝑒𝑑(𝑥)|} di mana median merupakan ukuran pusat data
yang robust terhadap outlier (Maronna, 2006). Jika x simetris, maka
9
𝑚𝑒𝑑(𝑥) = 𝜇 sehingga diperoleh 𝑀𝐴𝐷(𝑥) = 𝑚𝑒𝑑{|𝑥𝑖 − 𝜇|} dan
berlaku:
𝑃𝑟{|𝑥𝑖 − 𝜇| ≤ 𝑀𝐴𝐷(𝑥)} =1
2
𝑃𝑟{−𝑀𝐴𝐷(𝑥) ≤ 𝑥𝑖 − 𝜇 ≤ 𝑀𝐴𝐷(𝑥)} =1
2
𝑃𝑟 {−𝑀𝐴𝐷(𝑥)
𝜎≤
𝑥𝑖 − 𝜇
𝜎≤
𝑀𝐴𝐷(𝑥)
𝜎} =
1
2
𝑃𝑟 {−𝑀𝐴𝐷(𝑥)
𝜎≤ 𝑍 ≤
𝑀𝐴𝐷(𝑥)
𝜎} =
1
2
Jika 𝑍~𝑁(0,1), maka didapatkan
�̂� =𝑀𝐴𝐷(𝑥)
𝜎 (2.10)
Persamaan 2.10 disebut dengan Normalized Median Absolute
Deviation (NMAD (x)). NMAD (x) merupakan pendugaan yang
robust untuk 𝜎 (Maronna, 2006).
2.3.3. Regresi Robust M-estimation
Penduga-M dikenalkan oleh Huber tahun 1973 yang
merupakan metode yang sederhana baik dalam perhitungan maupun
secara teoritis. Pendugaan ini menganalisis data dengan
mengasumsikan bahwa sebagian besar yang terdeteksi pencilan pada
peubah prediktor. Regresi robust diperkenalkan Andrews (1972)
dalam Ryan (1997). Metode ini merupakan alat penting untuk
menganalisis data yang dipengaruhi oleh outlier untuk menghasilkan
model yang robust atau resistant terhadap outlier. Suatu penduga yang
resistant adalah tidak terpengaruh oleh perubahan besar pada bagian
kecil data atau perubahan kecil pada bagian besar data. Prosedur
robust ditujukan untuk mengakomodasi adanya keanehan data,
sekaligus meniadakan identifikasi adanya data outlier dan juga
bersifat otomatis dalam menanggulangi data outlier. Chen (2002)
menyebutkan beberapa prosedur penduga parameter dalam regresi
robust, dua diantaranya adalah M-Estimation yang diperkenalkan
Huber (1973) dan Least Trimmed Squares (LTS) yang diperkenalkan
oleh Rousseeuw (1984).
Misalkan 𝜌(𝑢) adalah suatu fungsi untuk 𝑢 dan 𝜎 dengan 𝑢 =𝑦𝑖−∑ 𝑥𝑖𝑗𝛽𝑗
𝑘𝑗=0
𝜎. Menurut Montgomery dan Peck (2006), pada prinsipnya
10
estimasi M merupakan estimasi yang meminimumkan suatu fungsi
galat 𝜌 sebagai berikut:
�̂�𝑀 = 𝑚𝑖𝑛𝛽 ∑ 𝜌 ( 𝑖
𝜎)𝑛
𝑖=1 = 𝑚𝑖𝑛𝛽 ∑ 𝜌 (𝑦𝑖−∑ 𝑥𝑖𝑗𝛽𝑗
𝑘𝑗=0
𝜎)𝑛
𝑖=1 (2.11)
Untuk memperoleh persamaan 2.11, dengan menyelesaikan
persamaan:
𝑚𝑖𝑛𝛽 ∑ 𝜌(𝑢𝑖)𝑛𝑖=1 = 𝑚𝑖𝑛 ∑ 𝜌 ( 𝑖
𝜎)𝑛
𝑖=1 = 𝑚𝑖𝑛𝛽 ∑ 𝜌 (𝑦𝑖−∑ 𝑥𝑖𝑗𝛽𝑗
𝑘𝑗=0
𝜎)𝑛
𝑖=1 (2.12)
dengan dipilih penduga untuk 𝜎 adalah
�̂� =𝑀𝐴𝐷
0.6745=
𝑚𝑒𝑑𝑖𝑎𝑛|𝑥𝑖−𝑚𝑒𝑑𝑖𝑎𝑛(𝑥𝑖)|
0.6745 (2.13)
Pemilihan konstanta 0.6745 membuat �̂� suatu penduga yang
mendekati tak bias dari 𝜎 jika n besar dan galat berdistribusi normal
(Montgomery dan Peck, 2006). Fungsi 𝜌 adalah fungsi yang
memberikan kontribusi pada masing-masing galat pada fungsi
objektif. Untuk meminimumkan persamaan 2.11, dicari turunan
parsial pertama dari �̂�𝑀 terhadap 𝛽 sehingga diperoleh persamaan
∑ 𝑥𝑖𝑗𝜓 (𝑦𝑖−∑ 𝑥𝑖𝑗𝛽𝑗
𝑘𝑗=0
𝜎)𝑛
𝑖=1 = 0 (2.14)
Dengan 𝜓 = 𝜌′ dan 𝑥𝑖𝑗 adalah pengamatn ke-i pada peubah bebas ke-
j.
Draper dan Smith (1998) memberikan penyelesaian persamaan 2.14
yaitu dengan mendifinisikan suatu fungsi pembobot
𝜔(휀𝑖) =𝜓(
𝑦𝑖−∑ 𝑥𝑖𝑗𝛽𝑗𝑘𝑗=0
𝜎)
(𝑦𝑖−∑ 𝑥𝑖𝑗𝛽𝑗
𝑘𝑗=0
𝜎)
(2.15)
Karena 𝑢𝑖 = 𝑖
𝜎 sebagai pengganti 𝑒𝑖, maka persamaan 2.15 menjadi
𝜔𝑖 = 𝜔(𝑢𝑖) =𝜓(𝑢𝑖)
(𝑢𝑖)= {
𝑢𝑖(1−(𝑢𝑖𝑐)2)2
𝑢𝑖, |𝑢𝑖| ≤ 𝑐
0 , |𝑢𝑖| > 𝑐
(2.16)
11
𝜔𝑖 = {𝑢𝑖 (1 − (𝑢𝑖
𝑐)2)2
, |𝑢𝑖| ≤ 𝑐
0 , |𝑢𝑖| > 𝑐
(2.17)
Untuk fungsi pembobot Tukey Bisquare, konstanta yang digunakan
adalah 𝑐 = 4.685. Dengan demikian persamaan 2.14 menjadi
∑ 𝑥𝑖𝑗𝜔𝑖(𝑦𝑖 − ∑ 𝑥𝑖𝑗𝛽𝑗𝑘𝑗=0 )𝑛
𝑖=1 = 0 (2.18)
Dengan meminimumkan persamaan 2.18 dapat diperoleh penduga
parameter dan pendugaan parameter disebut weighted least squares
(WLS), sehingga estimasi parameter menjadi:
�̂� = (𝑿′𝝎𝑖𝑿)−1𝑿′𝝎𝑖𝒀 (2.19)
Pembobot dalam M-estimation bergantung pada galat dan koefisien.
Fox (2002) menyatakan untuk menyelesaikan masalah tersebut perlu
dilakukan prosedur iterasi yang disebut iteratively reweighted least
squares (IRLS).
Tiga bentuk M-Estimation diantaranya estimasi least square,
Huber dan Tukey bisquare (biweight). Bentuk fungsi objektif dan
fungsi pembobot untuk ketiga jenis M-Estimation dapat dilihat di
Tabel 2.1. M-estimation Least Square dengan 1)( * ewLS merupakan
metode OLS. M-estimation Huber melalui fungsi (.) melibatkan
pengkuadratan galat yang kecil seperti pada OLS tetapi memberikan
galat yang besar sedemikian rupa untuk mengurangi pengaruhnya
(Myers, 1990).
2.4. Data Spasial
2.4.1. Pendefinisian Data Spasial
Menurut Prahasta (2009), data spasial merupakan data yang
memuat informasi geografis sehingga dapat disajikan pada sebuah
peta. Data spasial memiliki ketergantungan antara data dan lokasi.
Data spasial memiliki sistem koordinat tertentu sebagai dasar
referensi, sehingga mempunyai dua bagian penting yang membuat
perbedaan dengan data yang lain:
1. Informasi lokasi (spasial), berkaitan dengan suatu koordinat baik
koordinat geografi (lintang dan bujur) dan koordinat XYZ,
termasuk diantaranya informasi datum dan proyeksi.
2. Informasi deskriptif (atribut) atau informasi non spasial yaitu
keterangan yang berkaitan dengan suatu lokasi (spasial), contoh:
jenis vegetasi, populasi dan sebagainya.
12
2.4.2. Sumber Data Spasial
Sumber memperoleh data spasial menurut Geologinesia
(2015):
1. Sumber Data dari Sistem Penginderaan Jauh
Pengindraan jauh antara lain adalah citra satelit, foto udara dan
sebagainya. Data Pengindraan Jauh dapat dikatakan sebagai sumber
data yang terpenting bagi SIG (Sistem Informasi Geografi) karena
ketersediaanya secara berkala. Dengan adanya bermacam-macam
satelit di ruang angkasa dengan setiap spesifikasi yang berbeda,
sehingga dapat menerima berbagai jenis citra satelit untuk beragam
tujuan pemakaian. Data ini biasanya direpresentasikan dalam format
raster. Raster adalah struktur data yang tersusun dalam bentuk matriks
atau piksel berbentuk grid.
2. Sumber Data dari Peta Analog
Peta analog: peta topografi, peta tanah dan sebagainya. Peta
analog adalah peta dalam bentuk cetakan. Pada umumnya peta analog
dibuat dengan teknik kartografi, sehingga sudah mempunyai referensi
spasial seperti koordinat, skala, arah mata angin. Peta analog
dikonversi menjadi peta digital, referensi spasial dari peta analog
memberikan koordinat sebenarnya di permukaan bumi pada peta
digital yang dihasilkan. Biasanya peta analog direpresentasikan dalam
format vektor.
3. Sumber Data Dari GPS dan Hasil Pengukuran Lapangan
Teknologi GPS memberikan terobosan penting dalam
menyediakan data bagi SIG. Keakuratan pengukuran GPS semakin
tinggi dengan berkembangnya teknologi. Data ini biasanya
direpresentasikan dalam format vektor, contoh: data batas
administrasi, batas kepemilikan lahan, batas persil, batas hak
pengusahaan hutan dan lain-lain. Pada umumnya data ini merupakan
sumber data atribut.
2.4.3. Penyajian Data Spasial
Bentuk/cara penyajian data spasial yang paling tepat adalah
dengan menggunakan peta. Peta tersusun dari titik-titik koordinat
sesuai dengan letak wilayah tersebut di permukaan bumi.
13
2.5. Pengujian Keragaman Spasial (Heterogenitas Spasial)
Perbedaan karakteristik antar lokasi pengamatan satu dengan
lainnya yang saling berdekatan mengakibatkan adanya keheterogenan
spasial. Hipotesis yang melandasi pengujian keheterogenan spasial
(Anselin, 1988):
H0: 𝜎12 = 𝜎2
2 = ⋯ = 𝜎𝑛2 = 𝜎2 (tidak terdapat heterogenitas spasial),
melawan
H1: paling sedikit ada satu i di mana 𝜎𝑖2 ≠ 𝜎2 (terdapat
heterogenitas spasial)
Statistik uji BP:
1
2𝒇′𝒁(𝒁′𝒁)−1𝒁′𝒇 + (
𝟏
𝑻) [
𝒆𝑻𝑾𝒆
𝝈𝟐 ]𝟐
~𝜒(𝑝+1)2 (2.20)
di mana
𝑓𝑖 = (𝑒𝑖
2
𝜎2− 1)
𝑖 = 1,2,… , 𝑛 dengan i merupakan lokasi pengamatan ke - i
𝑘 = banyaknya peubah prediktor 1,2,… , 𝑝 𝒇 = (𝑓1, 𝑓2, … , 𝑓𝑛)′ 𝒁 = matriks berdimensi 𝑛 × (𝑘 + 1) berisi peubah prediktor yang
telah dibakukan untuk setiap pengamatan
𝜎2 = ragam galat 𝑒𝑖
𝑒𝑖 = galat untuk pengamatan ke – i
T = Tr[𝑾𝑇𝑾 + 𝑾𝟐]
Tolak H0 jika SU > 𝜒(𝛼
2,𝑝+1)
2 berarti terdapat keheterogenan spasial
pada data.
2.6. Pembentukan Pembobot
2.6.1. Bandwidth
Bandwidth merupakan radius (b) suatu lingkaran sehingga
sebuah titik lokasi pengamatan yang berada dalam radius lingkaran
masih dianggap berpengaruh dalam membentuk parameter di titik
lokasi pengamatan ke-i (Fotheringham dkk, 2002). Oleh karena itu,
hasil estimasi model GWR tidak terlalu sensitif terhadap fungsi
pembobot namun sangat sensitif terhadap pemilihan bandwidth dari
fungsi pembobot yang dipilih. Bandwidth optimum diperoleh jika nilai
CV yang dihasilkan adalah paling minimum. Nilai CV diperoleh dari
persamaan:
14
𝐶𝑉(𝑏) = ∑ [𝑦𝑖𝑛𝑖=1 − �̂�≠𝑖(𝑏)]2 (2.21)
Bandwidth optimum didapatkan dari persamaan sebagai berikut:
𝑏𝑜𝑝𝑡 = 𝑚𝑖𝑛𝑏>0 𝐶𝑉(𝑏) (2.22)
Metode yang digunakan untuk meminimumkan Cross Validation
adalah metode Golden Section Search. Golden Section Search
merupakan cara untuk memecahkan masalah pemrograman nonlinier
dengan satu peubah. Pada kasus ini pemograman nonlinier dengan
tanpa kendala dan satu peubah yaitu �̂�≠𝑖(𝑏), merupakan nilai duga 𝑦𝑖
namun pengamatan di lokasi i tidak disertakan dalam proses
pendugaan. Tujuan dari pemrograman nonlinier ini adalah mencari
nilai maksimum atau minimum dari �̂�≠𝑖(𝑏), 𝑏 𝜖 [𝑑, 𝑒] guna
mendapatkan solusi optimal untuk 𝑏.
Gambar 2.1. Hubungan Bandwidth dengan Fungsi Pembobot
Gambar 2.1 menunjukan bahwa bandwidth bersifat distance-
decay (yang menunjukkan penurunan nilai pembobot seiring dengan
semakin jauhnya jarak antar wilayah). Nilai pembobot akan semakin
besar jika letak wilayah ke-i dan ke-j semakin dekat dan sebaliknya.
Terlalu kecil bandwidth maka ragam penduga terlalu besar. Terlalu
besar bandwidth maka bias penduga akan besar (Fotheringham dkk,
2002).
2.6.2. Pembobot (Weighted)
Pembobot dalam analisis data spasial digunakan untuk
memberikan penaksiran hasil parameter yang berbeda di setiap lokasi
pengamatan. Pembobotan kernel memiliki dua tipe umum yaitu fixed
dan adaptive. Pada penelitian ini akan digunakan pembobot Bisquare
Kernel. Berikut merupakan persamaan pembobot Bisquare Kernel
(Fotheringham dkk, 2002):
Bisquare Kernel
15
𝑤𝑖𝑗 = {[1 − (𝑑𝑖𝑗
𝑏)2
]2
, jika 𝑑𝑖𝑗 ≤ b
0 , lainnya
(2.23)
2.7. Model Geographically Weighted Regression (GWR)
2.7.1. Geographically Weighted Regression (GWR)
Model Geographically Weighted Regression (GWR)
merupakan pengembangan dari model regresi linier klasik terboboti
yang bersifat lokal atau bervariasi secara spasial. Model ini
menghasilkan penduga parameter yang hanya dapat digunakan pada
lokasi di mana data tersebut diamati dan dikumpulkan (Fotheringham
dkk, 2002). Secara sistematis model GWR dapat dituliskan:
𝑦𝑖 = 𝛽0(𝑢𝑖, 𝑣𝑖) + ∑ 𝑥𝑖𝑘𝛽𝑘(𝑢𝑖, 𝑣𝑖)𝑝𝑘=1 + 휀𝑖 ; 𝑖 = 1,2,… , 𝑛 (2.24)
di mana
𝑦𝑖 = Peubah respon ke - i
𝛽0(𝑢𝑖, 𝑣𝑖) = konstanta/intercept pada pengamatan ke-i
𝛽𝑘(𝑢𝑖, 𝑣𝑖) = koefisien regresi peubah prediktor ke-j pada lokasi
pengamtan ke-i
(𝑢𝑖, 𝑣𝑖) = koordinat letak geografis (longtitude, latitude)
pengamatan ke-i
𝑘 = banyaknya peubah prediktor
𝑥𝑖𝑘 = peubah prediktor ke-k pada lokasi pengamatan ke-
휀𝑖 = galat pada lokasi pengamatan ke-i
Model di atas dalam matriks sebagai berikut:
𝒀 = 𝑿𝜷𝑘(𝑢𝑖, 𝑣𝑖) + 𝜺 (2.25)
𝑿 = [
1 𝑥𝑖1… 𝑥𝑖𝑝
1⋮1
𝑥21
⋮𝑥𝑛1
…⋱…
𝑥2𝑝
⋮𝑥𝑛𝑝
] 𝒀 = [
𝑦1
𝑦2
⋮𝑦𝑛
] 𝜺 = [
휀0
휀1
⋮휀𝑛
]
16
2.7.2. Pendugaan Parameter Model Geographically Weighted
Regression (GWR)
Pendugaan parameter GWR dapat dilakukan dengan metode
Weighted Least Square (WLS). Metode WLS dilakukan dengan cara
memberikan bobot yang berbeda pada setiap lokasi di mana data
tersebut dikumpulkan. Bentuk pendugaan parameter model GWR
untuk setiap lokasi dapat dituliskan sebagai berikut:
𝒀 = 𝑿𝜷 + 𝜺, kemudian diberikan pembobot sehingga diperoleh
jumlah kuadrat galat sebagai berikut:
Q = (Y – Xβ)′W(Y – Xβ) (2.26)
Persamaan (2.20) dapat diuraikan menjadi:
Q = (Y′ –β′X′) (WY – WXβ)
Q = Y′WY – Y′WXβ–β′X′ WY + β′X′ WXβ
karena 𝒀′𝑾𝑿𝜷 adalah skalar maka
(𝒀′𝑾𝑿𝜷)′= 𝜷′𝑿′𝑾𝒀 sehingga
Q = 𝒀′𝑾𝒀 – 𝜷′𝑿′ 𝑾𝒀 –𝜷′𝑿′ 𝑾𝒚 +𝜷′𝑿′ 𝑾𝑿𝜷
Q = 𝒀′𝑾𝒀 – 2β′X′WY+ β′X′WXβ (2.27)
Penduga ̂ diperoleh dengan menurunkan persamaan 2.27 terhadap β.
Nilai minimum Q diperoleh pada saat
Q0, sehingga
menghasilkan:
Q = –2X′WY+ 2X′WXβ
0 = –2(X′WY+ X′WXβ)
0 = (X′WY+ X′WXβ)
X′WX β = X′WY, atau
(X′WX) -1X′WX β = (X′WX)-1X′WY
sehingga diperoleh
�̂�= (X′WX)-1X′WY (2.28)
17
Untuk setiap titik ke-i, pendugaan parameter model GWR
dilakukan dengan operasi matriks sebagai berikut:
�̂�𝑘 (𝑢𝑖, 𝑣𝑖) = ((𝑿𝑇 W(𝑢𝑖, 𝑣𝑖)X)-1 𝑿𝑇 W(𝑢𝑖 , 𝑣𝑖)Y (2.29)
𝑾(𝑢𝑖, 𝑣𝑖) = [
𝑤1(𝑢𝑖, 𝑣𝑖) 0 ⋯ 0
0 𝑤2(𝑢𝑖, 𝑣𝑖) ⋯ 0⋮ ⋮ ⋱ ⋮0 ⋯ 0 𝑤𝑛(𝑢𝑖, 𝑣𝑖)
]
di mana
X = matriks peubah prediktor berdimensi 𝑛 × 𝑛
Y = matriks peubah respon berdimensi 𝑛 × 1
W = pembobot Bisquare Kernel
�̂�𝑘 = matriks penduga parameter model GWR
𝑢𝑖 = koordinat spasial longtitude untuk pengamatan ke-i
𝑣𝑖 = koordinat spasial latitude untuk pengamatan ke-i
2.7.3. Pengujian Parameter Model Geographically Weighted
Regression (GWR)
Pengujian parameter model GWR dilakukan untuk
mengethaui faktor-faktor yang mempengaruhi IPM di setiap
kabupaten / kota di Jawa Timur tahun 2015.
�̂� = 𝑳𝒀
�̂� = 𝒀 − �̂� = (𝑰 − 𝑳)𝒀 (2.30)
di mana
𝐋 =
[ 𝑿𝟏
′ (𝑿′ 𝑾(𝑢1, 𝑣1)𝑿)−1 𝑿′ 𝑾(𝑢1, 𝑣1)
𝑿𝟐′ (𝑿′𝑾(𝑢2, 𝑣2)𝑿)−1 𝑿′ 𝑾(𝑢2, 𝑣2)
⋮𝑿𝒏
′ (𝑿′𝑾(𝑢𝑛, 𝑣𝑛)𝑿)−1 𝑿′ 𝑾(𝑢𝑛, 𝑣𝑛)]
I merupakan matriks identitas berukuran 𝑛 × 𝑛 (Mei, 2005).
1. Pengujian Parameter secara Simultan
Hipotesis yang melandasi pengujian ini adalah:
H0: 𝛽𝑘 = 𝛽𝑘(𝑢𝑖, 𝑣𝑖), melawan
H1: 𝛽𝑘 ≠ 𝛽𝑘(𝑢𝑖, 𝑣𝑖) Statistik uji:
(𝐽𝐾𝐺𝑂𝐿𝑆 − 𝐽𝐾𝐺𝑅𝑇𝐺)/𝑣1
𝐽𝐾𝐺𝑅𝑇𝐺/𝛿1~𝐹
([𝑣1
2
𝑣2],[
𝛿12
𝛿2])
18
di mana
𝐽𝐾𝐺𝑅𝑇𝐺 = 𝒚𝑇(𝑰 − 𝑳)𝑇(𝑰 − 𝑳)𝒚
𝐽𝐾𝐺𝑂𝐿𝑆 = 𝒚𝑇(𝑰 − 𝑯)𝑇(𝑰 − 𝑯)𝒚
𝑯 = 𝑿(𝑿𝑇𝑿)−𝟏𝑿𝑇
𝛿𝑖 = 𝑡𝑟[(𝑰 − 𝑳)𝑇(𝑰 − 𝑳)]𝑖 𝑣1 = 𝑛 − 𝑘 − 1 − 𝛿1
𝑣2 = 𝑛 − 𝑘 − 1 − 2𝛿1 + 𝛿2
Tolak H0 jika statistik uji > 𝐹([
𝑣12
𝑣2],[
𝛿12
𝛿2])
maka model GWR
memberikan hasil yang lebih baik dibandingkan model MKT atau
terdapat perbedaan yang nyata antara model GWR dengan model
MKT.
2. Pengujian Parameter secara Parsial
Untuk pengujian parameter model GWR dilakukan dengan
menggunakan statistik uji t dengan berlandaskan hipotesis sebagai
berikut:
H0: 𝛽𝑘(𝑢𝑖, 𝑣𝑖) = 0, melawan
H1: 𝛽𝑘(𝑢𝑖, 𝑣𝑖) ≠ 0
Penduga 𝛽𝑘(𝑢𝑖, 𝑣𝑖) mengikuti distribusi normal dengan rata-rata
𝛽𝑘(𝑢𝑖, 𝑣𝑖) dan matriks ragam peragam CCT, di mana
𝑪 = (𝑿𝑇 𝑾(𝑢𝑖, 𝑣𝑖)𝑿)−1𝑿𝑇𝑾(𝑢𝑖, 𝑣𝑖) (2.31)
Statistik uji:
�̂�𝑘(𝑢𝑖, 𝑣𝑖)
�̂� √𝑐𝑘𝑘
~𝑡𝑛−𝑘−1
di mana 𝑐𝑘𝑘 merupakan elemen diagonal matriks CCT. Tolak H0 jika
|SU| > 𝑡(𝛼2,𝑛−𝑘−1), maka parameter 𝛽𝑘(𝑢𝑖, 𝑣𝑖) berpengaruh terhadap
model GWR.
2.8. Pemodelan Robust Geographically Weighted Regression
(RGWR)
Robust Geographically Weighted Regression merupakan
pemodelan Geographically Weighted Regression seperti pada
umumnya, namun pendugaan parameter dilakukan dengan metode
yang lebih robust/kekar terhadap adanya pencilan pada data (Draper
and Smith, 1992). Pendugaan parameter Robust Geographically
Weighted Regression dilakukan dengan metode M-estimation.
19
2.8.1. Pendugaan Parameter dengan Metode M-Estimation
Model GWR dapat ditulis sebagai berikut:
𝑦𝑖 = 𝛽0(𝑢𝑖, 𝑣𝑖) + ∑ 𝑥𝑖𝑘𝛽𝑘(𝑢𝑖, 𝑣𝑖)𝑝𝑘=1 + 휀𝑖 ; 𝑖 = 1,2,… , 𝑛 (2.32)
di mana
𝑦𝑖 = peubah respon ke - i
𝛽0(𝑢𝑖, 𝑣𝑖) = konstanta/intercept pada pengamatan ke-i
𝛽𝑘(𝑢𝑖, 𝑣𝑖) = koefisien regresi peubah prediktor ke-j pada lokasi
pengamtan ke-i
(𝑢𝑖, 𝑣𝑖) = koordinat letak geografis (longtitude, latitude)
pengamatan ke-i
𝑘 = banyaknya peubah prediktor
𝑥𝑖𝑘 = peubah prediktor ke-k pada lokasi pengamatan ke-
휀𝑖 = galat pada lokasi pengamatan ke-i
Algoritma pendugaan parameter model RGWR dengan metode
M-estimation sebagai berikut:
1. Menentukan model GWR yang mengandung outlier.
2. Pendugaan parameter model RGWR, adapun langkah-langkah
dari metode M-estimation sebagai berikut:
a. Menentukan bentuk penduga parameter 𝛽 dengan
metode kuadrat terkecil.
b. Menghitung nilai 휀𝑖 baru berdasarkan penduga 𝛽.
c. Mencari bentuk 𝝎𝑖∗ sebagai fungsi pembobot.
d. Mencari penduga baru dengan metode WLS.
e. Mengulangi langkah a-d sampai diperoleh nilai
penduga yang konvergen dan unbias yaitu ketika
selisih �̂�(𝑢𝑖, 𝑣𝑖)𝑚 dan �̂�(𝑢𝑖, 𝑣𝑖)
𝑚+1 mendekati nol.
Model GWR dianggap mengandung outllier untuk data ke-i dari
n pengamatan, maka pendugaan 𝑦 yang mengandung outlier dari
model GWR adalah:
20
𝜌𝒚 = 𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖) + 𝜌𝜺 (2.33)
atau
𝜌𝜺 = 𝜌𝒚 − 𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖) (2.34)
Berdasarkan persamaan 2.33 maka jumlah kuadrat galat yang
mengandung outlier sebagai berikut:
𝐽𝐾𝐺 = (𝜌𝜺)𝑇𝜌𝜺
= 𝜺𝑇𝜌𝑇𝜌𝜺 ; Hukum Idempoten : 𝐻′𝐻 = 𝐻
= 𝜺𝑇𝜌 𝜺
= (𝒚 − 𝑿𝜷(𝑢𝑖, 𝑣𝑖)𝑇(𝜌)(𝒚 − 𝑿𝜷(𝑢𝑖, 𝑣𝑖)
= (𝒚 − 𝑿𝜷(𝑢𝑖, 𝑣𝑖))𝑇(𝜌)(𝒚 − 𝑿𝜷(𝑢𝑖, 𝑣𝑖))
= (𝒚𝑇 − 𝑿𝑇𝜷(𝑢𝑖, 𝑣𝑖)𝑇)(𝜌𝒚 − 𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖))
= (𝒚𝑇𝜌𝒚 − (𝒚𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖)) − (𝜷(𝑢𝑖, 𝑣𝑖)𝑇𝑿𝑇𝜌𝒚)
+((𝜷(𝑢𝑖, 𝑣𝑖)𝑇𝑿𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖))
= (𝒚𝑇𝜌𝒚 − (𝒚𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖))𝑇
− (𝜷(𝑢𝑖, 𝑣𝑖)𝑇𝑿𝑇𝜌𝒚)
+((𝜷(𝑢𝑖, 𝑣𝑖)𝑇𝑿𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖))
= (𝒚𝑇𝜌𝒚) − (𝜷(𝑢𝑖, 𝑣𝑖))𝑇(𝒚𝑇𝜌𝑿)𝑇 − (𝜷(𝑢𝑖, 𝑣𝑖)
𝑇𝑋𝑇𝜌𝒚)
+((𝜷(𝑢𝑖, 𝑣𝑖)𝑇𝑿𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖))
= (𝒚𝑇𝜌𝒚) − (𝜷(𝑢𝑖, 𝑣𝑖))𝑇(𝑿𝑇𝜌𝒚) − (𝜷(𝑢𝑖, 𝑣𝑖)
𝑇𝑿𝑇𝜌𝒚)
+((𝜷(𝑢𝑖, 𝑣𝑖)𝑇𝑿𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖))
= (𝒚𝑇𝜌𝒚) − 2(𝜷(𝑢𝑖, 𝑣𝑖))𝑇(𝑿𝑇𝜌𝒚) +
(𝜷(𝑢𝑖, 𝑣𝑖)𝑇𝑿𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖)) (2.35)
Untuk mendapatkan penduga parameter 𝛽 dengan metode OLS, maka
dapat dilakukan dengan meminimumkan persamaan 2.34 yaitu
mencari turunan pertama dari JKG terhadap 𝛽(𝑢𝑖, 𝑣𝑖)yaitu:
𝜕𝐽𝐾𝐺
𝜕(𝜷(𝑢𝑖 , 𝑣𝑖))𝑇
=𝜕(𝒚𝑇𝜌𝒚) − 2(𝜷(𝑢𝑖, 𝑣𝑖))
𝑇(𝑿𝑇𝜌𝒚) + (𝜷(𝑢𝑖, 𝑣𝑖)𝑇𝑿𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖))
𝜕(𝜷(𝑢𝑖, 𝑣𝑖))𝑇
= 0 − 2𝑿𝑇𝜌𝒚 + 𝑿𝑇𝜌𝜷(𝑢𝑖, 𝑣𝑖) + (𝜷(𝑢𝑖, 𝑣𝑖)𝑇𝑿𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖)
= −2𝑿𝑇𝜌𝒚 + 𝑿𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖) + 𝑿𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖)
= −2𝑿𝑇𝜌𝒚 + 2𝑿𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖) (2.36)
21
Persamaan 2.36 disamadengankan nol akan diperoleh penduga 𝛽
sebagai berikut:
0 = −2𝑿𝑇𝜌𝒚 + 2𝑿𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖)
0 = −𝑿𝑇𝜌𝒚 + 𝑿𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖)
𝑿𝑇𝜌𝒚 = 𝑿𝑇𝜌𝑿𝜷(𝑢𝑖, 𝑣𝑖)
(𝑿𝑇𝜌𝑿)−1𝑿𝑇𝜌𝒚 = 𝜷(𝑢𝑖, 𝑣𝑖)
�̂�𝑂𝐿𝑆(𝑢𝑖, 𝑣𝑖) = (𝑿𝑇𝜌𝑿)−1𝑿𝑇𝜌𝒚 (2.37)
Setelah didapatkan penduga 𝜷(𝑢𝑖, 𝑣𝑖) yaitu persamaan 2.36 maka
dapat diketahui galat awal yang diperoleh dari proses Ordinary Least
Square (OLS), sehinga persamaan 2.34 dapat ditulis menjadi:
𝜺 = 𝒚 − 𝑿�̂�𝑂𝐿𝑆(𝑢𝑖, 𝑣𝑖) (2.38)
Pendugaan parameter model GWR yang mengandung outlier
dilakukan dengan metode M-estimation. Dasar metode M-estimation
adalah meminimumkan fungsi berikut:
∑ 𝜌(휀)𝑛𝑖=1 (2.39)
Dari persamaan 2.36 dan 2.37 dengan pembobot spasial dapat
dijabarkan sebagai berikut:
∑ 𝜌(𝜺)𝑛𝑖=1 = {∑ 𝜌(𝒚 − 𝑿𝜷(𝑢𝑖 , 𝑣𝑖)
𝑛𝑖=1 )}𝒘𝑖𝑗 (2.40)
Untuk meminimumkan persamaan 2.38, dicari turunan parsial
pertama terhadap 𝛽(𝑢𝑖, 𝑣𝑖) sehingga diperoleh persamaan
∑ {𝑿𝜓(𝒚−𝑿𝜷(𝑢𝑖,𝑣𝑖)
𝜎)}𝒘𝑖𝑗
𝑛𝑖=1 = 0 (2.41)
Dengan 𝜓 = 𝜌′ dan �̂� =𝑀𝐴𝐷
0.6745=
𝑚𝑒𝑑𝑖𝑎𝑛|𝑥𝑖−𝑚𝑒𝑑𝑖𝑎𝑛(𝑥𝑖)|
0.6745
Draper dan Smith (1998) memberikan penyelesaian persamaan 2.41
yaitu dengan mendifinisikan suatu fungsi pembobot sebagai berikut:
𝝎𝑖 = 𝜔(휀𝑖∗) =
𝜓( 𝑖∗)
𝑖∗ (2.42)
dengan 휀𝑖∗ adalah galat yang distandarisasi terhadap penduga
simpangan baku (�̂�) dari 휀𝑖 yang bias, maka didapatkan
휀𝑖∗ = 𝑖
�̂� (2.43)
Sehingga dari persamaan 2.43 dapat diubah menjadi:
22
휀𝑖∗ =
𝒚−𝑿�̂�𝑂𝐿𝑆(𝑢𝑖,𝑣𝑖)𝑀𝐴𝐷(𝑥)
0.6745
(2.44)
Berdasarkan persamaan 2.42, maka fungsi pembobot pada persamaan
2.36 dapat diubah menjadi:
𝝎𝑖 =
𝜓(𝒚−𝑿�̂�𝑂𝐿𝑆(𝑢𝑖,𝑣𝑖)
𝑀𝐴𝐷(𝑥)0.6745
)
𝒚−𝑿�̂�𝑂𝐿𝑆(𝑢𝑖,𝑣𝑖)
𝑀𝐴𝐷(𝑥)0.6745
(2.45)
Dari proses pembobotan pada persamaan 2.42 maka diharapkan
diperoleh penduga yang unbias karena fungsi influence telah
dibakukan, selain itu dari persamaan 2.42 dapat juga dinyatakan
sebagai:
𝜓(휀𝑖∗) =
𝝎𝑖(휀𝑖∗)
휀𝑖∗
atau
𝜓 =𝝎𝑖
휀𝑖∗
Berdasarkan persamaan 2.37 dengan pembobotan spasial dapat diubah
menjadi:
�̂�(𝑢𝑖, 𝑣𝑖) = (𝑿𝑇𝒘𝑖𝑗𝜓𝑿𝑖)−1
𝑿𝑇𝒘𝑖𝑗𝜓𝒚
= (𝑿𝑇𝒘𝑖𝑗
𝝎𝑖
휀𝑖𝑿)
−1
𝑿𝑇𝒘𝑖𝑗
𝝎𝑖
휀𝑖𝒚
= (1
휀𝑖)−1
(𝑿𝑇𝒘𝑖𝑗𝝎𝑖𝑿)−1 1
휀𝑖𝑿𝑇𝒘𝑖𝑗𝝎𝑖𝒚
= 휀𝑖(𝑿𝑇𝒘𝑖𝑗𝝎𝑖𝑿)
−1 1
휀𝑖𝑿𝑇𝒘𝑖𝑗𝝎𝑖𝒚
= (𝑿𝑇𝒘𝑖𝑗𝝎𝑖𝑿)−1
𝑿𝑇𝒘𝑖𝑗𝝎𝑖𝒚 (2.46)
untuk mempermudah pembobotan, anggap 𝝎𝑖∗ = 𝝎𝑖 sehingga
persamaan 2.46 menjadi:
�̂�(𝑢𝑖, 𝑣𝑖) = (𝑿𝑇𝒘𝑖𝑗𝝎𝑖∗𝑿)
−1𝑿𝑇𝒘𝑖𝑗𝝎𝑖
∗𝒚 (2.47)
Dengan 𝝎𝑖∗ matriks pembobot yang berukuran 𝑛 × 𝑛 dengan
elemen diagonal yang berisi pembobot 𝝎1∗ , 𝝎2
∗ , … ,𝝎𝑛∗ dan 𝒘𝑖𝑗
merupakan matriks pembobot spasial Adaptive Bisquare Kernel.
23
Pendugaan parameter tersebut dikenal dengan pendugaan metode
Weighted Least Square (WLS). Pada pembahasan ini fungsi pembobot
yang digunakan adalah fungsi pemboobot Tukey Bisquare sebagai
berikut:
𝝎𝑖∗ = {[1 − (
𝜺𝑖∗
𝑐)2
]2
, |𝜺𝑖∗| < 𝑐
0 , |𝜺𝑖∗| ≥ 𝑐
(2.48)
dengan c adalah tunning constant yang besarnya 𝑐 = 4.685 dan
berfungsi sebagai pengatur pembobot pada outlier agar �̂� mampu
mendekati keadaan unbias.
Jika fungsi 𝜓 tidak linier, maka pendugaan parameter dapat
diselesaikan dengan metode iterasi kuadrat terkecil terboboti yaitu
metode IRLS (Iteratively Reweighted Least Square). Pada iterasi ini
nilai 𝝎𝑖∗ akan berubah nilainya di setiap iterasinya sehingga diperoleh
�̂�(𝑢𝑖, 𝑣𝑖)0, �̂�(𝑢𝑖, 𝑣𝑖)
1, … , �̂�(𝑢𝑖, 𝑣𝑖)𝑚. Untuk parameter dengan m
adalah jumlah iterasi yang akan menduga, maka penduga awal atau
inisialisasi �̂�(𝑢𝑖, 𝑣𝑖)0 adalah
�̂�(𝑢𝑖, 𝑣𝑖)0 = (𝑿𝑇𝒘𝑖𝑗𝝎𝑖
0𝑿)−1
𝑿𝑇𝒘𝑖𝑗𝝎𝑖0𝒚 (2.49)
dengan 𝝎𝑖0 adalah matriks pembobot pertama yang berukuran 𝑛 × 𝑛
yang berisi pembobot 𝝎10, 𝝎2
0, … ,𝝎𝑛0 . Sehingga langkah unutk
pendugaan selanjutnya dapat ditulis
�̂�(𝑢𝑖, 𝑣𝑖)1 = (𝑿𝑇𝒘𝑖𝑗𝝎𝑖
0𝑿)−1
𝑿𝑇𝒘𝑖𝑗𝝎𝑖0𝒚 (2.50)
𝒘𝑖𝑗 adalah matriks diagonal dengan elemennya sebagai berikut:
𝑾(𝑢𝑖, 𝑣𝑖) = [
𝑤1(𝑢𝑖, 𝑣𝑖) 0 ⋯ 0
0 𝑤2(𝑢𝑖, 𝑣𝑖) ⋯ 0⋮ ⋮ ⋱ ⋮0 ⋯ 0 𝑤𝑛(𝑢𝑖, 𝑣𝑖)
]
Kemudian dihitung kembali pembobot dari 𝝎𝑖∗1, tetapi menggunakan
�̂�(𝑢𝑖, 𝑣𝑖)1 sebagai pengganti �̂�(𝑢𝑖, 𝑣𝑖)
0 dan 𝒘𝑖𝑗 sehingga didapatkan
maka diperoleh
�̂�(𝑢𝑖, 𝑣𝑖)𝑚 = (𝑿𝑇𝑾(𝑢𝑖, 𝑣𝑖)𝝎𝑖
𝑚−1𝑿𝑖)−1
𝑿𝑇𝑾(𝑢𝑖, 𝑣𝑖)𝝎𝑖𝑚−1𝒚 (2.51)
dan seterusnya sehingga didapatkan
�̂�(𝑢𝑖, 𝑣𝑖)𝑚+1 = (𝑿𝑇𝑾(𝑢𝑖, 𝑣𝑖)𝝎𝑖
𝑚𝑿)−1𝑿𝑇𝑾(𝑢𝑖, 𝑣𝑖)𝝎𝑖𝑚𝒚 (2.52)
24
Perhitungan diatas akan terus berulang hingga diperoleh penduga
yang konvergen, yakni ketika selisih �̂�(𝑢𝑖, 𝑣𝑖)𝑚+1 dan �̂�(𝑢𝑖, 𝑣𝑖)
𝑚
mendekati 0 dengan m merupakan banyaknya interaksi. 𝝎𝑖𝑛
merupakan pembobot yang diperoleh pada penduga yang telah
konvergen.
2.8.2. Pengujian Parameter Model Robust Geographically
Weighted Regression (RGWR)
Pengujian parameter dengan model RGWR dilakukan untuk
mengetahui faktor-faktor yang mempengaruhi IPM di setiap
kabupaten / kota di Jawa Timur tahun 2015.
𝐒 =
[ 𝑿1
𝑇(𝑿𝑇 𝑾(𝑢1, 𝑣1)𝝎1𝑠𝑿)−1 𝑿𝑇 𝑾(𝑢1, 𝑣1)𝝎1
𝑠
𝑿2𝑇(𝑿𝑇𝑾(𝑢2, 𝑣2)𝝎2
𝑠𝑿)−1 𝑿𝑇 𝑾(𝑢2, 𝑣2)𝝎2𝑠
⋮𝑿𝑛
𝑇(𝑿𝑇𝑾(𝑢𝑛, 𝑣𝑛)𝝎𝑛𝑠 𝑿)−1 𝑿𝑇 𝑾(𝑢𝑛, 𝑣𝑛)𝝎𝑛
𝑠 ]
1. Pengujian Parameter secara Simultan
Hipotesis yang melandasi pengujian ini adalah:
H0: 𝛽𝑘 = 𝛽𝑘(𝑢𝑖, 𝑣𝑖), melawan
H1: 𝛽𝑘 ≠ 𝛽𝑘(𝑢𝑖, 𝑣𝑖) Statistik uji:
(𝐽𝐾𝐺𝑂𝐿𝑆 − 𝐽𝐾𝐺𝑅𝑅𝑇𝐺)/𝑣1
𝐽𝐾𝐺𝑅𝑇𝐺/𝛿1~𝐹
([𝑣1
2
𝑣2],[
𝛿12
𝛿2])
di mana
𝐽𝐾𝐺𝑅𝑅𝑇𝐺 = 𝒚𝑇(𝑰 − 𝑺)𝑇(𝑰 − 𝑺)𝒚
𝐽𝐾𝐺𝑂𝐿𝑆 = 𝒚𝑇(𝑰 − 𝑯)𝑇(𝑰 − 𝑯)𝒚
𝑯 = 𝑿(𝑿𝑇𝑿)−𝟏𝑿𝑇
𝛿𝑖 = 𝑡𝑟[(𝑰 − 𝑺)𝑇(𝑰 − 𝑺)]𝑖 𝑣1 = 𝑛 − 𝑘 − 1 − 𝛿1
𝑣2 = 𝑛 − 𝑘 − 1 − 2𝛿1 + 𝛿2
Tolak H0 jika statistik uji > 𝐹([
𝑣12
𝑣2],[
𝛿12
𝛿2])
maka model RGWR
memberikan hasil yang lebih baik dibandingkan model MKT atau
terdapat perbedaan yang nyata antara model RGWR dengan model
MKT.
2. Pengujian Parameter secara Parsial
Untuk pengujian parameter model RGWR dilakukan dengan
menggunakan statistik uji t dengan berlandaskan hipotesis sebagai
berikut:
25
H0: 𝛽𝑘(𝑢𝑖, 𝑣𝑖) = 0, melawan
H1: 𝛽𝑘(𝑢𝑖, 𝑣𝑖) ≠ 0
Penduga 𝛽𝑘(𝑢𝑖, 𝑣𝑖) mengikuti distribusi normal dengan rata-rata
𝛽𝑘(𝑢𝑖, 𝑣𝑖) dan matriks ragam peragam CCT, di mana
𝐶 = (𝑿′ 𝑾(𝑢𝑖, 𝑣𝑖)𝝎𝑠𝑿)−1𝑿′𝑾(𝑢𝑖, 𝑣𝑖) 𝝎
𝑠 (2.53)
Statistik uji dituliskan sebagai berikut:
�̂�𝑘(𝑢𝑖,𝑣𝑖)
�̂� √𝑐𝑘𝑘~𝑡𝑛−𝑘−1
di mana 𝑐𝑘𝑘 merupakan elemen diagonal matriks CCT. Tolak H0 jika
|SU| > 𝑡(𝛼2,𝑛−𝑘−1), maka parameter 𝛽𝑘(𝑢𝑖, 𝑣𝑖) berpengaruh terhadap
model RGWR.
3. Analysis of Variance (ANOVA)
Tabel 2.2. Analysis of Variance
SK db JK KT F
Regresi Linier n-p-1 JKGOLS
Improvement v1 JKGOLS -
JKGRRTG
JKim / db KTim/KTRRTG
RTG d1 JKGRRTG JKRRTG /
db
2.9. Koefisien Determinasi
Koefisien determinasi merupakan suatu ukuran kebaikan model
yang menjelaskan besarnya keragaman peubah respon yang dapat
dijelaskan oleh peubah prediktor pada setiap lokasi. Perhitungan
determinasi model GWR dirumuskan sebagai berikut (Fotheringham
dkk, 2002):
𝑅2(𝑢𝑖 , 𝑣𝑖) =(𝑇𝑆𝑆𝑤−𝑅𝑆𝑆𝑤)
𝑇𝑆𝑆𝑤 (2.54)
𝑇𝑆𝑆𝑤 merupakan jumlah kuadrat total dari RTG dan 𝑅𝑆𝑆𝑤 adalah
jumlah kuadrat sisaan dari RTG dengan didefinisian sebagai berikut :
𝑇𝑆𝑆𝑤 = ∑ 𝑤𝑖𝑗(𝑦𝑗 − �̅�)2𝑛
𝑗=1
26
𝑅𝑆𝑆𝑤 = ∑ 𝑤𝑖𝑗(𝑦𝑗 − �̂�𝑗)2
𝑛
𝑗=1
2.10. Indeks Pembangunan Manusia (IPM)
IPM (Indeks Pembangunan Manusia) adalah indeks untuk
mengukur perkembangan pembangunan manusia yang diukur
berdasarkan aspek kesehatan, pendidikan dan kemampuan secara
ekonomi.
Pembangunan manusia diukur dengan Indeks Pembangunan
Manusia (IPM) seperti yang diperkenalkan oleh UNDP pada tahun
1990. IPM dapat dihitung menggunakan rumus:
𝐼𝑃𝑀 = √𝐼𝑃𝑒𝑛𝑑𝑖𝑑𝑖𝑘𝑎𝑛 × 𝐼𝐾𝑒𝑠𝑒ℎ𝑎𝑡𝑎𝑛 × 𝐼𝑃𝑒𝑛𝑔𝑒𝑙𝑢𝑎𝑟𝑎𝑛3
di mana
𝐼𝑃𝑒𝑛𝑑𝑖𝑑𝑖𝑘𝑎𝑛 = Indikator pendidikan
𝐼𝐾𝑒𝑠𝑒ℎ𝑎𝑡𝑎𝑛 = Indikator kesehatan
𝐼𝑃𝑒𝑛𝑔𝑒𝑙𝑢𝑎𝑟𝑎𝑛 = Indikator pengeluaran
Beberapa indikator dalam mengukur IPM yaitu, Angka Harapan
Hidup, Rata-rata Lama Sekolah, Harapan Lama Sekolah dan
Pengeluaran Per Kapita.
1. Angka Harapan Hidup
Dalam rentang waktu 2011-2015, ada tren peningkatan
persentase penduduk laki-laki, yaitu dari 49.30 persen di tahun 2011
menjadi 49.35 persen di tahun 2015. alaupun ada kecenderungan
penurunan, namun persentase penduduk perempuan di Jawa Timur
tahun 2015 masih lebih banyak dibandingkan penduduk laki-laki,
yaitu 50.65 persen. Sehingga bila dilihat berdasarkan rasio jenis
kelamin (se ratio), yaitu perbandingan antara jumlah penduduk laki-
laki terhadap perempuan, di Jawa Timur tahun 2015 diperoleh nilai
97.45 persen. Ini berarti rata-rata untuk setiap 100 penduduk
perempuan akan terdapat sekitar 97-98 penduduk laki-laki. Terdapat
beberapa sebab se ratio kurang dari 100 persen, di antaranya angka
harapan hidup perempuan lebih tinggi dibanding angka harapan hidup
laki-laki serta karena faktor migrasi penduduk laki-laki lebih tinggi
terutama pada penduduk usia produktif.
2. Pengeluaran Per Kapita
27
Salah satu cara melihat kesejahteraan penduduk dari sisi ekonomi
adalah dengan melihat pendapatannya. Dengan pendapatan yang
meningkat dimungkinkan secara ekonomi penduduk lebih sejahtera.
Namun untuk memperoleh informasi tentang pendapatan
rumahtangga sangatlah sulit sehingga dalam pendekatannya
menggunakan pengeluaran. Secara umum jumlah pengeluaran
berbanding lurus dengan pendatapatan. Rumah tangga yang
pengeluarannya banyak dapat mencerminkan tingkat kemampuan
ekonomi masyarakat. Kemampuan daya beli masyarakat dapat
memberikan gambaran tentang tingkat kesejahteraan masyarakat.
Semakin tinggi daya beli masyarakat menunjukkan peningkatan
kemampuan dalam memenuhi kebutuhan hidupnya dan menjadi salah
satu indikasi peningkatan kesejahteraan masyarakat.
Pada data kelompok pengeluaran berdasarkan Susenas 2012-
2015 menunjukkan adanya kenaikan persentase penduduk pada
kelompok pengeluaran diatas 1.000.000 rupiah perkapita per bulan.
Dapat dilihat juga bahwa dari tahun ke tahun pengeluaran perkapita
penduduk semakin besar, hal ini dibuktikan oleh persentase penduduk
yang bergeser menuju pada kelompok pengeluaran yang semakin
besar.
3. Pendidikan
Pendidikan tertinggi yang ditamatkan (ijazah tertinggi yang
dimiliki) merupakan indikator pokok kualitas SDM, karena semakin
tinggi ija ah yang dimiliki oleh penduduk suatu daerah mencerminkan
kualitas penduduk di daerah tersebut. Pada tahun 2015, penduduk usia
15 tahun ke atas di Jawa Timur sebagian besar masih tamatan
SD/sederajat yaitu sebesar 29.29 persen dan yang tamatan Sarjana
sebesar 6.53 persen (D1-D3 1.47 persen, D4/S1 4.76 persen dan S2/S3
0.3 persen). Kondisi seperti ini tentunya menjadi tantangan tersendiri
dalam menghadapi era Masyarakat Ekonomi Asean (MEA ). Seperti
kita ketahui bersama pada Tahun 2015 ini merupakan awal dibukanya
MEA, dalam menghadapinya semua daerah haruslah mempersiapkan
sumber daya manusia (SDM) yang trampil, cerdas, dan begiotu juga
Jawa Timur sebagai Propinsi terbesar ke 2 di Indonesia.
29
BAB III
METODOLOGI
3.1. Sumber Data
Data sekunder berupa Indeks Pembangunan Manusia (IPM)
dan faktor-faktor yang mempengaruhi dari 38 kabupaten / kota di
Provinsi Jawa Timur yang didapatkan dari publikasi BPS berjudul
Indikator Kesejahteraan Jawa Timur Tahun 2015. Penjelasan
tentang data disajikan pada Tabel 3.1.
Tabel 3.1. Data Indeks Pembangunan Manusia dan Faktor yang
Mempengaruhi
Peubah Satuan
Indeks Pembangunan Manusia (Y) %
Angka Harapan Hidup (AHH) (X1) %
Rata-Rata Lama Sekolah (RLS) (X2) Tahun
Harapan Lama Sekolah (HLS) (X3) Tahun
Pengeluaran per Kapita (X4) Ratusan Ribu Rupiah
Latitude Meter
Longtitude Meter
3.2. Prosedur Pemodelan RGWR
Adapun prosedur analisis yang dilakukan dalam memodelkan
faktor-faktor yang mempengaruhi indeks pembangunan manusia
menggunakan model Robust Geographically Weighted Regression
(RGWR) adalah:
Prosedur dalam pemodelan GWR (Fotheringham dkk. 2002):
1. Mendiskripsikan setiap peubah pada kasus Indeks Pembangunan
Manusia di Jawa Timur tahun 2015.
- Menentukan ui dan vi (latitude dan longtitude) yaitu letak
geografis kabupaten / kota di Jawa Timur.
2. Memeriksa keberadaan pencilan dengan menggunakan kriteria
berdasarkan pada subbab 2.1.
3. Memeriksa pengaruh spasial dengan melakukan uji heterogenitas
spasial dengan statistik uji seperti pada persamaan 2.20 dan
apabila tidak terdapat heterogenitas spasial maka dilakukan
analisis regresi linier berganda.
30
4. Menghitung matriks pembobot Bisquare Kernel tiap kabupaten /
kota di Jawa Timur dengan persamaan 2.23 dengan menentukan
bandwidth optimum berdasarkan CV yang minimum dengan
persamaan 2.21 dan 2.22 terlebih dahulu.
5. Menganalisis model Robust Geographically Weighted
Regression (RGWR) pada kasus Indeks Pembangunan Manusia
di Jawa Timur tahun 2015 dengan langkah-langkah sebagai
berikut:
a. Menganalisis model Robust Geographically Weighted
Regression (RGWR) dengan metode M-estimation, adapun
langkah-langkahnya sebagai berikut:
- Menentukan bentuk estimasi parameter 𝛽(𝑢𝑖, 𝑣𝑖) dengan
metode OLS.
- Menghitung 𝜀𝑖∗ berdasarkan penduga 𝛽(𝑢𝑖 , 𝑣𝑖) dengan rumus
pada persamaan 2.44.
- Menghitung pembobot 𝝎𝑖∗ dengan rumus pada persamaan
2.48.
- Menghitung penduga baru dengan metode WLS.
- Melakukan penyelesaian dengan metode IRLS dengan cara
sebagai berikut:
i. Menentukan �̂�(𝑢𝑖, 𝑣𝑖)0 sebagai penduga awal dengan
rumus pada persamaan 2.49.
ii. Mencari pembobot baru berdasarkan penduga awal.
Perhitungan diatas akan terus berulang hingga diperoleh penduga yang
konvergen, yakni ketika selisih �̂�(𝑢𝑖, 𝑣𝑖)𝑚+1 dan �̂�(𝑢𝑖, 𝑣𝑖)
𝑚
mendekati 0 dengan m merupakan banyaknya iterasi.
b. Menguji signifikansi parameter model RGWR.
6. Menghitung R2 untuk melihat kebaikan model.
7. Interpretasi model RGWR.
Penyelesaian prosedur penerapan model RGWR menggunakan
Matlab, Arcgis 10.1 dan Microsoft.Excel. Prosedur pemodelan
RGWR dijelaskan pada diagram alir Gambar 3.1.
31
Mulai
Mendiskripsikan Data IPM kabupaten /
kota di Jawa Timur tahun 2015
Terdapat pencilan ?
Pendeteksian
Pencilan
Pengujian
Pengaruh Spasial
Terdapat keragaman
spasial ?
Ya
Ya
A
Pembobot Bisquare Kernel
Tidak
Tidak
B
Gambar 3.1. Diagram Alir Pemodelan RGWR
32
Analisis Regresi
Linier Berganda
�̂�(𝑢𝑖 , 𝑣𝑖)𝑚+1 − �̂�(𝑢𝑖 , 𝑣𝑖)
𝑚
konvergen ?
RGWR
B A
Mencari Penduga Baru dengan
Weighted Least Square.
Estimasi Parameter 𝛽 dengan OLS
Menghitung Pembobot melalui 𝜀𝑖
Tidak
Ya
Pengujian Signifikansi Parameter
lokal
Menghitung 𝑅2
Hasil Pemodelan dan
Interpretasi
Selesai
Gambar 3.1. (Lanjutan)
35
BAB IV
HASIL DAN PEMBAHASAN
4.1. Analisis Deskriptif
Analisis deskriptif dapat digunakan untuk mengetahui
karakteristik setiap peubah yang diamati. Pada penelitian ini
digunakan data sekunder yang didapatkan dari publikasi BPS
Provinsi Jawa Timur tahun 2015. Dengan peubah respon yaitu
Indeks Pembangunan Manusia (IPM) dan peubah predictor yaitu
Angka Harapan Hidup (AHH) dalam %, Rata-Rata Lama Sekolah
(RLS) dalam tahun, Harapan Lama Sekolah (HLS) dalam tahun,
pengeluaran per kapita dalam ratusan ribu rupiah. Hasil ringkasan
analisis deskriptif tersaji pada Tabel 4.1.
Tabel 4.1. Analisis Deskriptif Setiap Peubah
N Minimum Maksimum Rata-rata
IPM 38 58.18 80.05 69.1132
Angka
Harapan
Hidup
38 65.73 73.85 70.9568
Rata-rata
Lama
Sekolah
38 3.65 11.08 7.4103
Harapan
Lama
Sekolah
38 11.09 15.23 12.7703
Pengeluaran
per Kapita 38 7.58 15.99 10.2206
Berdasarkan Tabel 4.1. menunjukkan bahwa Indeks
Pembangunan Manusia dari 38 kabupaten / kota di Provinsi Jawa
Timur tahun 2015 memiliki rata-rata yaitu 69.113%. Indeks
Pembangunan Manusia dari 38 kabupaten / kota di Provinsi Jawa
Timur tahun 2015 paling rendah yaitu 58.18% yaitu Kabupaten
Sampang dan paling tinggi 80.05% yaitu Kota Malang. Angka
Harapan Hidup (AHH) dari 38 kabupaten / kota di Provinsi Jawa
36
Timur tahun 2015 memiliki rata-rata 70.95%, tertinggi 73.85% yaitu
Kota Surabaya dan terendah 65.73% yaitu Kabupaten Bondowoso.
Rata-rata Lama Sekolah (RLS) dari 38 kabupaten / kota di Provinsi
Jawa Timur tahun 2015 memiliki rata-rata yaitu 7.4103 tahun,
tertinggi 11.08 tahun yaitu Kota Madiun dan Kabupaten Sampang
memiliki RLS terendah yaitu 3.65 tahun. Harapan Lama Sekolah
(HLS) dari 38 kabupaten / kota di Provinsi Jawa Timur tahun 2015
memiliki rata-rata yaitu 12.7703 tahun, tertinggi Kabupaten
Tulungagung yaitu 15.23 tahun dan terendah 11.09 tahun yaitu
Kabupaten Sampang. Pengeluaran per kapita dari 38 kabupaten / kota
di Provinsi Jawa Timur tahun 2015 memiliki rata-rata 10.220 dalam
ratusan ribu rupiah, tertinggi 15.99 yaitu Kota Surabaya dan terendah
7.58 yaitu Kabupaten Sumenep dalam ratusan ribu rupiah.
4.2. Pendeteksian Pencilan
Pendeteksian pengamatan yang dapat ditentukan sebagai
pencilan dilihat berdasarkan kriteria nilai leverage dan DFFITS.
1. Nilai leverage
Pendeteksian pencilan dengan melihat nilai leverage, pencilan
dapat diketahui apabila nilai leverage > 4
𝑛 (𝑛 = 38;
4
𝑛=
4
38=
0.1053). Hasil pendeteksian pencilan berdasarkan nilai leverage dapat
dilihat pada Tabel 4.2.
Tabel 4.2. Nilai Leverage
Data ke- Leverage Ket Data ke- Leverage Ket
1 0.11495 Pencilan 20 0.08237 Bukan
2 0.13426 Pencilan 21 0.09886 Bukan
3 0.09655 Bukan 22 0.02035 Bukan
4 0.06702 Bukan 23 0.02193 Bukan
5 0.07528 Bukan 24 0.07746 Bukan
6 0.0395 Bukan 25 0.02529 Bukan
7 0.05036 Bukan 26 0.06285 Bukan
8 0.0862 Bukan 27 0.19572 Pencilan
9 0.06279 Bukan 28 0.25523 Pencilan
10 0.04838 Bukan 29 0.17138 Pencilan
11 0.21854 Pencilan 30 0.20685 Pencilan
12 0.09775 Bukan 31 0.06703 Bukan
13 0.21667 Pencilan 32 0.33673 Pencilan
37
14 0.05872 Bukan 33 0.11804 Pencilan
15 0.06817 Bukan 34 0.06372 Bukan
16 0.08724 Bukan 35 0.1011 Bukan
17 0.00741 Bukan 36 0.18431 Pencilan
18 0.02068 Bukan 37 0.30993 Pencilam
19 0.03949 Bukan 38 0.01089 Bukan
Berdasarkan Tabel 4.2. dapat dilihat pada data ke-1, 2, 11, 13, 27,
28, 29, 30, 32, 33, 36, dan 37 merupakan data yang memiliki nilai
leverage > 0.1053.
2. DFFITS
Selanjutnya untuk menentukan nilai sebagai pencilan adalah
menggunakan DFFITS. Dengan melihat nilai DFFITS, pencilan
terdeteksi apabila |DFFITS| > 2√𝑘
𝑛 yaitu 0.105. Hasil pendeteksian
pencilan berdasarkan nilai DFFITS disajikan pada Tabel 4.3.
Tabel 4.3. Nilai DFFITS
Data ke- DFFITS Ket Data ke- DFFITS Ket
1 -0.08101 Bukan 20 0.03797 Bukan
2 -0.00491 Bukan 21 0.04821 Bukan
3 -0.02629 Bukan 22 0.00309 Bukan
4 0.01318 Bukan 23 0.00358 Bukan
5 0.00645 Bukan 24 0.02962 Bukan
6 0.01399 Bukan 25 0.01083 Bukan
7 -0.00095 Bukan 26 -0.04163 Bukan
8 -0.03861 Bukan 27 -0.13524 Pencilan
9 -0.01163 Bukan 28 -0.11788 Pencilan
10 0.02378 Bukan 29 -0.09521 Bukan
11 0.08189 Bukan 30 -0.01377 Bukan
12 0.0151 Bukan 31 0.00671 Bukan
13 0.07052 Bukan 32 -0.28578 Pencilan
14 -0.003 Bukan 33 0.0231 Bukan
15 0.00012 Bukan 34 0.01253 Bukan
16 0.03727 Bukan 35 0.00674 Bukan
17 0.00785 Bukan 36 -0.13638 Pencilan
18 0.01609 Bukan 37 -0.26171 Pencilan
38
19 0.02593 Bukan 38 0.0098 Bukan
Berdasarkan Tabel 4.3 yang memiliki nilai |DFFITS| > 0.105
adalah pada data ke-27, 28, 32, 36, dan 37.
Apabila dillihat berdasarkan nilai leverage dan DFFITS dapat
ditentukan data yang terdeteksi sebagai pencilan adalah amatan ke-27,
28, 32, dan 37.
4.3. Pengujian Keragaman Spasial
Hasil pengujian heterogenitas spasial menunjukkan bahwa nilai
statistik uji Breusch Pagan yaitu 17.363 ( 𝜒0.05(5)2 = 9.236) dengan
keputusan tolak H0 pada hipotesis sebagai berikut:
H0: 𝜎𝑖2 = 𝜎2
2 = ⋯ = 𝜎𝑛2 = 𝜎2 (tidak terdapat heterogenitas spasial),
melawan
H1: paling sedikit ada satu i di mana 𝜎𝑖2 ≠ 𝜎2(terdapat
heterogenitas spasial)
Oleh karena itu, berdasarkan hasil pengujian di atas dapat
diketahui bahwa terdapat keragaman spasial maka Geographically
Weighted Regression dapat diterapkan pada data IPM dari 38
kabupaten / kota di Provinsi Jawa Timur tahun 2015 untuk mengatasi
keragaman spasial.
4.4. Jarak Euclidean
Sebelum menghitung pembobot spasial maka harus dihitung
terlebih dahulu Jarak euclidean. Jarak euclidean Kota Malang tersaji
pada Tabel 4.4.
Tabel 4.4. Jarak Euclidean Kota Malang Dengan Wilayah Lain di
Provinsi Jawa Timur
No Kab/Kota Jarak (meter)
1 Pacitan 197861.240
2 Ponorogo 158524.401
3 Trenggalek 152333.656
4 Tulungagung 123775.280
5 Blitar 91053.815
6 Kediri 92551.822
7 Malang 60428.329
39
8 Lumajang 58249.798
9 Jember 104771.324
10 Banyuwangi 163379.579
11 Bondowoso 119102.056
⋮ ⋮ ⋮
37 Surabaya 46435.779
38 Batu 46116.243
Jarak euclidean dapat digunakan untuk mengukur tingkat
kesamaan atau kemiripan dari 2 titik dengan perhitungan matematis.
Pada Tabel 4.4 disajikan jarak euclidean antara Kota Malang dengan
masing-masing kabupaten / kota yang ada di Provinsi Jawa Timur.
4.5. Penentuan Pembobot Spasial
4.5.1. Bandwidth
Penentuan lebar jendela dilakukan dengan mencari nilai
validasi silang lebar jendela optimum adalah lebar jendela yang
menyebabkan nilai validasi sialng minimum. Penentuan validasi
silang menggunakan iterasi Golden Section Search. Pada penelitian ini
iterasi dilakukan dengan bantuan perangkat lunak GWR4. Lebar
jendela atau Bandwidth optimum dihitung berdasarkan persamaan
2.22 dan hasilnya disajikan pada Lampiran 3 dan didapatkan
bandwidth optimum sebesar 199848.649 m. Setelah itu dapat
dilakukan perhitungan pembobot untuk setiap kabupaten / kota dengan
wilayah yang berpengaruh.
4.5.2. Pembobot (Weighted)
Pembobot yang digunakan dalam penelitian ini adalah
pembobot Bisquare Kernel. Untuk pembobot Kabupaten Pacitan
dapat dilihat pada Tabel 4.5.
Tabel 4.5. Pembobot Untuk Kabupaten Pacitan
dij (meter) Wij
0 1
41353.5553 0.97624
49416.5937 0.96616
40
78011.8509 0.91676
116659.4879 0.81887
105573.7141 0.85032
161109.759 0.67019
215850.445 0.45492
.... ...
.... ...
152680.787 0.70078
Pembobot digunakan untuk mengukur hubungan antar
wilayah yang ada di Provinsi Jawa Timur dan masih memberikan
pengaruh terhadap model RGWR yang terbentuk. Berdasarkan Tabel
4.5 dapat dilihat pembobot untuk Kabupaten Pacitan berdasarkan
bandwidth yang didapatkan pada Lampiran 3 dan pengaruhnya
terhadap wilayah lain di Jawa Timur.
4.6. Pendugaan Parameter Model Robust Geographically
Weighted Regression
Pendugaan parameter dapat dilihat pada Lampiran, dari 38
kabupaten / kota di Jawa Timur terdapat beberapa peubah yang
berpengaruh terhadap Indeks Pembangunan Manusia (IPM).
Pendugaan parameter selengkapnya dapat dilihat pada Lampiran 6.
Hasil ringkasan pendugaan parameter disajikan pada Tabel 4.6.
Tabel 4.6. Ringkasan Penduga Parameter RGWR
N Nilai
Minimum
Nilai
Maksimum Rata-rata
Intersep 38 0.73 9.27 0.73
X1 38 0.33 0.57 0.33
X2 38 1.01 1.63 1.01
X3 38 0.90 1.17 0.90
X4 38 0.75 1.06 0.75
41
Berdasarkan ringkasan penduga parameter Tabel 4.6 dapat
diketahui bahwa model yang didapatkan yaitu sebanyak 38 sesuai
dengan kabupaten / kota yang terdapat di Jawa Timur. Secara rinci
penduga parameter terdapat pada Lampiran 5. Sebagai ilustrasi untuk
Kota Malang didapatkan model sebagai berikut:
�̂�18 = 2.673 + 0.43 𝑋1 + 1.445𝑋2 + 0.987𝑋3 + 0.803𝑋4
Untuk setiap kenaikan 1% Angka Harapan Hidup (AHH) diharapkan
meningkatkan IPM sebesar 0.43% dengan peubah lain konstan, untuk
setiap kenaikan 1 tahu Rata-rata Lama Sekolah (RLS) diharapkan
meningkatkan IPM sebesar 1.445% dengan peubah lain konstan,
untuk setiap kenaikan 1 tahun Harapan Lama Sekolah (HLS)
diharapkan meningkatkan IPM sebesar 0.987% dengan peubah lain
konstan, untuk setiap kenaikan seratus ribu rupiah pengeluaran per
kapita diharapkan meningkatkan IPM sebesar 0.803% dengan peubah
lain konstan.
4.7. Pengujian Parameter Model Robust Greographically
Weighted Regression
Pengujian parameter model RGWR dilakukan dengan
menggunakan software Matlab dengan hasil yang didapatkan sebagai
berikut :
1. Pengujian secara parsial dapat dilihat pada Lampiran 6, pengujian
secara parsial bertujuan untuk mengetahui peubah yang
berpengaruh terhadap IPM setiap kabupaten / kota di Jawa Timur.
2. Pengujian Secara Simultan
Hipotesis yang melandasi pengujian ini adalah:
H0: 𝛽𝑘 = 𝛽𝑘(𝑢𝑖, 𝑣𝑖), melawan
H1: 𝛽𝑘 ≠ 𝛽𝑘(𝑢𝑖, 𝑣𝑖) Hasil pengujian didapatkan nilai p < α (5%) sehingga dapat
disimpulkan pemodelan dengan RGWR memberikan hasil yang
berbeda dengan MKT. Pengujian secara simultan diringkas pada
Tabel 4.7.
Untuk mengetahui tingkat keefektifan model regresi robust
terboboti geografis dengan regresi linier berganda dilakukan
pengujian melalui analysis of variance (ANOVA) dengan uji F
42
Fotheringham, Brundson dan Charlton. Hasil pengujian ANOVA
disajikan pada Tabel 4.7.
Tabel 4.7. Analysis of Variance
SK DB JK KT F
Regresi Linier 33 2.890
Improvement 8.265 1.583 0.192 3.625884
RTG 24.735 1.307 0.053
Berdasarkan ANOVA pada Tabel 4.7 diperoleh nilai F-hitung
Fotheringham, Brundson dan Charlton sebesar 3.6258 dibandingkan
dengan Ftabel dengan taraf nyata sebesar 5% yang diperoleh dari
F5%(8.265, 24.735) sebesar 2.36 yang berarti Fhitung > F5% sehingga
diperoleh keputusan tolak H0. Jika H0 ditolak, maka model regresi
robust terboboti geografis lebih efektif dalam menggambarkan
hubungan antara peubah respon dengan peubah prediktor daripada
regresi linier berganda.
4.8. Koefisien Determinasi
Nilai koefisien determinasi dapat dipakai untuk memprediksi
seberapa besar kontribusi pengaruh peubah prediktor terhadap peubah
respon. Nilai koefisien determinasi dapat dilihat pada Lampiran 7.
Hasil yang didapatkan bahwa semua nilai determinasi untuk 38 model
memiliki nilai lebih dari 50% yang dapat dikatakan bahwa model
memiliki kemampuan lebih besar dari 50% dalam menjelaskan variasi
peubah respon.
4.9. Pemetakan dan Pemetaan Hasil Model Robust
Geographically Weighted Regression
Peta awal dari Indeks Pembangunan Manusia Provinsi Jawa
Timur tahun 2015 dilakukan berdasarkan nilai IPM setiap kabupaten
/ kota yang ada di Jawa Timur. Hasil pemetakan IPM Jawa Timur
disajikan pada Gambar 4.1.
43
Gambar 4.1. Pemetakan IPM Jawa Timur
Berdasarkan Gambar 4.1. dapat dilihat bahwa untuk Kab/Kota
Provinsi Jawa Timur terbagi menjadi tiga kategori yaitu IPM kisaran
nilai 58.18 – 65.47, 65.48 – 72.77, 72.78 – 80.05. Setiap kabupaten /
kota di Jawa Timur memiliki IPM yang tergolong beragam
berdasarkan kisaran nilai tersebut yang terinci pada Tabel 4.8.
Tabel 4.8. Hasil Pemetakan IPM kab / kota di Jawa Timur tahun
2015
IPM
58.18 – 65.47
IPM
65.48 – 72.77
IPM
72.78 – 80.05
Kab. Sampang
Kab. Bangkalan
Kab. Sumenep
Kab. Lumajang
Kab. Jember
Kab. Pamekasan
Kab. Probolinggo
Kab. Bondowoso
Kab. Situbondo
Kab. Malang
Kab. Trenggalek
Kab. Banyuwangi
Kab. Blitar
Kab. Ponorogo
Kab. Ngawi
Kab. Kediri
Kab. Madiun
Kab. Jombang
Kota Batu
Kab. Gresik
Kota Pasuruan
Kota Mojokerto
Kota Kediri
Kab. Blitar
Kota Sidoarjo
Kota Surabaya
Kota Madiun
44
Kab. Pacitan
Kab. Pasuruan
Kab. Tuban
Kab. Bojonegoro
Kab. Lamongan
Kab. Nganjuk
Kab. Tulungagung
Kab. Mojokerto
Kota. Probolinggo
Kab. Magetan
Kota Malang
Berdasarkan Tabel 4.8 dapat dilihat bahwa wilayah di Jawa
Timur yang memiliki IPM dengan kisaran nilai terendah sebagian
besar merupakan wilayah kabupaten yang dekat dengan Selat Madura.
Sedangkan, wilayah di Jawa Timur yang memiliki IPM dengan
kisaran nilai tinggi didominasi oleh kawasan perkotaan.
Pemetaan dilakukan setelah didapatkan model dengan metode
Robust Geographically Weighted Regression (RGWR). Hasil
pemetaan model Robust Geographically Weighted Regression
(RGWR) tersaji pada Gambar 4.2.
Gambar 4.2. Pemetaan Hasil Model RGWR
Berdasarkan Gambar 4.2 dapat dilihat terdapat kab / kota yang
memiliki IPM dengan nilai pada kisaran 54.208 – 63.448, 63.489 –
72.688, 72.689 – 81.954 secara terinci tersaji pada Tabel 4.9.
45
Tabel 4.9. Hasil Pemetaan Model RGWR
IPM
54.208-63.448
IPM
63.449-72.688
IPM
72.689-81.954
Kab. Sampang
Kab. Bangkalan
Kab. Lumajang
Kab. Bondowoso
Kab. Situbondo
Kab. Probolinggo
Kab.Bangkalan
Kab. Jember
Kab. Pamekasan
Kab. Pasuruan
Kab. Malang
Kab. Sumenep
Kab. Ponorogo
Kab. Trenggalek
Kab. Pacitan
Kab. Tulungagung
Kab. Blitar
Kab. Kediri
Kab. Malang
Kab. Banyuwangi
Kab. Mojokerto
Kab. Jombang
Kab. Nganjuk
Kab. Madiun
Kab. Bojonegoro
Kab. Tuban
Kab. Lamongan
Kab. Sumenep
Kota Probolinggo
Kota Pasuruan
Kota Batu
Kab. Gresik
Kab. Magetan
Kab. Ngawi
Kab. Sidoarjo
Kota Kediri
Kota Blitar
Kota Malang
Kota Mojokerto
Kota Madiun
Kota Surabaya
Berdasarkan Tabel 4.9 dilihat dari nilai signifikansi masing-
masing koefisien parameter pada Lampiran 5 dicantumkan kabupaten
/ kota yang tergolong memiliki IPM dengan kisaran nilai 54.208 –
63.448, 63.489 – 72.688, 72.689 – 81.954 menurut hasil pemodelan
Robust Geographically Weighted Regression. Terdapat beberapa
kabupaten / kota yang memiliki hasil berbeda sebelum dan sesudah
dilakukan pemodelan dengan Robust Geographically Weighted
Regression seperti Kota Batu pada pemetakan tergolong kota yang
memiliki IPM dengan kisaran tertinggi, setelah dilakukan pemodelan
RGWR didapatkan IPM dengan kisaran sedang. Pada Tabel 4.9 yang
meiliki nilai kisaran tinggi tidak hanya didominasi oleh kawasan
perkotaan melainkan juga terdapat beberapa kabupaten. Selebihnya
untuk kabupaten / kota lain yang mengalami perubahan sebelum dan
sesudah pemodelan RGWR dapat dilihat pada Tabel 4.8 dan 4.9.
47
BAB V
PENUTUP
5.1. Kesimpulan
1. Pemodelan dengan robust GWR didapatkan model yang berbeda-
beda untuk setiap kabupaten / kota. Model yang didapatkan pada
setiap kabupaten / kota di Jawa Timur dengan metode RWGR
memiliki nilai R2 lebih dari 50% untuk semua titik pengamatan.
2. Berdasarkan hasil penerapan model RGWR terhadap IPM 38
kabupaten / kota di Jawa Timur didapatkan perbedaan sebelum
dilakukan penerapan model dan sesudah diterapkan model
RGWR.
5.2. Saran
Pada penelitian selanjutnya agar dilakukan pendugaan parameter
regrei linier dengan metode yang robust dan RGWR untuk melihat
apakah penggunaan RGWR berbeda nyata dengan regresi linier yang
menggunakan metode robust.
49
DAFTAR PUSTAKA
Anselin, L. 1988. Spatial Econometrics: Method and Models. Kluwer
Academic Publishers, Netherlands.
Kristanto, B. 2016. Estimasi Parameter Model Robust Geographically
Weighted Regression dengan Metode bounded influence M-
estimation. Skripsi tidak dipublikasikan. UIN Maulana Malik
Ibrahim Malang. Malang.
BPS. 2015. Statistik Jawa Timur Dalam Angka 2015. Publikasi Badan
Pusat Statistik. Jawa Timur.
BPS. 2015. Perkembangan Beberapa Indikator Utama Sosial Ekonomi
Provinsi Jawa Timur 2016. Publikasi Badan Pusat Statistik. Jawa
Timur.
Chen, C. 2002. Statistics and Data Analysis: Robust and Outlier
Detection with the ROBUSTREG procedure. 265-267. SAS
Institute.,Inc. (http://v8doc.sas.com/sashtml) diakses pada 28
Oktober 2016.
Cohen, J. 2003. Applied Multiple Regression/Correlation Analysis
For the Behavioral Sciencs Third Edition. Lawrence Erlbaum
Assoociate. New Jersey.
Draper, N.R., & Smith, H.1992. Analisis Regresi Terapan.
PT.Gramedia Pustaka Utama. Jakarta.
Fotheringham, A.S., Brundson, C., & Chartlon, M. 2002.
Geographically Weighted Regression, the analysis of spatially
varying relationships. John Wiley and Sons, LTS.
Fox, J. 2002. Robust Regression (Online) (http://cran.r-project.org/doc/contrib/Fox-Companion/appeandix-robust-regression.pdf&sa=U&ei=BnOVMqYltPeoATGr4DYBQ&ved=0CBQQFjAA&usg) diakses pada 9 November 2016.
50
Geologinesia. 2012. Sistem Informasi Geografis Untuk Pengelolaan
Sumberdaya Alam. Bogor, Indonesia.
(http://www.geologinesia.com).
Harvey, J. Miller. 2004. Tobler’s First Law and Spatial Analysis,
Annals of the Association of American Geographers, 94(2), 284-
289.
Hekimoglu, S., & Erenoglu, R.C. 2013. A New-Estimate with
Breakdown Point. Acta Geod Geophys, 48:419-437.
Huber, M., & Rousseeuw, J. 2008. High-Breakdown Robust
Multivariate Methods. Statistical Science, 28 (1): 92-119.
Maronna, R.A., Martin, D., & Yohai, V.J. 2006. Robust Statistics:
Theory and Methods. John Wiley & Sons. England.
Montgomery, D.C.,& Peck, E.A. 2006. Introduction to Linear
Regression Analysis. A Wiley-Interscience Publication. New
York.
Myers, H. R. 1990. Classical and Modern Regression with
Application. PWS-KENT Publishing Company. Boston.
Prahasta, E. 2009. Sistem Informasi Geografis : Konsep-konsep
Dasar. Penerbit Informatika. Bandung.
Rahmawati, R & Djuaraidah, A. 2012.”Prosiding Seminar Nasional
Statistika”.Universitas Diponegoro. Tidak diterbitkan.
Rousseeuw, P.J., & Annick, M.L. 1987. Robust Regression and
Outlier Detection. John Wiley & Sons. New York.
Ryan, T. P. 1997. Modern Regression Methods. A Wiley-Interscience
Publication. New York.
Zhang, H & Mei, C. 2011. Local least absolute deviation estimation
of spatially varying coefficient models: robust geographically
weighted regression approaches. Taylor & Francis. China.