20
Data Mining and Knowledge Management Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering (Studi Kasus Pengelompokkan Kabupaten/Kota di Jawa Tengah Tahun 2008 Berdasarkan Ukuran Moneter dan Nonmoneter) Disusun Oleh: Eko Wahyu Lestari (12.7121) Galang Retno Winarko (12.7151) Lukman Azhari (12.7225) Putu Agus Darmawan (12.7315) Kelas 3KS2 SEKOLAH TINGGI ILMU STATISTIK Jalan Otto Iskandardinata 64C, Jakarta Timur, Jakarta 2014/2015

Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

Embed Size (px)

DESCRIPTION

Tugas kelompok mata kuliah data mining. sebaiknya jangan digunakan sebagai bahan referensi dahulu. pakai sebagai bahan ajar aja ya.

Citation preview

Page 1: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

Data Mining and Knowledge Management

Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical

Clustering (Studi Kasus Pengelompokkan Kabupaten/Kota di Jawa Tengah

Tahun 2008 Berdasarkan Ukuran Moneter dan Nonmoneter)

Disusun Oleh:

Eko Wahyu Lestari (12.7121)

Galang Retno Winarko (12.7151)

Lukman Azhari (12.7225)

Putu Agus Darmawan (12.7315)

Kelas 3KS2

SEKOLAH TINGGI ILMU STATISTIK

Jalan Otto Iskandardinata 64C, Jakarta Timur, Jakarta

2014/2015

Page 2: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

BAB I PENDAHULUAN

1.1 Latar Belakang

Kemiskinan merupakan suatu masalah yang terjadi di berbagai negara, terutama di negara-

negara berkembang, termasuk Indonesia. Menurut Badan Pusat Statistik (BPS 2015), kemiskinan

adalah ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan dan bukan

makanan yang diukur dari sisi pengeluaran. Kemiskinan sering kali disebut-sebut sebagai inti dari

masalah pembangunan di suatu daerah sehingga keberadaan data tentang kemiskinan tersebut

dirasa penting karena menyangkut arah dan tujuan pembangunan di suatu daerah. Secara

internasional, terdapat kesepakatan untuk menanggulangi kemiskinan yang tertuang dalam program

Millennium Development Goals (MDGs) butir pertama. Jika dilihat dari jumlah penduduk miskin,

Provinsi Jawa Tengah merupakan provinsi kedua yang jumlah penduduk miskinnya paling banyak,

yaitu sekitar 4,7 juta atau sekitar 16,48% dari jumlah penduduk miskin di Indonesia. Namun, jika

dilihat dari persentase penduduk miskin di Indonesia, Provinsi Jawa Tengah menempati posisi ke-10,

yaitu sebesar 14,44% (BPS, September 2013).

Karena pentingnya data tentang kemiskinan tersebut, perlu kiranya untuk mengelompokkan

daerah-daerah (dalam hal ini Kabupaten/Kota di Provinsi Jawa Tengah) berdasarkan ukuran

kemiskinan (Head Count Index, Poverty Gap Index, dan Poverty Severity Index) agar dapat diketahui

dengan cepat daerah mana saja yang perlu diberikan perhatian lebih dalam hal pengentasan dan

penanggulangan kemiskinan. Dalam hal ini, penulis bermaksud untuk mengelompokkan daerah-

daerah tersebut menggunakan algoritma klastering hierarki Average Linkage dan

membandingkannya dengan algoritma klastering nonhierarki K-means.

1.2 Tujuan

Tulisan ini bertujuan untuk

a. Mengelompokkan Kabupaten/Kota di Jawa Tengah berdasarkan ukuran kemiskinan moneter

dan nonmoneter yang dicakup dalam 3 variabel yaitu Head Count Index, Poverty Gap Index,

dan Poverty Severity Index

b. Membandingkan penggunaan algoritma hierarchical clustering (Average linkage) dan

algoritma nonhierarchical clustering (K-means)

c. Memberikan rekomendasi arah kebijakan pemerintah dalam hal pengentasan kemiskinan

Page 3: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

1.3 Konsep dan Definisi

Penduduk miskin adalah penduduk yang memiliki rata-rata pengeluaran per kapita per bulan di

bawah Garis Kemiskinan.

Kemiskinan adalah ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan

dan bukan makanan yang diukur dari sisi pengeluaran.

Head Count Index (HCI-P0) adalah persentase penduduk miskin yang berada di bawah

GarisKemiskinan (GK).

Indeks Kedalaman Kemiskinan (Poverty Gap Index-P1) merupakan ukuran rata-rata kesenjangan

pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan. Semakin tinggi nilai indeks,

semakin jauh rata-rata pengeluaran penduduk dari garis kemiskinan

Indeks Keparahan Kemiskinan (Poverty Severity Index-P2) memberikan gambaran mengenai

penyebaran pengeluaran di antara penduduk miskin. Semakin tinggi nilai indeks, semakin tinggi

ketimpangan pengeluaran di antara penduduk miskin.

Ukuran kemiskinan Moneter merupakan ukuran kemiskinan yang diukur berdasarkan variabel

moneter (kuantitatif) yaitu pendapatan dan pengeluaran konsumsi perkapita.

Ukuran kemiskinan Nonmoneter merupakan ukuran kemiskinan yang diukur berdasarkan variabel

nonmoneter (kualitatif) yaitu indikator individu dan indikator rumah tangga.

Clustering adalah proses membuat pengelompokan sehingga semua anggota dari setiap partisi

mempunyai persamaan berdasarkan matrik tertentu. Objek data yang terletak di dalam klaster harus

memiliki kemiripan sedangkan yang tidak berada dalam satu klaster tidak mempunyai kemiripan.

Page 4: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

BAB II PEMBAHASAN

2.1 Kajian Teori

Metode Pengelompokan Hirarki

Metode pengelompokan hirarki digunakan apabila belum ada informasi jumlah

kelompok. Biasanya, hasil dari pengelompokan dengan metode ini adalah dendogram.

Metode Pengelompokan Nonhirarki

Metode pengelompokan nonhirarki bertujuan mengelompokkan n objek ke dalam k

kelompok (k<n). Salah satu prosedur pengelompokan dengan metode ini adalah K-

Means. Algoritma K-Means adalah metode clustering berbasis jarak yang membagi data

ke dalam sejumlah klaster. Algoritma ini hanya dapat digunakan pada atribut numerik.

Ada banyak cara yang dapat digunakan untuk membandingkan performa dari algoritma K-

Means dan algorima hierarki dalam penclusteran, tergantung dari ukuran apa yang digunakan.

Salah satu ukuran yang dapat digunakan dalam membandingkan algoritma tersebut adalah

dengan melihat nilai entropi dan nilai F Measure (yang dihitung dari nilai recall dan precision).

Entropi

Entropi memanfaatkan probabilitas dari klaster yang terbentuk yang dihitung dengan

rumus

1

n

j ij ij

i

E P LogP

di mana

Pij = probabilitas suatu anggota di klaster j untuk masuk ke cluster i.

Entropi dapat digunakan sebagai ukuran yang menunjukkan kualitas dari hasil clustering

(dengan catatan entropi yang terbaik terjadi saat setiap klaster memiliki tepat satu titik/data).

Nilai entropi yang lebih kecil menghasilkan klaster yang lebih bagus kualitasnya.

Page 5: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

F Measure

F measure memanfaatkan ide presisi dan recall pada information retrieval, di mana setiap

klaster diperlakukan seolah-olah seperti hasil dari query dan masing-masing kelas seolah-

olah adalah set yang diinginkan dokumen untuk query, dengan rumus

( , ) ,

( , )

ij

i

ij

j

nrecall i j

n

nprecision i j

n

di mana

n = jumlah anggota klaster

F Measure dihitung dengan rumus

2 ( , ) ( , )( , )

( , ) ( , )

recall i j precision i jF i j

precision i j recall i j

Nilai recall dan precision pada suatu keadaan dapat memiliki bobot yang berbeda. Ukuran

yang menampilkan timbal balik antara recall dan precision adalah F-measure yang merupakan

bobot rata-rata harmonik dari recall dan precision. Semakin besar nilai F-Measure, semakin baik

kualitas klaster tersebut.

Pada saat jumlah data meningkat, kinerja algoritma hirarki berjalan menurun dan waktu

untuk eksekusi meningkat. Waktu eksekusi algoritma K-Means juga meningkat tetapi jika

dibandingkan dengan algoritma hirarki kinerjanya lebih baik. Sebagai kesimpulan umum ,

algoritma K-Means baik untuk dataset yang besar dan hirarkis baik untuk dataset kecil .

Perbandingan antara algoritma ini dapat diimplementasikan atas dasar normalisasi, dengan

mengambil data yang dinormalisasi dan data yang tidak dinormalisasi akan memberikan hasil

yang berbeda .Tidak ada konsensus yang jelas dari dua algoritma ini yang dapat menghasilkan

pengelompokan yang lebih baik.

Page 6: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

2.2 Sumber Data

Sampel yang digunakan sebanyak 35, yaitu kabupaten/kota di Provinsi Jawa Tengah dengan

jumlah variabel ada 6. Variabel tersebut terdiri dari ukuran kemiskinan moneter dan nonmoneter

yang masing-masing mempunyai 3 variabel, yaitu : presentase penduduk yang berada di bawah garis

kemiskinan (P0 untuk moneter dan P0* untuk nonmoneter), indeks kedalaman kemiskinan (P1 untuk

moneter dan P1* untuk nonmoneter), indeks keparahan kemiskinan (P2 untuk moneter dan P2

* untuk

nonmoneter). Berikut ini adalah data yang digunakan.

Tabel 1 Data Ukuran Kemiskinan di Provinsi Jawa Tengah Tiap Kabupaten/Kota berdasarkan Susenas

Juli 2008

Kabupaten/Kota Ukuran Kemiskinan Moneter Ukuran Kemiskinan Nonmoneter

P0 P1 P2 P0* P1

* P2*

(1) (2) (3) (4) (5) (6) (7)

Cilacap 21,3992 4,6727 1,3493 27,0558 13,7432 9,2395

Banyumas 22,9347 3,9484 0,9254 21,5845 9,5646 5,5311

Purbalingga 27,2908 5,3969 1,4885 26,5569 12,0025 7,5713

Banjarnegara 23,3406 5,7536 1,7193 31,9548 15,5654 10,1228

Kebumen 27,8737 7,0504 2,0473 22,0945 10,2846 6,1921

Purworejo 18,2223 4,1724 1,2146 17,2864 8,6210 5,6476

Wonosobo 27,7216 8,0687 2,8595 23,9390 9,2457 5,4481

Magelang 16,4889 5,0090 1,6948 21,8843 10,3929 6,4720

Boyolali 17,0762 3,6425 1,0149 32,4205 16,1113 10,4927

Klaten 21,7152 7,0936 2,5033 9,8069 2,7721 2,0764

Sukoharjo 12,1273 2,6338 0,7348 7,4471 3,0411 1,8631

Wonogiri 20,7108 6,0289 2,0555 24,4091 11,2168 7,1206

Karanganyar 15,6848 3,0155 0,7806 6,1175 1,8793 0,8686

Sragen 20,8341 3,4997 0,8460 26,8496 12,4314 7,9593

Grobogan 19,8351 4,4859 1,2319 58,2478 29,7677 19,6901

Blora 18,7922 5,1251 1,6115 64,7850 31,6278 20,8122

Rembang 27,2082 5,4754 1,4258 36,5165 17,0610 10,8962

Pati 17,9042 6,0099 2,0839 23,0363 11,6377 7,8362

Kudus 12,5799 5,7580 0,7052 6,0799 1,7488 0,7855

Jepara 11,0504 1,9916 0,4605 17,7879 8,2205 5,3200

Page 7: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

Demak 21,2423 3,8609 0,8807 22,1639 9,7753 5,9686

Semarang 11,3729 2,3284 0,6537 17,2681 7,1223 4,2718

Temanggung 16,394 4,6622 1,5002 22,8160 7,9433 4,2502

Kendal 17,8684 4,0242 1,2336 26,5598 12,1225 7,5475

Batang 18,0824 5,4126 1,9274 32,8894 18,0746 12,9430

Pekalongan 19,5191 4,2270 1,0227 16,0557 7,4132 4,6654

Pemalang 23,9151 3,5898 0,8470 22,3749 10,8396 7,1295

Tegal 15,7832 2,6979 0,6786 12,9754 4,8037 2,4554

Brebes 25,9848 5,0560 1,3607 22,8626 10,4550 6,6121

Kota Magelang 11,1643 1,6758 0,4390 0,9312 0,2800 0,1290

Kota Surakarta 16,1259 2,7122 0,7511 0,4538 0,0920 0,0208

Kota Salatiga 8,4658 1,2831 0,3368 5,2759 1,7800 0,9657

Kota Semarang 5,9966 0,9900 0,2855 0,9749 0,2282 0,0861

Kota Pekalongan 10,2919 1,0311 0,1813 2,1577 0,6910 0,3111

Kota Tegal 11,2756 1,4195 0,2126 0,7955 0,2308 0,0762

Sumber: Skripsi Ricky Abdillah (2011)

Dari data di atas akan dibentuk 3 klaster yaitu klaster dengan tingkat kemiskinan tinggi,

sedang, dan rendah dengan menggunakan hierarchy clustering (Average Linkage) dan nonhierarchy

clustering (K-means). Dari hasil clustering tersebut, akan dibandingkan metode klater mana yang

lebih efektif untuk kasus di atas. Lebih lanjut, data yang diolah adalah data yang sudah distandarisasi

untuk mengurangi bias satuan. Kali ini penulis menggunakan alat bantu software SPSS 20 untuk

clustering data di atas.

2.3 Hierarchy Clustering Menggunakan Algoritma Average Linkage

Tabel 2 Case Processing Summary Algoritma Average Linkage

Berdasarkan tabel di atas, dapat dilihat bahwa data sejumlah 35 obyek telah diproses tanpa

ada data yang hilang.

Page 8: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

Tabel 3 Agglomeration Schedule

Page 9: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

Tabel di atas merupakan hasil proses clustering dengan metode Average Linkage. Jarak antar

variabel diukur dengan jarak euclidean kemudian dilakukan pengelompokan. Pengelompokan

dilakukan secara bertingkat.

Pada stage 1, terbentuk 1 klaster yang beranggotakan sampel nomor 34 dan 35 dengan jarak

0,093 (terdapat dalam kolom Coefficients). Karena proses aglomerasi dimulai dari 2 obyek yang

terdekat, maka jarak tersebut adalah yang terdekat dari sekian kombinasi jarak 35 obyek yang ada.

Angka 6 pada kolom terakhir, Next Stage, berarti clustering selanjutnya dilakukan pada stage 6.

Demikian seterusnya dari stage 6 dilanjutkan ke stage 14 hingga ke stage terakhir.

Proses aglomerasi ini bersifat kompleks, khususnya perhitungan koefisien yang melibatkan

sekian banyak obyek dan terus bertambah. Proses aglomerasi pada akhirnya akan menyatukan

semua obyek menjadi satu klaster. Klaster yang terbentuk dapat dilihat pada tabel 4 dan

dendogramnya dapat dilihat di gambar 1.

Page 10: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

Tabel 4 Cluster Membership

Page 11: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

Gambar 1 Dendogram using Average Linkage (Between Group)

Page 12: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

2.4 Nonhierarchy Clustering Menggunakan Algoritma K-Means

Tabel 5 Iteration History

Dari tabel 5 dapat disimpulkan bahwa proses iterasi dilakukan sebanyak 5 kali. Proses ini dilakukan

untuk mendapatkan klaster yang sesuai. Jarak minimum antar pusat klaster yang terjadi dari hasil

iterasi adalah 5,918.

Tabel 6 Final Cluster Centers

Berdasarkan tabel 6, dapat dketahui bahwa data di atas masih terkait dengan proses

standarisasi yang mengacu pada z-score dengan ketentuan sebagai berikut.

Nilai negatif (-) berarti data berada di bawah rata-rata total

Nilai positif (+) berarti data berada di atas rata-rata total.

Sedangkan rumus yang digunakan adalah

Page 13: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

………………………………………………………………. (1)

di mana:

X = Rata-rata sampel dalam cluster

μ = Rata-rata populasi

Z = Nilai standardisasi

σ = Standar Deviasi

Misalnya, apabila ingin mengetahui rata-rata P0 (presentase penduduk yang berada di bawah garis

kemiskinan moneter) dalam klaster 1 (X), maka

X = (rata-rata P0 seluruh sampel) + (0,60332 x Standar Deviasi rata-rata P0)

= 18,1221 + (0,60332 x 5,77461)

= 21,606

Jadi rata-rata P0 yang berada pada klaster 1 adalah 21,606.

Untuk klaster yang lain dapat dicari rata-rata nilai masing-masing variabel dengan cara yang sama.

Berdasarkan tabel 6, dengan ketentuan yang telah dijelaskan di atas, dapat didefinisikan

sebagai berikut.

a. Klaster 1

Dalam klaster 1 ini berisi kabupaten/kota dengan nilai P0, P1, dan P2 yang tinggi dan nilai

P0*, P1

*, dan P2* sedang, artinya kabupaten/kota dalam klaster 1 berdasarkan ukuran moneter

mempunyai presentase penduduk berada di bawah garis kemiskinan (P0) yang tinggi, rata-rata

kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P1)

yang tinggi, dan ketimpangan pengeluaran di antara penduduk miskin (P2) yang tinggi.

Dalam ukuran nonmoneter, klaster ini mempunyai persentase penduduk berada di

bawah garis kemiskinan (P0*) yang sedang, rata-rata kesenjangan pengeluaran masing-masing

penduduk miskin terhadap garis kemiskinan yang sedang (P1*), dan ketimpangan pengeluaran

di antara penduduk miskin (P2*) yang sedang juga. Dengan demikian, dapat diduga bahwa

klaster-1 ini merupakan pengelompokan dari kabupaten/kota menengah yang mempunyai

pendapatan ataupun pengeluaran perkapita rendah namun mempunyai akses sanitasi, air

bersih, dan ukuran nonmoneter lain yang cukup mudah.

Page 14: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

b. Klaster 2

Dalam klaster 2 ini berisi kabupaten/kota dengan nilai P0, P1, dan P2 serta P0*, P1

*, dan

P2* yang rendah, artinya kabupaten/kota dalam klaster 2 berdasarkan ukuran moneter

mempunyai presentase penduduk berada di bawah garis kemiskinan (P0) yang rendah, rata-

rata kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P1)

yang rendah, dan ketimpangan pengeluaran di antara penduduk miskin (P2) yang rendah.

Berdasarkan ukuran nonmoneter, klaster ini mempunyai presentase penduduk berada

di bawah garis kemiskinan (P0*) yang rendah, rata-rata kesenjangan pengeluaran masing-

masing penduduk miskin terhadap garis kemiskinan (P1*) yang rendah, dan ketimpangan

pengeluaran di antara penduduk miskin (P2*) yang rendah. Berdasarkan hal tersebut, klaster-2

ini diduga merupakan pengelompokan dari kabupaten/kota yang maju, yaitu yang mempunyai

pendapatan ataupun pengeluaran perkapita tinggi dan juga mempunyai akses sanitasi, air

bersih, dan lain-lain yang sangat mudah.

c. Klaster 3

Dalam klaster 3 ini berisi kabupaten/kota dengan nilai P0, P1, dan P2 yang sedang dan

nilai P0*, P1

*, dan P2* yang tinggi. Artinya, kabupaten/kota dalam klaster 3 berdasarkan ukuran

moneter mempunyai presentase penduduk berada di bawah garis kemiskinan (P0) yang

sedang, rata-rata kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis

kemiskinan (P1) yang sedang, dan ketimpangan pengeluaran di antara penduduk miskin (P2)

yang sedang.

Jika dilihat berdasarkan ukuran nonmoneter, klaster ini mempunyai presentase

penduduk berada di bawah garis kemiskinan (P0*) yang tinggi, rata-rata kesenjangan

pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P1*) yang tinggi,

serta ketimpangan pengeluaran di antara penduduk miskin (P2*) yang tinggi. Klaster-3 ini

diduga merupakan pengelompokan dari kabupaten/kota kecil yang mempunyai pendapatan

ataupun pengeluaran perkapita sedang namun mempunyai akses sanitasi, air bersih, dan

sebagainya yang sulit.

Perlu diingat kembali, penamaan masing-masing klaster sangat bersifat subjektif tergantung

pada peneliti dengan mengacu pada tujuan penelitian. Tabel berikut ini merupakan tabel Anova

yang dapat digunakan untuk melihat perbedaan variabel pada klaster yang terbentuk. Dalam hal ini

dapat dilihat dari nilai F dan nilai probabilitas (sig) masing-masing variabel.

Page 15: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

Tabel 7 ANOVA

Kesimpulannya adalah semakin besar nilai F dan (sig < 0,05), maka semakin besar perbedaan

variabel pada klaster yang terbentuk.

Berdasarkan tabel yang didapatkan, untuk semua variabel menunjukkan adanya perbedaan di

antara kabupaten/kota pada ketiga klaster yang terbentuk. Hal ini dengan ditunjukkan dengan nilai

sig = 0,000.

Tabel 8 Number of Cases in each Cluster

Jumlah anggota masing-masing klaster yang terbentuk

dapat diketahui dari tabel di atas. Dari tabel tersebut, dapat

dilihat bahwa klaster-1 beranggotakan 21 kabupaten/kota,

klaster-2 berisi 12 kabupaten/kota, dan pada klaster-3

terdapat 2 kabupaten/kota. Berikut adalah tabel yang

menunjukkan kabupaten/kota mana saja yang masuk ke dalam

klaster 1, 2, ataupun 3.

Page 16: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

Tabel 9 Hasil Clustering Menggunakan Algoritma K-Means

Cluster 1 QCL_2 Cluster 2 QCL_2 Cluster 3 QCL_2

(1) (2) (3) (4) (5) (6)

Cilacap 0,65404 Sukoharjo 0,48447 Grobogan 0,44868

Banyumas 1,21576 Karanganyar 0,95766 Blora 0,44868

Purbalingga 1,01994 Kudus 0,53191

Banjarnegara 1,12144 Jepara 1,3491

Kebumen 1,75996 Semarang 1,15125

Purworejo 1,13201 Tegal 0,99708

Wonosobo 2,86353 Kota Magelang 0,61207

Magelang 0,95916 Kota Surakarta 1,08426

Boyolali 1,73322 Kota Salatiga 0,78721

Klaten 2,6144 Kota Semarang 1,34156

Wonogiri 0,97717 Kota Pekalongan 0,92186

Sragen 1,3864 Kota Tegal 0,81671

Rembang 1,68831

Pati 1,1944

Demak 1,24212

Temanggung 1,19935

Kendal 0,99843

Batang 1,80709

Pekalongan 1,33859

Pemalang 1,38683

Brebes 0,82133

Tabel di atas dapat ditafsirkan sebagai berikut :

Klaster-1: berisikan Kab. Cilacap, Kab. Banyumas, Kab. Purbalingga, Kab. Banjarnegara, Kab.

Kebumen, Kab. Purworejo, Kab. Wonosobo, Kab. Magelang, Kab. Boyolali, Kab. Klaten, Kab.

Wonogiri, Kab. Sragen, Kab. Rembang, Kab. Pati, Kab. Demak, Kab. Temanggung, Kab. Kendal, Kab.

Batang, Kab. Pekalongan, Kab. Pemalang, dan Kab.Brebes dengan masing-masing jarak terhadap

pusat klaster-1 tercantum dalam kolom 2.

Page 17: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

Klaster-2: berisikan Kab. Sukoharjo, Kab. Karanganyar, Kab. Kudus, Kab. Jepara, Kab. Semarang, Kab.

Tegal, Kota Magelang, Kota Surakarta, Kota Salatiga, Kota Semarang, Kota Pekalongan, dan Kota

Tegal dengan masing-masing jarak terhadap pusat klaster-2 tercantum dalam kolom 4.

Klaster-3: berisikan Kab. Grobogan, Kab. Bloro dengan masing-masing jarak terhadap pusat klaster-3

tercantum dalam kolom 6.

Page 18: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

BAB III PENUTUP

Dari hasil di atas, dapat ditarik kesimpulan sebagai berikut.

1. Kabupaten/Kota di Jawa Tengah dikelompokkan ke dalam 3 klaster, yaitu:

Klaster pertama berisi kabupaten/kota menengah yang anggotanya berjumlah 21

Kab/Kota, yaitu: Kab. Cilacap, Kab. Banyumas, Kab. Purbalingga, Kab. Banjarnegara,

Kab. Kebumen, Kab. Purworejo, Kab. Wonosobo, Kab. Magelang, Kab. Boyolali, Kab.

Klaten, Kab. Wonogiri, Kab. Sragen, Kab. Rembang, Kab. Pati, Kab. Demak, Kab.

Temanggung, Kab. Kendal, Kab. Batang, Kab. Pekalongan, Kab. Pemalang, dan

Kab.Brebes

Klaster kedua berisi kabupaten/kota besar (maju) yang anggotanya berjumlah 12

Kab/Kota, yaitu Kab. Sukoharjo, Kab. Karanganyar, Kab. Kudus, Kab. Jepara, Kab.

Semarang, Kab. Tegal, Kota Magelang, Kota Surakarta, Kota Salatiga, Kota Semarang,

Kota Pekalongan, dan Kota Tegal

Klaster ketiga berisi kabupaten/kota kecil (terbelakang) yang anggotanya berjumlah

2 Kab/Kota, yaitu Kab. Grobogan dan Kab. Bloro

2. Penggunaan algoritma hierarchical clustering (average linkage) dan nonhierarchical

clustering (k-means) dalam hal ini menghasilkan klaster yang anggotanya sama.

3. Rekomendasi arah kebijakan pemerintah yang dapat diambil adalah sebagai berikut.

Pemerintah Jawa Tengah seharusnya memfokuskan pemberantasan kemiskinan di

Kabupaten Grobogan dan Blora dengan cara meningkatkan pembangunan sarana

dan prasarana umum di daerah tersebut seperti pembangunan sarana air bersih,

dan sanitasi.

Pemerintah Jawa Tengah dapat memfokuskan pemberantasan kemiskinan di Kab.

Cilacap, Kab. Banyumas, Kab. Purbalingga, Kab. Banjarnegara, Kab. Kebumen, Kab.

Purworejo, Kab. Wonosobo, Kab. Magelang, Kab. Boyolali, Kab. Klaten, Kab.

Wonogiri, Kab. Sragen, Kab. Rembang, Kab. Pati, Kab. Demak, Kab. Temanggung,

Kab. Kendal, Kab. Batang, Kab. Pekalongan, Kab. Pemalang, dan Kab.Brebes dengan

cara menciptakan lapangan pekerjaan ataupun pengadaan pelatihan kerja agar

pendapatan rumah tangga di kabupaten/kota tersebut bisa membaik.

Page 19: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

Untuk kabupaten/kota yang belum disebutkan di atas (klaster 2), Pemerintah dapat

meneliti lebih lanjut faktor-faktor apa yang menyebabkan kabupaten/kota tersebut

lebih maju dari pada kabupaten/kota lainnya agar hasilnya dapat digunakan untuk

referensi pembangunan di kabupaten/kota lain yang belum maju.

Page 20: Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical Clustering

DAFTAR PUSTAKA

Abdillah, Ricky. 2011. Pengelompokan Kabupaten/Kota Berdasarkan Ukuran Kemiskinan

Nonmoneter di Jawa Tengah (Analisa Data Susenas Juli 2008). Jakarta: Sekolah Tinggi Ilmu

Statistik.

Badan Pusat Statistik. 2014. Statistik Indonesia 2014. Jakarta: Badan Pusat Statistik.

http://www.bps.go.id/Subjek/view/id/23, diakses pada 5 Mei 2015 21:00 WIB

http://www.slideshare.net/miraclemin1/4-kemiskinan-ketimpangan-dan-pembangunan, diakses

pada 5 Mei 2015 21:00 WIB

https://www.academia.edu/5263304/Masalah_dan_Strategi_Pengentasan_Kemiskinan_di_Indonesi

a_, diakses pada 5 Mei 2015 21:00 WIB

Kaur, Manpreet dan Usvir Kaur. 2013. Comparison Between K-Mean and Hierarchical Algorithm

Using Query Redirection. Punjab: Sri Guru Granth Sahib World University.

Langgeni, Diah Pudi, ZK. Abdurahman Baizal, dan Yanuar Firdaus A.W. 2010. Clustering Artikel Berita

Berbahasa Indonesia Menggunakan Unsupervised Feature Selection. Bandung: Institut

Teknologi Telkom.

Steinbach, Michael, George Karypis, dan Vipin Kumar. 2000. A Comparison of Document Clustering

Techniques. Minesota: University of Minnesota.

Wicaksana, I Made Kunta dan I Made Widiartha. 2012. Penerapan Metode Ant Colony Optimzation

Pada Metode K-Harmonic Means Untuk Klasterisasi Data. Bali: Universitas Udayana.