Upload
others
View
12
Download
0
Embed Size (px)
Citation preview
ANALISIS CLUSTER
Cluster adalah kelompok obyek yang memiliki kesamaan karakteristikContoh Cluster
• Kelas di Sekolah
• Jurusan di Sekolah
• Blok di Rumah Sakit
• Los di Pasar
Pengertian CLUSTERING
Proses pengelompokkan sejumlah obyek berdasarkan informasi yang diperoleh dari data yang menjelaskan hubungan antar obyek dengan prinsip untuk memaksimalkan kesamaan antar anggota satu cluster dan meminimumkan kesamaan antar cluster.
CLUSTER IDENTIK DENGAN PARTISIS
A
DB
A U B U C U D = S A ∩ B ∩ C ∩ D = ФD = Outlayer (pencilan)
Tujuan Clustering
Manfaat Clustering
Tujuan utama dari clustering adalah mengelompokkan
obyek-obyek berdasarkan
karakteristik yang dimiliki masing-masing obyek
(Candiasa, 2011:77).
Untuk mengidentifikasi
obyek-obyek (Recognition), untuk mendukung sistem
pendukung keputusan dan data
mining.
Macam-Macam Metode CLUSTERING
1) Berbasis Metode Statistika) Metode Hirarkib) Metode Non-Hirarki
2) Berbasis Logika Fuzzy
a)Metode Fuzzy C-Means
b)Metode Fuzzy Subtractive Clustering.
3)Berbasis Neural Network
4) Berbasis Optimasi Centroid atau Lebar Cluster
Metode Genetik Algoritma (GA).
Analisis Cluster Berbasis Metode StatistikAsumsi yang Harus Dipenuhi
Representatif
• Sampel yang diambil benar-benar bisa mewakili populasi yang ada.
Multikolinearitas• Kemungkinan adanya korelasi
antar objek.
Proses Analisis Cluster
Memilih Ukuran Jarak
Melakukan Proses Standarisasi Data Jika
Diperlukan
Memilih Prosedur Pengclusteran
Melakukan Interpretasi Terhadap
Cluster yang Terbentuk
Melakukan Validasi dan Profiling Cluster
a. Jarak Euclid• Jarak berupa akar jumlah kuadrat
perbedaan nilai untuk tiap variabel.
1. Memilih Ukuran Jarak
1. Memilih Ukuran Jarak
1. Memilih Ukuran Jarak
1. Memilih Ukuran Jarak
Jika data memangmenpunyaisatuan yang berbedasecarasignifikan, makaharusdilakukan proses standarisasidata denganmengubah data keskor standar, seperti skor-, skor-T, atau skor S.
T=50+10Z
•
2. Melakukan Proses Standarisasi Data (Jika Diperlukan)
3. Memilih Prosedur Pengclusteran
4. Melakukan Interpretasi Terhadap Cluster yang Terbentuk
Melakukan interpretasi terhadap cluster yang telah
terbentuk, yang pada intinya memberi nama spesifik
untuk menggambarkan isi cluster tersebut.
5. Melakukan Validasi dan Profiling Cluster
Menjelaskan karakteristik setiap cluster berdasar
profil tertentu. Dari data profiling tersebut bisa
dilakukan analisis lanjutan seperti analisis
diskriminan.
Metode K-Means Clustering
Pengertian K-Means Clustering
K-Means merupakan salah satu metode clustering non-hirarki yang berusaha untuk mempartisi obyek yang ada ke dalam bentuk satu atau lebih cluster.
Metode ini mempartisi obyek berdasarkan karakteristiknya.
Obyek yang mempunyai karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan obyek yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam cluster yang lain.
Tujuan Pengelompokkan
Meminimalkan variasi dalam satu cluster dan memaksimalkan variasi antar cluster.
Penerapan Algoritma K-Means Clustering
Langkah – Langkah K-Means Clustering
1Tentukan jumlah cluster (k) yang ingin dibentuk. 2
Tetapkan k pusat cluster awal secara random.
3Alokasikan semua
data/obyek ke dalam cluster terdekat
4Tentukan kembali titik pusat cluster yang baru berdasarkan rata-rata
5Lakukan kembali langkah 3 hingga titik pusat dari
setiap cluster tidak berubah
(1). Tentukan jumlah cluster (k) yang dibentuk.Dalam kasus ini data yang ada akan dikelompokkan menjadi tiga cluster:
Baik
Sedang
Kurang
(2) Tetapkan k pusat cluster awal secara random
(3). Alokasikan semua data/obyek ke dalam cluster terdekat
(4) Tentukan kembali titik pusat cluster yang baru berdasarkan rata-rata
(5). Lakukan kembali langkah 3 hingga titik pusat dari setiap cluster tidak berubah
ketiga pusat cluster dikelompokkan menjadi 3 dengan karakteristik sebagai berikut:
• Kelompok pertama (cluster ke-1) : berisi siswa-siswa yang memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar 69,7, dan rata-rata nilai ulangan harian sekitar 58,3. • Kelompok kedua (cluster ke-2) : berisi siswa-siswa yang
memiliki ratarata nilai tugas sekitar 66,6, rata-rata nilai kuis sekitar 68,5, dan rata-rata nilai ulangan harian sekitar 82,9. • Kelompok ketiga (cluster ke-3) : berisi siswa-siswa yang
memiliki ratarata nilai tugas sekitar 78,3, rata-rata nilai kuis sekitar 72,9, dan rata-rata nilai ulangan harian sekitar 82,4
Dari langkah – langkah tersebut dapat disimpulkan bahwa• Kelompok pertama (Cluster ke-1), terdiri dari 12 orang siswa, yakni siswa
dengan nomor urut 2, 13, 14, 19, 21, 30, 31, 32, 33, 36, 38 dan 39. Pada cluster ke-1 ini siswa tergolong memiliki kemampuan matematika rendah. Berdasarkan hal tersebut siswa pada cluster ini diberikan remedi. • Kelompok kedua (Cluster ke-2), terdiri dari 9 orang siswa, yakni siswa
dengan nomor urut 1, 6, 10, 15, 22, 26, 29, 34 dan 35. Pada cluster ke-2 ini siswa tergolong memiliki kemampuan matematika sedang. Berdasarkan hal tersebut siswa pada cluster ini diberikan remedi. • Kelompok ketiga (Cluster ke-3), terdiri dari 19 orang siswa, yakni siswa
dengan nomor urut 3, 4, 5, 7, 8, 9, 11, 12, 16, 17, 18, 20, 23, 24, 25, 27, 28, 37 dan 40. Pada cluster ke-3 ini siswa tergolong memiliki kemampuan matematika tinggi. Karena hal tersebut siswa pada cluster ini tidak diberikan remedi, tetapi siswa pada cluster ini diberikan pengayaan.