31
ANALISIS CLUSTER

ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

  • Upload
    others

  • View
    12

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

ANALISIS CLUSTER

Page 2: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

Cluster adalah kelompok obyek yang memiliki kesamaan karakteristikContoh Cluster

• Kelas di Sekolah

• Jurusan di Sekolah

• Blok di Rumah Sakit

• Los di Pasar

Page 3: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

Pengertian CLUSTERING

Proses pengelompokkan sejumlah obyek berdasarkan informasi yang diperoleh dari data yang menjelaskan hubungan antar obyek dengan prinsip untuk memaksimalkan kesamaan antar anggota satu cluster dan meminimumkan kesamaan antar cluster.

Page 4: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

CLUSTER IDENTIK DENGAN PARTISIS

A

DB

A U B U C U D = S A ∩ B ∩ C ∩ D = ФD = Outlayer (pencilan)

Page 5: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

Tujuan Clustering

Manfaat Clustering

Tujuan utama dari clustering adalah mengelompokkan

obyek-obyek berdasarkan

karakteristik yang dimiliki masing-masing obyek

(Candiasa, 2011:77).

Untuk mengidentifikasi

obyek-obyek (Recognition), untuk mendukung sistem

pendukung keputusan dan data

mining.

Page 6: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

Macam-Macam Metode CLUSTERING

1) Berbasis Metode Statistika) Metode Hirarkib) Metode Non-Hirarki

2) Berbasis Logika Fuzzy

a)Metode Fuzzy C-Means

b)Metode Fuzzy Subtractive Clustering.

3)Berbasis Neural Network

4) Berbasis Optimasi Centroid atau Lebar Cluster

Metode Genetik Algoritma (GA).

Page 7: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

Analisis Cluster Berbasis Metode StatistikAsumsi yang Harus Dipenuhi

Representatif

• Sampel yang diambil benar-benar bisa mewakili populasi yang ada.

Multikolinearitas• Kemungkinan adanya korelasi

antar objek.

Page 8: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

Proses Analisis Cluster

Memilih Ukuran Jarak

Melakukan Proses Standarisasi Data Jika

Diperlukan

Memilih Prosedur Pengclusteran

Melakukan Interpretasi Terhadap

Cluster yang Terbentuk

Melakukan Validasi dan Profiling Cluster

Page 9: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

a. Jarak Euclid• Jarak berupa akar jumlah kuadrat

perbedaan nilai untuk tiap variabel.

1. Memilih Ukuran Jarak

Page 10: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

1. Memilih Ukuran Jarak

Page 11: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

1. Memilih Ukuran Jarak

Page 12: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

1. Memilih Ukuran Jarak

Page 13: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

Jika data memangmenpunyaisatuan yang berbedasecarasignifikan, makaharusdilakukan proses standarisasidata denganmengubah data keskor standar, seperti skor-, skor-T, atau skor S.

T=50+10Z

•  

2. Melakukan Proses Standarisasi Data (Jika Diperlukan)

Page 14: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

3. Memilih Prosedur Pengclusteran

Page 15: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

4. Melakukan Interpretasi Terhadap Cluster yang Terbentuk

Melakukan interpretasi terhadap cluster yang telah

terbentuk, yang pada intinya memberi nama spesifik

untuk menggambarkan isi cluster tersebut.

Page 16: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

5. Melakukan Validasi dan Profiling Cluster

Menjelaskan karakteristik setiap cluster berdasar

profil tertentu. Dari data profiling tersebut bisa

dilakukan analisis lanjutan seperti analisis

diskriminan.

Page 17: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

Metode K-Means Clustering

Page 18: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

Pengertian K-Means Clustering

K-Means merupakan salah satu metode clustering non-hirarki yang berusaha untuk mempartisi obyek yang ada ke dalam bentuk satu atau lebih cluster.

Metode ini mempartisi obyek berdasarkan karakteristiknya.

Obyek yang mempunyai karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan obyek yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam cluster yang lain.

Page 19: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

Tujuan Pengelompokkan

Meminimalkan variasi dalam satu cluster dan memaksimalkan variasi antar cluster.

Page 20: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

Penerapan Algoritma K-Means Clustering

Page 21: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

Langkah – Langkah K-Means Clustering

1Tentukan jumlah cluster (k) yang ingin dibentuk. 2

Tetapkan k pusat cluster awal secara random.

3Alokasikan semua

data/obyek ke dalam cluster terdekat

4Tentukan kembali titik pusat cluster yang baru berdasarkan rata-rata

5Lakukan kembali langkah 3 hingga titik pusat dari

setiap cluster tidak berubah

Page 22: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

(1). Tentukan jumlah cluster (k) yang dibentuk.Dalam kasus ini data yang ada akan dikelompokkan menjadi tiga cluster:

Baik

Sedang

Kurang

Page 23: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

(2) Tetapkan k pusat cluster awal secara random

Page 24: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

(3). Alokasikan semua data/obyek ke dalam cluster terdekat

Page 25: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar
Page 26: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

(4) Tentukan kembali titik pusat cluster yang baru berdasarkan rata-rata

Page 27: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar
Page 28: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

(5). Lakukan kembali langkah 3 hingga titik pusat dari setiap cluster tidak berubah

Page 29: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

ketiga pusat cluster dikelompokkan menjadi 3 dengan karakteristik sebagai berikut:

• Kelompok pertama (cluster ke-1) : berisi siswa-siswa yang memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar 69,7, dan rata-rata nilai ulangan harian sekitar 58,3. • Kelompok kedua (cluster ke-2) : berisi siswa-siswa yang

memiliki ratarata nilai tugas sekitar 66,6, rata-rata nilai kuis sekitar 68,5, dan rata-rata nilai ulangan harian sekitar 82,9. • Kelompok ketiga (cluster ke-3) : berisi siswa-siswa yang

memiliki ratarata nilai tugas sekitar 78,3, rata-rata nilai kuis sekitar 72,9, dan rata-rata nilai ulangan harian sekitar 82,4

Page 30: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar
Page 31: ANALISIS CLUSTER - pasca.undiksha.ac.idpasca.undiksha.ac.id/wp-content/uploads/2019/06/analisis-kluster.pdf · memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar

Dari langkah – langkah tersebut dapat disimpulkan bahwa• Kelompok pertama (Cluster ke-1), terdiri dari 12 orang siswa, yakni siswa

dengan nomor urut 2, 13, 14, 19, 21, 30, 31, 32, 33, 36, 38 dan 39. Pada cluster ke-1 ini siswa tergolong memiliki kemampuan matematika rendah. Berdasarkan hal tersebut siswa pada cluster ini diberikan remedi. • Kelompok kedua (Cluster ke-2), terdiri dari 9 orang siswa, yakni siswa

dengan nomor urut 1, 6, 10, 15, 22, 26, 29, 34 dan 35. Pada cluster ke-2 ini siswa tergolong memiliki kemampuan matematika sedang. Berdasarkan hal tersebut siswa pada cluster ini diberikan remedi. • Kelompok ketiga (Cluster ke-3), terdiri dari 19 orang siswa, yakni siswa

dengan nomor urut 3, 4, 5, 7, 8, 9, 11, 12, 16, 17, 18, 20, 23, 24, 25, 27, 28, 37 dan 40. Pada cluster ke-3 ini siswa tergolong memiliki kemampuan matematika tinggi. Karena hal tersebut siswa pada cluster ini tidak diberikan remedi, tetapi siswa pada cluster ini diberikan pengayaan.