View
78
Download
7
Category
Preview:
DESCRIPTION
Contoh manual menentukan cluster
Citation preview
KELOMPOK 3 :
1. Shilvia Nurfauziah (1110094000003)
2. Muflihaini soleh (1110094000010)
3. Ardi (1110094000015)
4. Fitri Rahayu A (1110094000033)
RUMUSAN MASALAHDalam uraian diatas maka dapat dibentuk rumusan
masalah yaitu bagaimana melakukan pengelompokkan
data dengan menggunakan metode clustering non hirarki
?
TUJUAN
Memberikan penjelasan bagaimana menggelompokkan
data dengan menggunakan metode clustering non hirarki.
PENGERTIAN
2. Analisis cluster merupakan alat untuk mengelompokkan
sejumlah n obyek berdasarkan p variat yang secara relatif
mempunyai kesamaan karakteristik diantara obyek-obyek
tersebut, sehingga keragaman di dalam suatu kelompok tersebut
lebih kecil dibandingkan keragaman antar kelompok.
1. Analisis cluster merupakan teknik multivariat yang
mempunyai tujuan utama untuk mengelompokkan objek-
objek berdasarkan karakteristik yang dimilikinya.
Proses Analisis Cluster Menentukan ukuran
ketakmiripan antar dua objek
Sifat – sifat ukuran ketakmiripan
adalah :
1) d(a.b) ≥ 0
2) d(a,a) = 0
3) d(a,b) = d(b,a)
4) (a,b) meningkat seiring semakin
tidak mirip kedua objek a dan b.
5) d(a,c) ≤ d(a,b) + d(b,c)
RUMUS EUCLIDIAN
Membuat Cluster
1. Metode hirarki
2. Metode Non-hirarki
CIRI CIRI CLUSTER
- Homogenitas (kesamaan) yang tinggi antar anggota dalam
satu cluster (within-cluster )
- Heterogenitas (perbedaan) yang tinggi antar cluster yang
satu dengan cluster yang lainnya (between-cluster ).
ANALISIS CLUSTER NON-HIERARKI
Metode ini dimulai dengan proses penentuan
jumlah cluster terlebih dahulu. Metode Non-
hirarki bertujuan mengelompokkan n obyek
kedalam k kelompok (k<n)metode ini yang
digunakan adalah k-means.
PEMBAHASANMETODE NON HIERARKI
Mengelompokkan data denganMetode Non Hierarki (K-Means)
Langkah-Langkah yang harus dilakukandalam menggunakan metode K-Means Cluster
1. Menentukkan jumlah klaster
2. Menentukkan asumsi titik pusat klaster (centroid)
3. Menghitung jarak objek ke centroid
4. Mengelompokkan objek berdasarkan jarakminimum
5. Jika ada objek yang berpindah maka dibuat centroidbaru kembali dan melakukan langkah langkahnyadari semula. Jika tidak ada objek yang berpindah , maka proses clustering selesai.
Lanjutan...6. Melakukan validasi cluster. Untuk menguji validasi
cluster digunakan uji parsial F.
Hipotesis : H0 : variabel i bukan variabel pembedadalam pengclusteran.
H1 : variabel i merupakan variabel pembedadalam pengclusteran
Taraf signifikansi α
Statistik uji :
Kriteria Uji : Tolak H0 jika F > Fα, k -1,n-k
CONTOH 1Misalkan kita punya data sebagai berikut :
Carilah klaster yang terbentuk !
ItemObservasi
X1 X2
A 5 3
B -1 1
C 1 -2
D -3 -2
1. Menentukkan jumlah klaster
Misalkan kita akan mengelompokkan data menjadi 2 klaster dengan kluster awal.
Kluster 1 : AB
Kluster 2 : CD
2. Menentukkan asumsi titik pusat klaster (centroid)
OBSERVASICLUSTER
AB CD
X1
X2
3. Menghitung jarak objek kecentroid
Menggunakan jarakk Euclid :
d2(xici)=(xi-ci )2
d2(A,AB) = (5-2)2 + (3-2)2 = 10
d2(A,CD) = (5-(-1))2 + (3-(-2))2 = 61
d2(B,AB) = (-1-2)2 + (1-2)2 = 10
d2(B,CD) = (-1-(-1))2 + (1-(-2))2 = 9
d2(C,AB) = (1-2)2 + (-2-2)2 = 17
d2(C,CD) = (1-(-1))2 + (-2-(-2))2 = 4
d2(D,AB) = (-3-2)2 + (-2-2)2 = 41
d2(D,CD) = (-3-(-1))2 + (-2-(-2))2 = 4
4. Mengelompokkan objek berdasarkanjarak minimum
ITEMCLUSTER
CLUSTERAB(1) CD(2)
A 10 61 1
B 10 9 2
C 17 4 2
D 41 4 2
Karena ada objek yang berpindah yaitu item B
yang berpindah ke kluster CD maka dibuat
centroid baru kembali
5.Membuat Centroid Kembali
OBSERVASICLUSTER
A BCD
X1 5
X2 3
6. Menentukkan jarak objek kecentroid
Menggunakan jarak Euclid:
d2(A,A) = (5-5)2 + (3-3)2 = 0
d2(A,BCD) = (5-(-1))2 + (3-(-1))2 = 52
d2(B,A) = (-1-5)2 + (1-3)2 = 40
d2(B,BCD) = (-1-(-1))2 + (1-(-1))2 = 4
d2(C,A) = (1-5)2 + (-2-3)2 = 41
d2(C,BCD) = (1-(-1))2 + (-2-(-1))2 = 5
d2(D,A) = (-3-5)2 + (-2-3)2 = 89
d2(D,BCD) = (-3-(-1))2 + (-2-(-1))2 = 5
7. Mengelompokkan objek berdasarkanjarak minimum
Karena tidak ada objek yang berpindah maka
proses klastering selesai. Klaster yang terbentuk
dari 4 item tadi yaitu Klaster A dan klaster BCD
TERIMA KASIH
Recommended