Analisis Non Hierarki

Preview:

DESCRIPTION

Contoh manual menentukan cluster

Citation preview

KELOMPOK 3 :

1. Shilvia Nurfauziah (1110094000003)

2. Muflihaini soleh (1110094000010)

3. Ardi (1110094000015)

4. Fitri Rahayu A (1110094000033)

RUMUSAN MASALAHDalam uraian diatas maka dapat dibentuk rumusan

masalah yaitu bagaimana melakukan pengelompokkan

data dengan menggunakan metode clustering non hirarki

?

TUJUAN

Memberikan penjelasan bagaimana menggelompokkan

data dengan menggunakan metode clustering non hirarki.

PENGERTIAN

2. Analisis cluster merupakan alat untuk mengelompokkan

sejumlah n obyek berdasarkan p variat yang secara relatif

mempunyai kesamaan karakteristik diantara obyek-obyek

tersebut, sehingga keragaman di dalam suatu kelompok tersebut

lebih kecil dibandingkan keragaman antar kelompok.

1. Analisis cluster merupakan teknik multivariat yang

mempunyai tujuan utama untuk mengelompokkan objek-

objek berdasarkan karakteristik yang dimilikinya.

Proses Analisis Cluster Menentukan ukuran

ketakmiripan antar dua objek

Sifat – sifat ukuran ketakmiripan

adalah :

1) d(a.b) ≥ 0

2) d(a,a) = 0

3) d(a,b) = d(b,a)

4) (a,b) meningkat seiring semakin

tidak mirip kedua objek a dan b.

5) d(a,c) ≤ d(a,b) + d(b,c)

RUMUS EUCLIDIAN

Membuat Cluster

1. Metode hirarki

2. Metode Non-hirarki

CIRI CIRI CLUSTER

- Homogenitas (kesamaan) yang tinggi antar anggota dalam

satu cluster (within-cluster )

- Heterogenitas (perbedaan) yang tinggi antar cluster yang

satu dengan cluster yang lainnya (between-cluster ).

ANALISIS CLUSTER NON-HIERARKI

Metode ini dimulai dengan proses penentuan

jumlah cluster terlebih dahulu. Metode Non-

hirarki bertujuan mengelompokkan n obyek

kedalam k kelompok (k<n)metode ini yang

digunakan adalah k-means.

PEMBAHASANMETODE NON HIERARKI

Mengelompokkan data denganMetode Non Hierarki (K-Means)

Langkah-Langkah yang harus dilakukandalam menggunakan metode K-Means Cluster

1. Menentukkan jumlah klaster

2. Menentukkan asumsi titik pusat klaster (centroid)

3. Menghitung jarak objek ke centroid

4. Mengelompokkan objek berdasarkan jarakminimum

5. Jika ada objek yang berpindah maka dibuat centroidbaru kembali dan melakukan langkah langkahnyadari semula. Jika tidak ada objek yang berpindah , maka proses clustering selesai.

Lanjutan...6. Melakukan validasi cluster. Untuk menguji validasi

cluster digunakan uji parsial F.

Hipotesis : H0 : variabel i bukan variabel pembedadalam pengclusteran.

H1 : variabel i merupakan variabel pembedadalam pengclusteran

Taraf signifikansi α

Statistik uji :

Kriteria Uji : Tolak H0 jika F > Fα, k -1,n-k

CONTOH 1Misalkan kita punya data sebagai berikut :

Carilah klaster yang terbentuk !

ItemObservasi

X1 X2

A 5 3

B -1 1

C 1 -2

D -3 -2

1. Menentukkan jumlah klaster

Misalkan kita akan mengelompokkan data menjadi 2 klaster dengan kluster awal.

Kluster 1 : AB

Kluster 2 : CD

2. Menentukkan asumsi titik pusat klaster (centroid)

OBSERVASICLUSTER

AB CD

X1

X2

3. Menghitung jarak objek kecentroid

Menggunakan jarakk Euclid :

d2(xici)=(xi-ci )2

d2(A,AB) = (5-2)2 + (3-2)2 = 10

d2(A,CD) = (5-(-1))2 + (3-(-2))2 = 61

d2(B,AB) = (-1-2)2 + (1-2)2 = 10

d2(B,CD) = (-1-(-1))2 + (1-(-2))2 = 9

d2(C,AB) = (1-2)2 + (-2-2)2 = 17

d2(C,CD) = (1-(-1))2 + (-2-(-2))2 = 4

d2(D,AB) = (-3-2)2 + (-2-2)2 = 41

d2(D,CD) = (-3-(-1))2 + (-2-(-2))2 = 4

4. Mengelompokkan objek berdasarkanjarak minimum

ITEMCLUSTER

CLUSTERAB(1) CD(2)

A 10 61 1

B 10 9 2

C 17 4 2

D 41 4 2

Karena ada objek yang berpindah yaitu item B

yang berpindah ke kluster CD maka dibuat

centroid baru kembali

5.Membuat Centroid Kembali

OBSERVASICLUSTER

A BCD

X1 5

X2 3

6. Menentukkan jarak objek kecentroid

Menggunakan jarak Euclid:

d2(A,A) = (5-5)2 + (3-3)2 = 0

d2(A,BCD) = (5-(-1))2 + (3-(-1))2 = 52

d2(B,A) = (-1-5)2 + (1-3)2 = 40

d2(B,BCD) = (-1-(-1))2 + (1-(-1))2 = 4

d2(C,A) = (1-5)2 + (-2-3)2 = 41

d2(C,BCD) = (1-(-1))2 + (-2-(-1))2 = 5

d2(D,A) = (-3-5)2 + (-2-3)2 = 89

d2(D,BCD) = (-3-(-1))2 + (-2-(-1))2 = 5

7. Mengelompokkan objek berdasarkanjarak minimum

Karena tidak ada objek yang berpindah maka

proses klastering selesai. Klaster yang terbentuk

dari 4 item tadi yaitu Klaster A dan klaster BCD

TERIMA KASIH

Recommended