OPTIMASI PARAMETER PADA KLASIFIKASI FUZZY ARTMAP …
38
OPTIMASI PARAMETER PADA KLASIFIKASI FUZZY OPTIMASI PARAMETER PADA KLASIFIKASI FUZZY ARTMAP BERBOBOT BERBASIS ALGORITMA GENETIKA ARTMAP BERBOBOT BERBASIS ALGORITMA GENETIKA w w w . i t s . a c . i d w w w . i t s . a c . i d Magister Magister Teknik Teknik Informatika Informatika Institut Institut Teknologi Teknologi Sepuluh Sepuluh Nopember Nopember (ITS) (ITS) Oleh Oleh : : Bain Bain Khusnul Khusnul Khotimah Khotimah Nrp Nrp . 5108201004 . 5108201004 Dosen Dosen Pembimbing Pembimbing : : Dr. Dr. Agus Agus Zainal Zainal Arifin Arifin , , S.Kom S.Kom ., ., M.Kom M.Kom . . Anny Yuniarti, S.Kom., M.Comp. Sc. Anny Yuniarti, S.Kom., M.Comp. Sc. TESIS
OPTIMASI PARAMETER PADA KLASIFIKASI FUZZY ARTMAP …
Slide 1OPTIMASI PARAMETER PADA KLASIFIKASI FUZZY OPTIMASI PARAMETER
PADA KLASIFIKASI FUZZY ARTMAP BERBOBOT BERBASIS ALGORITMA
GENETIKAARTMAP BERBOBOT BERBASIS ALGORITMA GENETIKA
w w w . i t s . a c . i dw w w . i t s . a c . i d
MagisterMagister TeknikTeknik InformatikaInformatika
InstitutInstitut TeknologiTeknologi SepuluhSepuluh NopemberNopember
(ITS)(ITS)
DosenDosen PembimbingPembimbing : : Dr. Dr. AgusAgus ZainalZainal
ArifinArifin, , S.KomS.Kom., ., M.KomM.Kom.. Anny Yuniarti, S.Kom.,
M.Comp. Sc. Anny Yuniarti, S.Kom., M.Comp. Sc.
TESIS
sebuah obyek ke kategori atau kelas tertentu Pengelompokan
berdasarkan nilai attribut-attribut
atau fitur-fiturnya (Pang Ning Tang, 2005).
Algoritma pembelajaran untuk membangun model klasifikasi: Adaptive
Resonance Theory (ART) merupakan jenis klasifikasi baru dari neural
network
Latar Belakang
(Grossberg, 1976) - : Neurol network Back Propagation
menghasilkan
model yang berasal dari hidden neuron dan fungsi aktivasi yang
membutuhkan epoch untuk titik equilibrium, jumlah hidden neurons
dan weight bersifat tetap dan perlu retraining sehingga stability
dilemma
(Grossberg, 1987) +: ART:ART-1 dan ART-2 dapat mengatasi
stability
dilemma
learning dari pola berlabel -:hal ini menimbulkan ketidakadilan
terhadap
node yang memiliki jumlah pattern lebih banyak
Latar Belakang
(Baraldi, 2002) Symmetric Fuzzy ART untuk menjaga
keseimbangan
fungsi match dan aktifasi yang selalu bertambah sehingga lebih
toleran dalam mencari kedekatan antara cluster node output dengan
pola
Mempunyai fungsi aktifasi dan match terpengaruh jumlah data di
dalam node sehingga dipengaruhi size dari cluster node
-: semakin besar ukuran cluster maka jarak class didalam cluter
semakin jauh
Latar Belakang (Darlis,2009): Algoritma Fuzzy ARTMAP Berbobot
Mengkombinasikan antara Fuzzy ARTMAP dan symmetric Fuzzy
ART ditambah dengan pembobotan node cluster berdasarkan jumlah pola
dan size node cluster tersebut Proses pembobotan dilakukan dengan
sistem bobot dalam algoritma sistem koloni semut berbasis feromon
Pembobotan digunakan menyesuaikan size cluster node output
yang
memiliki jumlah pattern lebih banyak
-: optimization problem dipengaruhi oleh inisialisasi parameter
pada saat training sehingga mempengaruhi kinerja classifier
KontribusiKontribusi PenelitianPenelitian
vigilance untuk menentukan tingkat resonansi pada saat update size
cluster
Rumusan Masalah Bagaimana cara mengoptimasi parameter dengan
menentukan parameter terbaik dengan algoritma genetika pada
klasifikasi fuzzy ARTMAP berbobot
Bagaimana mengukur kinerja klasifikasi GA-FAMB dibandingkan dengan
klasifikasi GS-FAMB (Grid search –FAMB) menggunakan uji t
berpasangan pada ten fold cross validation.
Tujuan Mendapatkan parameter yang optimal untuk
meningkatkan akurasi pada klasifikasi FAMB. Mempermudah pencarian
parameter pada
klasifikasi yang dapat diaplikasikan diberbagai bidang
datamining.
ALgoritma FAMB
1. Menghitung tingkat kesimetrisan fungsi aktifasi dan match
2. Menghitung fungsi aktifasi dan match masing-masing node 3.
Mengurutkan fungsi aktifasi dan match berdasarkan nilai
terbesar
ALgoritma FAMB
Update node Size Cluster - Menghitung ratio perbandingan node lama
dengan node baru - Menghitung evaporate - Pembobotan Pheromon
intensity
Menghitung fungsi aktifasi dan match masing-masing node Mengurutkan
fungsi aktifasi dan match berdasarkan nilai
terbesar yang ditambah pembobotan pheromon
Desain sistem untuk Estimasi parameter pada klasifikasi FAMB
Preprocessing
ValVal Valvv t
Langkah-langkah pada GA
pengubahan ghenotype menjadi phenotype
Kromosom pada individu mewakili parameter fungsi fuzzy ARTMAP untuk
menghasilkan nilai fitness [Whitley, 1993]
Nilai fitness dihitung pada setiap populasi kromosom dan diambil
nilai fitness tertinggi pada setiap populasi. Fitness yang
digunakan adalah akurasi FAMB.
fitness = accuracy klasifikasi
Operasi algoritma genetika
Dilakukan mutasi untuk menghindari konvergensi prematur.
Nilai individu terbaik diperoleh pada saat fitness berada posisi
optimal pada kondisi konvergen (stabil) Untuk menjaga agar individu
bernilai fitness tertinggi tersebut tidak hilang selama evolusi,
prosedur elitisme.
Crossover
Mutasi
2. Untuk setiap parameter hitung performansi FAMB dengan pembagian
data proporsional
3. Pilih nilai terbaik, jika belum ketemu 4. Lakukan pencarian
ulang pada grid
(rentang nilai) yang lebih kecil
Skenario 1
Metode Ten Fold Cross Validation Uji t-berpasangan (Pang ning Tang,
2005),
(Huang, 2006)
Tujuan Mengetahui metode manakah yang memiliki
kinerja lebih baik untuk set data tertentu pada nilai parameter
terbaik pada metode GA-FAMB vs GS-FAMB.
Skenario 2
Data UCI repository dibagi menjadi 2 : 50% data testing dan 50%
data testing.
Algoritma dilakukan pengujian sebanyak 10 kali dengan menggunakan
parameter pada algoritma genetika dan algoritma grid search yang
sama
Tujuan Untuk mengetahui tingkat kestabilan baik metode GA-
FAMB maupun GS-FAMB, dengan membandingkan rata-rata nilai akurasi
yang diperoleh
HASIL UJI COBA SKENARIO 1
Hasil pembelajaran metode GA-FAMB vs GS-FAMB menggunakan ten fold
cross validation
wine sonar WBCD Ionosphere
GS 90.4 71.9 95.0 89.8 GA 93.9 76.4 97.5 93.7
0.0
20.0
40.0
60.0
80.0
100.0
120.0
% )
Rekapitulasi hasil uji t berpasangan ten fold validation untuk data
set UCI repository
(GA-FAMB ) - (GS-FAMB ) memiliki mean selisih akurasi positif untuk
seluruh dataset pada tingkat kepercayaan 95%, kecuali WBCD pada
98%.
Secara umum metode GA-FAMB memiliki akurasi yang lebih baik dari
metode GS-FAMB pada parameter optimal. Hal ini menegaskan bahwa
metode GA-FAMB lebih baik dari metode GS-FAMB.
Grafik hasil keseluruhan pembelajaran akurasi metode GA-FAMB
GA (%maks) GA (%min) Wine 100 88.89 Sonar 90.48 63.64 WBCD 98.55
97.01 Ionosphere 100 91.18
60
65
70
75
80
85
90
95
100
1 2 3 4 5 6 7 8 9 10
Ak ur
GS (%maks) GS (%min)
1 2 3 4 5 6 7 8 9 10
Aku ras
Analisa Hasil Optimasi Parameter Menggunakan GA
Uji coba dilakukan hingga mencapai nilai fitness tertinggi dan
nilai sama untuk setiap iterasi (konvergen). Setiap uji coba
mencapai kondisi konvergen yang tidak sama Data set dengan attribut
dan jumlah fitur besar cenderung mencapai konvergen pada iterasi
lebih tinggi
Hasil pembelajaran menggunakan algoritma genetika optimasi fold
1
Nilai fitness dihitung pada setiap populasi kromosom dan diambil
nilai fitness tertinggi pada setiap populasi (Witley, 1993).
Sonar
100
1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 Fi
tn e ss
t e rb
HASIL UJI COBA SKENARIO 2 Hasil perbandingan pembelajaran metode
GA-
FAMB vs GS-FAMB untuk uji 10 x
Nilai akurasi digunakan untuk mencari nilai peak yang diambil dari
rata-rata akurasi.
Hal ini disebabkan dalam setiap uji coba 10 kali hasilnya
berbeda-beda.
Grafik hasil keseluruhan pembelajaran akurasi metode GA-FAMB dengan
uji coba 10 x
0 10 20 30 40 50 60 70 80 90
100
1 2 3 4 5 6 7 8 9 10
Ak ur
wine sonar WBCD ionosphere
GA (%maks) GA ( %min) Wine 96.67 91.11 Sonar 75.24 65.71 WBCD 97.95
96.49 Ionosphere 89.77 82.39
Grafik hasil keseluruhan pembelajaran akurasi metode GS-FAMB dengan
uji coba 10 x
0 10 20 30 40 50 60 70 80 90
100
1 2 3 4 5 6 7 8 9 10
Ak ura
Perbandingan Jumlah Iterasi pada keempat set data metode optimasi
algoritma genetika
Hasil pembelajaran menggunakan algoritma genetika untuk uji coba 10
x
98
98.5
99
99.5
100
Fi tn
es s
te rb
ai k
uji ke-1 uji ke-2 uji ke-3 uji ke-4 uji ke-5
uji ke-6 uji ke-7 uji ke-8 uji ke-9 uji ke-10
90 91 92 93 94 95 96 97 98 99
100
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47
49
Fi tn
es s
Te rb
ai k
Uji ke-1 Uji ke-2 Uji ke-3 Uji ke-4 Uji ke-5
Uji ke-6 Uji ke-7 Uji ke-8 Uji ke-9 Uji ke-10
Wine Sonar
Hasil pembelajaran menggunakan algoritma genetika untuk uji coba 10
x
97
97.5
98
98.5
99
99.5
100
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96
Fi tn
es s
Te rb
ai k
Uji ke-1 Uji ke-2 Uji ke-3 uji ke-4 Uji ke-5
Uji ke-6 Uji ke-7 Uji ke-8 Uji ke-9 Uji ke-10
91
92
93
94
95
96
97
98
99
100
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96
Fi tn
es s
Te rb
ai k
Uji ke-1 Uji ke-2 Uji ke-3 Uji ke-4 Uji ke-5
Uji ke-6 Uji ke-7 Uji ke-8 Uji ke-9 Uji ke-10
WBCD Ionosphere
Kesimpulan
Algoritma genetika mampu mendapatkan nilai parameter optimal secara
otomatis dengan hasil yang lebih tinggi untuk set data wine sebesar
93.88%, sonar sebesar 76.35% , WBCD sebesar 97.51%, ionosphere
sebesar 93.74% dibandingkan algoritma grid search untuk set data
wine sebesar 90.41%, sonar sebesar 71.86% , WBCD sebesar 95.03%,
ionosphere sebesar 89.80%.
Dari hasil uji t-test berpasangan, algoritma genetika menunjukkan
bahwa nilai akurasi, sensitifitas dan spesifisitas rata-rata
terbukti nilainya lebih besar dan rata-rata selisih akurasinya
signifikan pada tingkat kepercayaan 95% dibandingkan pada algoritma
grid search.
DAFTAR PUSTAKADAFTAR PUSTAKA
G. Carpenter, S. Grossberg, N. Markuzon, J. Reynolds, D. Rosen,
(1992) “Fuzzy ARTMAP: A Neural Network Architecture for Incremental
Supervised Learning of Analog Multidimensional Maps,” IEEE Trans.
Neural Networks, vol. 3, pp. 698-713.
DAFTAR PUSTAKADAFTAR PUSTAKA
DAFTAR PUSTAKADAFTAR PUSTAKA
Terima Kasih…
Preprocessing
Operasi algoritma genetika
HASIL UJI COBA SKENARIO 1
Rekapitulasi hasil uji t berpasangan ten fold validation untuk data
set UCI repository
Grafik hasil keseluruhan pembelajaran akurasi metode GA-FAMB
Grafik hasil keseluruhan pembelajaran akurasi metode GS-FAMB
Analisa Hasil Optimasi Parameter Menggunakan GA
Hasil pembelajaran menggunakan algoritma genetika optimasi fold
1
HASIL UJI COBA SKENARIO 2
Grafik hasil keseluruhan pembelajaran akurasi metode GA-FAMB dengan
uji coba 10 x
Grafik hasil keseluruhan pembelajaran akurasi metode GS-FAMB dengan
uji coba 10 x
Perbandingan Jumlah Iterasi pada keempat set data metode optimasi
algoritma genetika
Hasil pembelajaran menggunakan algoritma genetika untuk uji coba 10
x
Hasil pembelajaran menggunakan algoritma genetika untuk uji coba 10
x
Kesimpulan