Upload
deny-andrianto
View
223
Download
0
Embed Size (px)
Citation preview
8/20/2019 Analisis Kinerja Data Mining Algoritma C
http://slidepdf.com/reader/full/analisis-kinerja-data-mining-algoritma-c 1/6
Analisis Kinerja Data Mining Algoritma C4.5 Dalam Menentukan
Tingkat Minat Siswa yang Mendaftar di Kampus ABC
ud!i Andrian1" M. #!ifky $aya!di2
1Dosen Teknik Informatika, STMIK Potensi Utama2
Mahasiswa Sistem Informasi, STMIK Potensi Utama1,2Jl. K.L. Yos Suarso Km !," #o. $% Tan&un' Mulia(Mean1)uhi.anrian*'mail.+om, 2rhifk).wa)ahi*)ahoo.+om
Abstract
In determining the level of interest of the students who will enroll in the ABC campus can be predicted by
the application of data mining. Data mining is a method of information retrieval (knowledge) which is
contained in a very large data. Decision ree is one of the classification and prediction methods are very
powerful in the application of data mining! one of the algorithms in the formation of a decision tree is the
C".# algorithm. he advantage in this method is effective in analy$ing a large number of attributes of the
data available and easily understood by the end user. In this study! the author will analy$e the
performance of the C".# data mining algorithm in determining the level of interest of the students who
enroll in college ABC! and the obtained results of data mining algorithms can be applied in building C".#decision tree (decision tree) are both in the case of interest prediction students enrolled in the ABC
campus. %tudents with C".# classification algorithm can classify students& interest to enroll or not enroll
in college ABC. 'f the # tested data there are " students enrolled and students do not apply! where
the highest level of student interest in the attribute &year of graduation& highest gain value based on the
algorithm classification process C."#.
*eyword+ Data ,ining! Decision ree! C".# Algorithm
%. &enda!uluan
Siswa meruakan suatu su-stansi )an' erlu ierhatikan karena san'at erat kaitann)a
en'an unia eniikan, karena siswameruakan ener&emah terhaa inamika ilmu en'etahuan, an melaksanakan tu'as )aitumenalami ilmu en'etahuan terse-ut. Semakinmenin'katn)a ilmu en'etahuan, semakinmenin'kat ula ola ikir an minat seseoran'
alam men+aai suatu tu&uan.Salah satu minat seoran' siswa aalah
melan&utkan ke -an'ku erkuliahan. Dalammenentukan tin'kat minat siswa )an' akanmenaftar aa kamus %/ aat ireiksien'an eneraan data mining . Data mining
meruakan metoe en+arian informasi
0en'etahuan -aru )an' terkanun' alamata )an' san'at -esar. Decision ree
meruakan salah satu metoe klasifikasi an reiksi )an' san'at kuat an terkenal alam eneraan data mining .
an)ak al'oritma )an' aatiakai alam em-entukan ohon keutusan,salah satun)a aalah al'oritma /.".%l'oritma /." mem-uat ohon keutusanari atas ke -awah, i mana atri-ut alin'atas meruakan akar, an )an' alin'
-awah inamakan aun. Keuntun'an alammetoe ini aalah efektif alam
men'analisis se¨ah -esar atri-ut ari ata
)an' aa an muah iahami oleh en''una akhir.
Lesmana, I Putu Do) 02312 alam enelitiann)a men'un'kakan tu&uan ari
data mining aalah untuk menaatkan olainformasi )an' tersiman alam suatu -asisata )an' aat i'unakan untuk en'olahanselan&utn)a an se-a'ai -ahan enukun'keutusan 4$5.
%nriani, %nik 02312 alam
enelitiann)a men'atakan eneraan rule
ari al'oritma /." )an' i'unakan alamklasifikasi mahasiswa otensi dropout
terhaa ata -aru ieroleh hasil e6aluasian 6aliasi en'an tin'kat akurasi se-esar 738 415.
Yunus, Mahmu, et al. 0231 alam
enelitiann)a menerakan al'oritma datamining /." untuk melakukan e9lorasi ata'una menemukan hu-un'an tersem-un)iantara se¨ah 6aria-el inut en'an6aria-el tar'et alam -entuk ohon
keutusan (decision tree) 4!5. #asari, :ina 0231 alam
enelitiann)a men''unakan al'oritma /."men&elaskan -ahwa hasil u&i +o-a terhaarule ari ohon keutusan en'olahan atatraining , teraat ke+o+okan 133 8 en'an ata
testing 4"5.Dari enelitian )an' ilakukan
%nriani, %nik 02312, Yunus, Mahmu, et al0231, an #asari, :ina 0231 menun&ukkan
8/20/2019 Analisis Kinerja Data Mining Algoritma C
http://slidepdf.com/reader/full/analisis-kinerja-data-mining-algoritma-c 2/6
-ahwa al'oritma /." aat iterakan alam em-entukan ohon keutusan en'an tin'katakurasi )an' tin''i. ;al ini )an' menasari
enulis untuk men'analisa le-ih lan&ut kiner&adata mining al'oritma /.".
Tu&uan enelitian ini ilakukan
aalah untuk men'analisis kiner&a datamining al'oritma /." alam memreiksitin'kat minat siswa )an' menaftar i kamus%/, enulis in'in men'etahui aakahal'ortima /." aat mem-entuk decision
tree en'an -aik a'ar aat iketahui tin'katminat siswa )an' menaftar aa kamus%/.
'. Data Mining
Data mining aalah roses
men'analisa ata ari ersektif )an' -er-ea
an men)imulkann)a men&ai informasi(informasi entin'. Se+ara teknis, data mining
aat ise-ut se-a'ai roses untuk
menemukan korelasi atau ola ari ratusan
atau ri-uat field ari se-uah relasional
database )an' -esar 45.
Data mining iefinisikan se-a'ai roses menemukan ola alam ata. Proses iniharus otomatis atau -iasan)a se+ara semi(
otomatis. Pola )an' ihasilkan harus -erarti -ahwa ola terse-ut mem-erikan -e-eraakeuntun'an. Pola terse-ut iientifikasi,i6aliasi, an i'unakan untuk mem-uat
se-uah reiksi 415. <am-ar 1 menun&ukkan -entuk tahaan alam data mining 4!5.
<am-ar 1. Tahaan alam Data ,ining
(. Decision Tree
Decision ree 0Pohon Keutusan
meruakan metoe klasifikasi 0taksonomi )an'men''unakan reresentasi struktur ohon (tree)
i mana setia node mereresentasikan atri-ut,
+a-an'n)a mereresentasikan nilai ari atri-ut,an aun mereresentasikan kelas. -ode )an' alin' atas ari decision tree ise-ut se-a'airoot. Paa decision tree teraat $ &enis node!
)aitu 415=
a. oot -ode! meruakan node alin'
atas, aa node ini tiak aa inut an -isa tiak memun)ai outut ataumemun)ai outut le-ih ari satu.
-. Internal -ode! meruakan node
er+a-an'an, aa node ini han)a
teraat satu inut an memun)aioutut minimal ua.
+. /eaf -ode atau erminal -ode!
meruakan node akhir, aa node inihan)a teraat satu inut an tiak memun)ai outut.
an)ak al'oritma )an' aat iakaialam em-entukan ohon keutusan, salahsatun)a aa al'oritma /.". Data alam ohon
keutusan -iasan)a in)atakan alam -entuk ta-el en'an atri-ut an record. %tri-utmen)atakan suatu arameter )an' i-uatse-a'ai kriteria alam em-entukan ohon.
Decision tree ter'antun' aa aturanif0then! tetai tiak mem-utuhkan arameter
an metrik. Strukturn)a )an' seerhana anaat itafsirkan memun'kinkan decision tree
untuk meme+ahkan masalah atri-ut multi0type.
Decision tree &u'a aat men'elola nilai(nilai)an' hilan' atau ata noise. <am-ar 2menun&ukkan +ontoh struktur decision tree 425.
<am-ar 2. /ontoh Struktur Decision ree
4. Algoritma C4.5
%l'oritma /." an ohon keutusanmeruakan ua moel )an' tak terisahkan,karena untuk mem-an'un se-uah ohon
keutusan i-utuhkan al'oritma /.".%l'oritma /." meruakan en'em-an'anari al'oritma ID$. %l'oritma /." an ID$i+itakan oleh seoran' eneliti i -ian'ke+erasan -uatan -ernama J. >ose ?uinlan
aa akhir tahun 17@3(an. %l'oritma /."
mem-uat ohon keutusan ari atas ke -awah, i mana atri-ut alin' atas meruakanakar (root), an )an' alin' -awahinamakan aun (leaf).
8/20/2019 Analisis Kinerja Data Mining Algoritma C
http://slidepdf.com/reader/full/analisis-kinerja-data-mining-algoritma-c 3/6
Se+ara umum alur roses al'oritma/." untuk mem-an'un ohon keutusanalam data mining aalah 4"5=
a. Pilih atri-ut se-a'ai simul akar. -. uat +a-an' untuk tia(tia nilai.
+. a'i kasus alam +a-an'.
. Ulan'i roses untuk setia +a-an'samai semua kasus aa +a-an'memiliki kelas )an' sama.
Pemilihan atri-ut se-a'ai simul, -aik akar (root) atau simul internaliasarkan aa nilai 1ain tertin''i ariatri-ut(atri-ut )an' aa. Perhitun'an nilai1ain i'unakan rumus seerti alam
Persamaan 1.
¿ Si∨ ¿
¿ S∨¿∗ Entropy (Si)
¿
Gain (S , A )= Entropy (S )−∑i=1
n
¿
i mana=% = ;imunan kasus
A = %tri-utn = Jumlah artisi atri-ut AA% iA = Jumlah kasus aa artisi ke(i
A% A = Jumlah kasus alam %
Untuk men'hitun' nilai 2ntropy aatilihat aa Persamaan 2.
Entropy ( S )=∑i=1
n
− pi∗log2 pi
i mana=% = ;imunan kasusn = Jumlah artisi %
pi = Proorsi ari % i terhaa %
5. Metode &enelitian
Tu&uan enelitian ini )aitu untuk men'analisis kiner&a data mining al'oritma
/." alam memreiksi tin'kat minat siswa)an' menaftar i kamus %/. Untuk men+aai tu&uan terse-ut, enulis akanmelakukan tahaan(tahaan se-a'ai -erikut=
a. Men'umulkan ata.
Data enelitian )an' i'unakan aalah ataientitas siswa )an' menaftar aa kamus%/ i mana ata )an' i'unakan aalahse-an)ak "3 ata se-a'ai ata u&i. Data )an'iaat aalah ata )an' masih utuh i manateraat -an)ak field atau atri-ut seerti
Bnama, alamat rumah, asal sekolah, &enis
kelamin, a'ama, no. telehone, tahunmasuk, ro'ram stui, waktu kuliah, u&ian,an lain se-a'ain)aC.
-. Melakukan roses cleaning ata.
Proses cleaning ata meruakan roses em-ersihan aa ata seerti memeriksakonisi ata, men'hilan'kan reuansi ata,memer-aiki kesalahan aa ata, an
men'hilan'kan -e-eraa ata )an' tiak len'ka atauun ata )an' tiak ierlukan.%aun ata )an' telah ilakukan rosescleaning )aitu men)isakan -e-eraa atri-ut entin' seerti Balamat rumah, asal sekolah, &enis kelamin, an tahun masukC.
+. Melakukan roses transformation ata.
Proses transformation ata meruakan en'elomokkan atau en)eerhanaan ata.aria-el enelitian meliuti 6aria-el inutan 6aria-el outut atau tar'et. aria-el
inut in)atakan oleh -e-eraa atri-ut )an'
itransformasi seerti alamat rumahitransformasi men&ai B&auh, sean', anekatC. Sean'kan asal sekolahitransformasi men&ai BSM% #e'eri, SM%Swasta, SMK #e'eri, SMK Swasta, M%
#e'eri, an M% SwastaC. aria-el BalamatrumahC an 6aria-el Basal sekolahC ilakukantransformasi ata karena &an'kauan nilain)a)an' le-ar, sehin''a aat men'aki-atkan roses en'enalan ola an an em-entukan ohon keutusan men&ai
lama. aria-el outut atau tar'etn)a aalahatri-ut BstatusC )an' -erisikan nilai BaftarC
atau Btiak aftarC.
. Melakukan roses erhitun'an al'oritma
/.".
Setelah ata ikumulkan, ilakukan roses
cleaning , an ilakukan transformation
ata, selan&utn)a ata akan irosesmen''unakan erhitun'an al'oritma /."untuk men'hasilkan ohon keutusan(decision tree).
e. Pem-entukan ohon keutusan (decision
tree).Pohon keutusan (decision tree) ter-entuk setelah ilakukan roses erhitun'anal'oritma /." en'an memilih atri-ut )an'i&aikan se-a'ai akar (root) iasarkan aa nilai 1ain tertin''i ari -e-eraaatri-ut )an' i'unakan.
). *asil dan Analisa
Paa taha en'u&ian, ata )an' suahitransformasikan ke alam -entuk kelomok ata atri-ut )an' le-ih seerhana. Data )an'
i'unakan aalah ata siswa )an' menaftar an tiak menaftar aa kamus %/ )an'
01
02
8/20/2019 Analisis Kinerja Data Mining Algoritma C
http://slidepdf.com/reader/full/analisis-kinerja-data-mining-algoritma-c 4/6
iam-il se+ara a+akEranom se-an)ak "3 atasamel. Data akan iolah en'an menerakandata mining al'oritma /." aa rosesmemreiksi minat siswa untuk menaftar kekamus %/. e-eraa atri-ut atau komonen
6aria-el )an' i'unakan )aitu terlihat aa
Ta-el 1 +,ampiran-.Kemuian hitun' 2ntropy en'an
rumus se-a'ai -erikut=
Entr opy ( S )=∑i=1
n
− pi∗log2 pi
Jai,
Entropy ( S )=(−( 4050 )∗log2( 4050 ))+(−( 1050 )Ta-el 2. ;asil Perhitun'an aa Dataset
Total
Kasus
Sum+Daftar
-
Sum+Tidak
Daftar- Entropy
"3 3 13 3.@2172F37
"
Setelah menaatkan 2ntropy ari
keseluruhan kasus seerti terlihat aa Ta-el 2,lakukan analisis aa setia atri-ut an nilai(nilain)a. Kemuian hitun' 2ntropy(n)a anhitun' 1ain aa setia atri-ut.
Untuk men'hitun' 1ain setia atri-utmen''unakan rumus=
¿ Si∨ ¿
¿ S∨¿∗ Entropy (Si)¿
Gain (S , A )= Entropy (S )−∑i=1
n
¿
Dan akan iaatkan hasil seerti terlihat aaTa-el $ +,ampiran-.
Paa Ta-el $ terlihat nilai 1ain
ter-esar aalah 1ain Btahun tamatC. Makaatri-ut Btahun tamatC men&ai root node ataunode akar. Kemuian aa atri-ut Btahun tamatC2313 an 2311 masin'(masin' memiliki an "kasus i mana semuan)a memiliki &awa-anBaftarC. Den'an emikian Btahun tamatC 2313
an 2311 men&ai aun atau leaf. Maka akanter-entuk ohon keutusan node 1 seertiterlihat aa <am-ar $.
<am-ar $. Pohon Keutusan node 1 (root node)
erasarkan <am-ar $ aat ilihatsiswa )an' menaftar aa aa tahun tamat2313 an 2311. erasarkan em-entukan ohon keutusan node 1 (root node)! node0node
atri-ut lainn)a akan ianalisis le-ih lan&ut.
Den'an memulai men'analisis aa atri-ut
Btahun tamatC 2312, 231$, an 231 en'anmelakukan roses )an' sama seertise-elumn)a en'an men+ari nilai 2ntropy an1ain0n)a.
Setelah ilakukan erhitun'an an
en'u&ian ata aa masin'(masin' atri-uten'an al'oritma /.", maka iaatkan ola ohon keutusan akhir seerti itun&ukkan aa<am-ar +,ampiran-.
Paa <am-ar aat ilihat -ahwatin'kat ominan minat siswa untuk menaftar
aalah -erasarkan Btahun tamatC, )aitu BtahuntamatC 2313 an 2311. Sean'kan tin'kat minat
siswa untuk menaftar aa node terakhir aalah -erasarkan Balamat rumahC se-a'ai ertim-an'an akhir. %a-ila &arak BalamatrumahC ekat an sean' ari kamus se-a'ian
-esar menaftar, )aitu masin'(masin' se-an)ak 1 oran'. Sean'kan aa-ila &arak alamat &auhari kamus )an' menaftar se-an)ak 12 oran'siswa.
<am-ar " menun&ukkan eskrisilen'ka ari ohon keutusan (decision tree)
)an' ter-entuk ari "3 ata siswa untuk menentukan minat siswa )an' menaftar aakamus %/.
<am-ar ". Deskrisi Decision ree
<am-ar " menun&ukkan hasil eskrisise+ara len'ka ari ohon keutusan (decision
tree) )an' telah ter-entuk en'an men''unakanal'oritma /.". Dari hasil ekrisi aa<am-ar " &u'a menun&ukkan -ahwa
8/20/2019 Analisis Kinerja Data Mining Algoritma C
http://slidepdf.com/reader/full/analisis-kinerja-data-mining-algoritma-c 5/6
en''unaan data mining al'oritma /." -aik i'unakan alam roses men''ali ata (data
mining process) untuk menarik -e-eraakesimulan )an' i6isualisasikan en'an ohonkeutusan (decision tree).
. Kesimpulan
Dari hasil enelitian aat iam-il -e-eraa kesimulan antara lain=a. Data mining al'oritma /." aat
iterakan alam mem-an'un ohonkeutusan (decision tree) )an' -aik aa
kasus reiksi minat siswa )an' menaftar aa kamus %/.
-. Klasifikasi siswa en'an al'oritma /."aat men'klasifikasikan minat siswa untuk menaftar atau tiak menaftar aa kamus%/.
+. Den'an aan)a eneraan data mining al'oritma /." iharakan mamumem-erikan solusi alam memreiksitin'kat minat siswa )an' menaftar aakamus %/.
. Dari "3 ata )an' iu&i teraat 3 siswa
)an' menaftar an 13 siswa tiak menaftar, i mana tin'kat minat siswamenaftar tertin''i aa atri-ut BtahuntamatC -erasarkan nilai 1ain tertin''i aa roses klasifikasi en'an al'oritma /.".
Daftar &ustaka/
415 Andriani, Anik (2012). “Penerapan
Algoritma C4.5 pada ProgramKlasifkasi Maasis!a Droupout ".Prosiding #eminar $asionalMatematika.
425 %&a, #. and 'ian %& (2011). “DataMining and Machine Learning inCybersecurity” . #A *a+lor -ranis /ro&p. #$13 61433430. #A.
,ampiran/
4$5
7esmana, P&t& %od+ (2012).“Per8andingan Kiner9a DecisionTree :4 dan %3 dalamPengklasifkasian %iagnosisPen+akit %ia8etes Mellit&s". :&rnal
*eknologi dan n;ormatika. <ol. 2,$o. 2.
45
Ma8r&r, Angga /inan9ar dan =iani7&8is (2012). “Penerapan DataMining &nt&k Memprediksi Kriteria$asa8a Kredit". :&rnal Komp&terdan n;ormatika. >disi 1, <ol. 1.
4"5
#asari, :ina 0231. G%nalisa :aktor Pen)e-a- Tin''in)a Pemakaian Listrik >umah Tan''a Men''unakan %l'oritma/."H. UPI YPTK. Paan'.
4!
5
Yunus, Mahmu, et al 0231. GSPK
Pemilihan /alon Penonor Darah Potensialen'an %l'oritma /." an :u) TahaniH.Jurnal //IS ol. F, #o. 1.
Ta-el 1. /earning Dataset
8/20/2019 Analisis Kinerja Data Mining Algoritma C
http://slidepdf.com/reader/full/analisis-kinerja-data-mining-algoritma-c 6/6
Pohon keutusan (decision tree) akhir=
Ta-el $. %nalisis %tri-ut, #ilai, an)ak Ke&aian #ilai, 2ntropy! an 1ain
<am-ar . Decision ree 0Pohon Keutusan %khir