Upload
others
View
10
Download
0
Embed Size (px)
Citation preview
Cluster Obat Berdasarkan Keterangan Indikasi Obat
Menggunakan Algoritma K-Means
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Informatika
Oleh:
Anditio Kurnia Wijaya
155314036
PROGRAM STUDI INFORMATIKA
JURUSAN INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2020
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
i
Cluster Obat Berdasarkan Keterangan Indikasi Obat
Menggunakan Algoritma K-Means
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Informatika
Oleh:
Anditio Kurnia Wijaya
155314036
PROGRAM STUDI INFORMATIKA
JURUSAN INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2020
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ii
Drug Cluster Based on Drug Indication Remarks
Using the K-Means Algorithm
A THESIS
Submitted In Partial Fulfillment Of The Requirements
For The Degree Of Sarjana Komputer
In Information Study Program
By:
Anditio Kurnia Wijaya
155314036
INFORMATION STUDY PROGRAM
DEPARTMENT OF INFORMATICS
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2020
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iii
HALAMAN PENGESAHAN
SKRIPSI
Cluster Obat Berdasarkan Keterangan Indikasi Obat
Menggunakan Algoritma K-Means
Dipersiapkan dan ditulis oleh:
ANDITIO KURNIA WIJAYA
155314036
Telah dipertahankan di depan panitia penguji
Pada Tanggal ………………….
dan dinyatakan memenuhi syarat
Susunan Panitia Penguji
Jabatan Nama Lengkap Tanda Tangan
Ketua : Drs. Haris Sriwindono M.Kom, Ph.D. ………………
Sekertaris : Eduardus Hardika Sandy Atmaja, S.Kom., M.Cs. ………………
Anggota : Robertus Adi Nugroho,S.T.,M.Eng. ………………
Yogyakarta, ……………….. 2020
Fakultas Sains dan Teknologi
Universitas Sanata Dharma
Dekan,
Sudi Mungkasi, S.Si., M.Math.Sc., Ph.D.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iv
HALAMAN PERSETUJUAN
SKRIPSI
Cluster Obat Berdasarkan Keterangan Indikasi Obat
Menggunakan Algoritma K-Means
Disusun oleh:
ANDITIO KURNIA WIJAYA
155314036
Telah disetujui oleh:
Dosen Pembimbing
Robetus Adi Nugroho,S.T.,M.Eng. Tanggal:……………………..
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
MOTTO
”Karena masa depan sungguh ada,
dan harapanmu tidak akan hilang.”
(Amsal 23:18)
“Jika Tuhan menuntun saya memulai sesuatu,
Tuhan Yang sama akan menuntun mengakhiri sesuatu yang telah dimulai.”
-Anditio-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vi
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis
ini tidak memuat karya atau bagian karya orang lain, kecuali yang
telah disebutkan dalam kutipan dan daftar pustaka, sebagaimana
layaknya karya ilmiah.
Yogyakarta,
Penulis
Anditio Kurnia Wijaya
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vii
LEMBAR PERSETUJUAN PUBLIKASI KARYA ILMIAH
UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan dibawah ini, saya mahasiswa Universitaas Sanata
Dharma :
Nama : Anditio Kurnia Wijaya
NIM : 155314036
Demi mengembangkan ilmu pengetahuan, saya memberikan kepada
Perpustakaan Universitas Sanata Dharma Karya Ilmiah saya yang berjudul :
Cluster Obat Berdasarkan Keterangan Indikasi Obat
Menggunakan Algoritma K-Means
Beserta perangkat yang diperlukan (bila ada). Dengan demikian, saya
memberikan kepada Universitas Sanata Dharma hak untuk memyimpan,
mengalihkan ke dalam bentuk media lain, mengelolanya dalam bentuk media
lain, mengelolanya dalam bentuk pangkalan data, mendstribusikan secara
terbatas dan mempublikasikan secara terbatas dan mempublikasikan di Internet
atau media lain untuk kepentingan akademis tanpa perlu izin dari saya maupu
memberi royalti kepada saya selama mencantumkan nama saya sebagai penulis
Demikian perrnyataan ini saya buat dengan sebenarnya.
Yang menyatakan,
Anditio Kurnia Wijaya
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
viii
ABSTRAK
Berdasarkan data obat-obatan yang beredar di Indonesia diambil dari buku ISO
volume 48 menujukan banyak sekali variasi kategori kegunaannya. Untuk itu
diperlukan pengelompokan obat berdasarkan kategori obat-obatan dari keterangan
indikasi masing-masing obat. Pembagian pengkategori obat berdasarkan kegunaan
obat-obatan. Oleh karena itu, dibutuhkan metode untuk memudahkan pengelompokan
obat-obatan menggunakan algoritma K-Means.
Dengan pendekatan pengklasteran K-Means, pembagian kelompok obat
berdasarkan indikasinya. Pada penelitian ini dilakukan pengklasteran obat-obatan
menggunakan algoritma K-Means.Menggunakan K-means bertujuan untuk
memudahkan pegelompokan kategori obat-obatan berdasarkan keterangan indikasi
obat. Hasilnya adalah sebuah gambaran yang menunjukan pengelompokan obat
bedasarkan keterangan indikasi obat.
Dari penelitian yang dilakukan diperoleh bahwa hasil penentuan centroid (titik
pusat) pada tahap awal algoritma K-Means sangat berpengaruh terhadap hasil Cluster
seperti pada hasil pengujian data di atas dengan centroid yang berbeda menghasilkan
hasil yang berbeda juga.
Kata kunci : Pengelompokan, Data Mining, Cluster, Algoritma K-Means
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ix
ABSTRACT
Based on data on medicines that are based in Indonesia, taken from the ISO
volume 48 book, it shows that there are many variations in their use categories. For this
reason, it is necessary to classify drugs based on drug categories from the indicative
information of each drug. The division of drugs is based on the use of drugs. Therefore,
a method is needed to facilitate the grouping of drugs using the K-Means algorithm.
With the K-Means Cluster approach, the division of drug groups is based on
their indications. In this research, Cluster of drugs uses the K-Means algorithm. Using
K-means aims to simplify the grouping of categories of drugs based on drug indication
information. The result is a picture that shows the grouping of drugs based on drug
indication information.
From the research conducted it was found that the results of the determination
of the centroid (center point) in the early stages of the K-Means algorithm are very
influential on the results of the Cluster as in the results of testing the data above with
different centroids producing different results as well.
Keywords: Grouping, Data Mining, Clusters, K-Means Algorithm
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
x
KATA PENGANTAR
Puji Syukur kepada Tuhan yang Maha Esa atas segala berkat dan karunia-Nya,
sehingga penulis dapat menyelesaikan tugas akhir yang berjudul “Cluster Obat
Berdasarkan Keterangan Indikasi Obat Menggunakan Algoritma K-Means”. Tugas
akhir ini merupakan salah satu mata kuliah wajib dan sebagai yyarat akademik untuk
memperoleh gelar sarjana komputer Program Studi Informatika Universitas Sanata
Dharma Yogyakarta.
Penulis menyadari bahwa selama proses penelitian dan penyusunan laporan tugas akhir
ini, banyak pihak yang telah membantu penulis, sehingga pada kesempatan ini penulis
ingin mengucapkan banyak terimakasih kepada :
1. Tuhan Yang Maha Esa, yang telah memberikan pertolongan dan kekuatan
dalam proses pembuatan tugas akhir.
2. Robertus Adi Nugroho, S.T., M.Eng. selaku dosen pembimbing tugas akhir,
atas kesabarannya dan nasehat dalam membimbing penulis, meluangkan
waktunya, memberi dukungan , motivasi serta saran yang sangat membantu
penulis.
3. Sudi Mungkasi, S.Si., M.Math.Sc., Ph.D. selaku Dekan Fakultas Sains dan
Teknologi, atas bimbingan, kritik, dan saran yang telah diberikan kepada
penulis.
4. Robertus Adi Nugroho, S.T., M.Eng. selaku Ketua Program Studi Informatika
dan selaku dosen pembimbing akademik atas bimbingan, kritik, dan saran yang
telah diberikan kepada penulis.
5. Keluarga tercinta , kedua orang tua Theo Sulistyo dan Sri Mulyani, serta adik
adik Melly Listiani dan Stefanie Christine.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xi
6. PMK Apostolos, PMK Oikumene, PMK Efata, PMK Ebenhaezer yang selalu
mendukung, memberi semangat, dan doa.
7. Teman Young Men Bang Erwin,Pak Yohanes, Ndan Hans, Yoga ,Joshua Brian,
Lukas, Nico, Jojo, Yosabel, Hapsa yang selalu memberi semangat untuk segera
menyelesaikan TA.
8. Teman-teman Taekwondo USD Sb. Kartono, Sb. Angga, Sb. Opang,Sb. Alan,
Sb Andre, Fink, Erin, Rara, Bubus dan teman-teman lain yang selalu
memberikan dukungan semangat dan motifasi.
9. Teman-teman Informatika angkatan 2015 Bima, Tebe, Willy, dan semua teman
yang tidak dapat disebutkan satupersatu yang selalu memberi bantuan,
semangat dan motivsi sehingga penulis dapat menyelesaikan tugas akhir ini.
10. Anggia, Intan, Bowo, Laurent yang selalu memberi dukungan dan semangat
serta selalu mendengarkan keluh kesah saat penulis menghadapi kendala proses
penulisan TA.
Penulis menyadari bahwa masih banyak kekurangan dalam penyusunan
tugas akhir ini . Saran dan kritik sangat diharapkan untuk perbaikan yang akan
datang.
Penulis,
Anditio Kurnia Wijaya
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xii
DAFTAR ISI
HALAMAN PENGESAHAN ................................................................................. iii
HALAMAN PERSETUJUAN ................................................................................ iv
MOTTO .................................................................................................................... v
PERNYATAAN KEASLIAN KARYA .................................................................. vi
LEMBAR PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK
KEPENTINGAN AKADEMIS .............................................................................. vii
ABSTRAK ............................................................................................................ viii
ABSTRACT ............................................................................................................ ix
KATA PENGANTAR .............................................................................................. x
DAFTAR ISI .......................................................................................................... xii
Daftar Tabel ............................................................................................................ xv
Daftar Gambar ....................................................................................................... xvi
BAB I PENDAHULUAN ........................................................................................ 1
1.1. Latar Belakang ................................................................................................... 1
1.2. Rumusan masalah............................................................................................... 2
1.3. Tujuan Penelitian ............................................................................................... 2
1.4. Batasan Masalah................................................................................................. 2
1.5. Manfaat Penelitian ............................................................................................. 2
1.6. Sistematika Penulisan ........................................................................................ 3
BAB II LANDASAN TEORI .................................................................................. 5
2.1. Data Mining ....................................................................................................... 5
2.1.1 Pengertian Data Mining .............................................................................. 5
2.1.2 Pengelompokan Data Mining ..................................................................... 5
2.1.3 Tahapan Data Mining ................................................................................. 8
2.3. Information Retrieval ................................................................................... 11
2.3.1 Pengertian Information Retrieval.............................................................. 11
2.3.2 Peranan Information Retrieval .................................................................. 11
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiii
2.4. Silhouette Coefficient ................................................................................... 12
2.4.1 Pengertian Silhouette Coefficient .............................................................. 12
BAB III METODE PENELITIAN ....................................................................... 14
3.1 Tahap Penelitian ........................................................................................... 14
3.2 Gambaran Proses K-Mean Cluster ............................................................... 15
3.2.1 Data .............................................................................................................. 15
3.2.2 Case Folding ................................................................................................. 17
3.2.3 Tokenisasi ..................................................................................................... 17
3.2.4 Pembersihan Stopword ................................................................................. 17
3.2.5 Tranformasi data ........................................................................................... 19
BAB IV IMPLEMENTASI SISTEM DAN ANALISIS HASIL ........................... 28
4.1 IMPLEMENTASI .............................................................................................. 28
4.2 Tabel Hasil Cluster percobaan 1 ........................................................................ 30
4.2.1 Uji Silhouette ................................................................................................. 32
4.3 Tabel Hasil Cluster percobaan 2 ........................................................................ 32
4.3.1. Uji Silhouette ................................................................................................ 35
4.4 Tabel Hasil Cluster percobaan 3 ........................................................................ 35
4.4.1 Uji Silhouette ................................................................................................. 36
4.5 Tabel Hasil Cluster percobaan 4 ........................................................................ 37
4.5.1 Uji Silhouette ................................................................................................. 38
4.6 Tabel Hasil Cluster percobaan 5 ........................................................................ 39
4.6.1 Uji Silhouette ................................................................................................. 40
4.7 Tabel Hasil Cluster percobaan 6 ........................................................................ 40
4.7.1 Uji Silhouette ................................................................................................. 42
4.8 Tabel Hasil Cluster percobaan 7(Tanpa IDF) .............................................. 43
4.8.1 Uji Silhouette ................................................................................................. 44
4.9 Tabel Hasil Cluster percobaan 8(Tanpa IDF) .............................................. 44
4.9.1 Uji Uji Silhouette ........................................................................................... 46
4.10 Tabel Hasil Cluster percobaan 9(Tanpa IDF).................................................. 46
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiv
4.10.1 Uji Silhouette ............................................................................................... 48
4.11 Tabel Hasil Cluster percobaan 10 (Tanpa IDF)............................................... 48
4.11.1 Uji Silhouette ............................................................................................... 50
4.12 Tabel Hasil Cluster percobaan 11(Tanpa IDF) ................................................ 50
4.12.1 Uji Silhouette ............................................................................................... 51
4.13 Tabel Hasil Cluster percobaan 12 (Tanpa IDF)............................................... 51
4.5.1 Uji Silhouette ................................................................................................. 53
BAB V PENUTUP ................................................................................................. 54
DAFTAR PUSTAKA ............................................................................................. 55
LAMPIRAN ........................................................................................................... 56
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xv
Daftar Tabel
Tabel 3. 1 Data Set Obat ............................................................................................. 16
Tabel 3. 2 Hasil Pembersihan Stopword ..................................................................... 18
Tabel 3. 3 Tabel Data Obat ......................................................................................... 19
Tabel 3. 4 Contoh Tabel Term Frekuensi (TF) ........................................................... 20
Tabel 3. 5 Dokumen Frekuensi(df) ............................................................................. 21
Tabel 3. 6 Tabel Inverse Document Frekuency (idf) .................................................. 22
Tabel 3. 7 Tabel TF-IDF ............................................................................................. 23
Tabel 3. 8 Tabel TF-IDF ............................................................................................. 24
Tabel 3. 9 Hasil Perhitungan Clustering Kmeans ....................................................... 25
Tabel 3. 10 Hasil Pengelopokan Jarak antara Cluster 1 dan Cluster2 ........................ 25
Tabel 3. 11 Hasil Perhitungan SI ................................................................................ 27
Tabel 4. 1 Tabel Hasil Cluster percobaan 1 ................................................................ 31
Tabel 4. 2 Tabel Hasil Cluster percobaan 2 ................................................................ 32
Tabel 4. 3 Tabel Hasil Cluster percobaan 3 ................................................................ 35
Tabel 4. 4 Hasil Cluster Percobaan 4 .......................................................................... 37
Tabel 4. 5 Hasil Cluster Percobaan 5 .......................................................................... 39
Tabel 4. 6 Hasil Cluster Percobaan 6 .......................................................................... 41
Tabel 4. 7 Hasil Cluster Percobaan 7 .......................................................................... 43
Tabel 4. 8 Hasil Cluster Percobaan 8 .......................................................................... 44
Tabel 4. 9 Hasil Cluster Percobaan 9 .......................................................................... 46
Tabel 4. 10 Hasil Cluster Percobaan 10 ...................................................................... 48
Tabel 4. 11 Hasil Cluster Percobaan 11 ...................................................................... 50
Tabel 4. 12 Hasil Cluster Percobaan 12 ...................................................................... 52
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xvi
Daftar Gambar
Gambar 3. 1 Proses K-Mean Cluster .......................................................................... 15
Gambar 4. 1 Gui Sistem Keseliruhan .......................................................................... 28
Gambar 4. 3 INPUT DATA OBAT ............................................................................ 29
Gambar 4. 5 Hasil Proses K-Mean Cluster ................................................................. 29
Gambar 4. 7 Tampilan Tabel Gui Tabel Term(kata)................................................... 30
Gambar 4. 8 Grafik hasil uji kekuatan Cluster percobaan 1-6 ................................... 42
Gambar 4. 9 Grafik Hasil Uji Kekuatan Cluster Percobaan 7-12 .............................. 53
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1
BAB I
PENDAHULUAN
1.1.Latar Belakang
Menurut Undang-Undang Kesehatan No. 36 tahun 2009, obat adalah bahan
atau paduan bahan, termasuk produk biologi yang digunakan untuk mempengaruhi
atau menyelidiki sistem fisiologi atau keadaan patologi dalam rangka penetapan
diagnosis, pencegahan, penyembuhan, pemulihan, peningkatan kesehatan dan
kontrasepsi, untuk manusia. Selain itu menurut Katzung (1997), obat dalam
pengertian umum adalah suatu substansi yang melaui efek kimianya membawa
perubahan dalam fungsi biologik. Masa kini obat sangat banyak jenisnya
jumlahnya mencapai ribuan bahkan jutaan jenis obat.
Selama bertahun-tahun, perusahaan-perusahaan farmasi secara berkelanjutan
terus melakukan inovasi menawarkan obat-obat baru, membantu mengobati
berbagai penyakit dan mengurangi penderitaan pasien. Namun demikian, berbagai
macam penyakit baru juga terus bermunculan, sehingga seluruh anggota IPMG
(International Pharmaceutical Manufacturers Gruop) adalah organisasi nirlaba
beranggotakan 25 perusahaan farmasi multinasional berbasis riset yang beroperasi
di Indonesia, yang berkomitmen pada penelitian, pengembangan, pembuatan serta
pemasaran obat-obatan berkualitas tinggi. IPMG berkomitmen untuk menemukan
obat-obat baru untuk menyembuhkan penyakit-penyakit tersebut. Karena sangat
banyak obat yang telah beredar dipasaran dan dijual secara umum dikalangan
masyarakat masyarakat dibingugkan oleh banyaknya nama obat. Oleh karena itu
diperlukan sistem dapat membantu pekerjaan manusia dalam mengelompokan
kategori obat yang sesuai dengan indikasi dari obat itu. Indikasi adalah keterangan
kegunaan obat yang tertulis dalam etiket obat. Pengkategorian yang dimaksud
meliputi: Analgesik (Obat nyeri), anastetik, antibiotik, obat kulit, vitamin, hormon
dll. Pengelompokan tersebut dapat menggunakan algoritma K – Means. Saya
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2
memilih algoritma K-Means karena algoritma ini banyak digunakan untuk
mengelompokkan data.
Dengan data yang sudah dikelompokkan menggunakan algoritma K-Means
diharapkan dapat mempermudah masyarakat dalam mengetahui pengkategorian
obat berdasarkan indikasi obat.
1.2.Rumusan masalah
Berdasarkan latar belakang yang ada dapat dirumuskan masalah yaitu:
1. Bagaimana membangun sistem K-Means yang dapat mengelompokan nama
obat bedasarkan keterangan indikasinya?
2. Seberapa kekuatan hasil Cluster K-Means dapat mengelompokan nama
obat berdasarkan indikasinya, diuji kekuatannya dengan Silhouette
Coefficient?
1.3. Tujuan Penelitian
Adapun Tujuan dai penelitian ini sebagai berikut :
1. Melakukan pengkategorian obat berdasarkan keterangan indikasinya
2. Clustering indikasi obat berdasarkan indikasinya menggunakan algoritma
K-Means.
1.4.Batasan Masalah
Dalam batasan masalah ini, penulis membatasi masalah yang perlu yaitu :
1. Jumlah data set yang diambil dari ISO (vol 48) sebanyak 70 nama obat.
2. Pengkategorian yang diteliti berdasarkan keterangan indikasi ISO volume
48 meliputi: saluran nafas, saluran cerna, anti hipertensi, analgesik non
narkotik, topikal untuk kulit, antimalaria, antiseptik dan disinfektan.
3. Cluster tidak menggunakan lematisation
1.5.Manfaat Penelitian
Adapun manfaat dari penelitian ini sebagai berikut :
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3
1. Bagi dunia kesehatan : Karena banyak sekali jenis dan nama obat-obatan,
maka sistem ini dapat membantu untuk mempermudah mengkategorikan
berdasarkan keterangan indikasinya
2. Bagi dunia penelitian : Ini merupakan teknologi masa kini yang dapat
memberikan inspirasi untuk dapat mengembangkan system pengkategorian.
3. Bagi masyarakat : membantu masyarakat dalam menggolongkan obatan
yang sangat banyak
4. Bagi dunia pendidikan: dapat mengetahui dapat membuat program untuk
mengelompokan data obat.
1.6.Sistematika Penulisan
Bab I. Pendahuluan
Dalam bab ini tentang latar belakang masalah, Persamaanan masalah, tujuan
penelitian, batasan masalah, dan sistematika penulisan.
Bab II. Landasan Teori
Dalam bab ini berisi tentang teori yang dapat menunjang penelitian yaitu berupa
pengertian data mining, pengertian information retrieval, proses datamining, dan
algoritma K-Means.
Bab III. Metode Penelitian
Dalam bab ini berisi tentang cara penerapan konsep dasaryang telah diuraikan pada
BabII untuk menganalisis dan merancang sistem sesui tahap – tahap penyelesaian
masalah tersebut dengan menggunakan algoritma K-Means.
Bab IV. Implementasi dan Analisa Sistem
Dalam bab ini berisi tentang implementasi ke program komputer berdasarkan hasil
perancangan yang dibuat, analisis perangkat lunak yang telah dibuat.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4
Bab V. Penutup
Dalam bab ini bab ini berisi tentang kesimpulan dan saran dari seluruh penulisan
tugas akhir.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5
BAB II
LANDASAN TEORI
Pada Bab II ini akan dipaparkan mengenai landasan teori yang medukung
penelitian yang dilakukan oleh penulis. Dalam Bab ini akan dijelaskan pengertian dan
metode yang akan digunakan oleh penulis.
2.1. Data Mining
2.1.1 Pengertian Data Mining
Data Mining adalah proses yang menggunakan teknik statistik,
matematika, kecerdasan buatan, machine learning untuk mengekstraksi
dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang
terkait dari berbagai database besar (Turban dkk. 2005). Data Mining
sering digunakan untuk mencari informasi dari database yang sangat
besar. Data Mining ialah suatu proses menemukan sesuatu yang
bermakna dari suatu korelasi baru, pola dan tren yang ada dengan cara
memilah-milah data berukuran besar yang disimpan dalam repositori,
menggunakan teknologi pengenalan pola serta teknik matematika dan
statistik. Data Mining juga dapat diartikan sebagai suatu proses
ekstraksi informasi berguna dan potensial dari sekumpulan data yang
terdapat secara implisit dalam suatu basis data.
2.1.2 Pengelompokan Data Mining
Data mining merupakan metode yang memiliki beberapa kelompok,
(Larose 2005). Adapun beberapa penglompokan data mining sebagai
berikut:
3.2.1 Deskripsi
Terkadang peneliti dan analis secara sederhana ingin
mencoba mencari cara untuk menggambarkan pola dan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6
kecenderungan yang terdapat dalam data. Sebagai contoh, petugas
pengumpulan suara mungkin tidak dapat mengumpulkan keterangan
atau fakta bahwa siapa yang tidak cukup profesional akan sedikit
didukung dalam pemilihan presiden. deskripsi dari pola dan
kecenderungan sering memberikan kemungkinan penjelesan untuk
suatu pola atau kecenderungan.
3.2.2 Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target
estimasi lebih kearah numerik daripada ke arah kategori. Model
dibangun dengan record lengkap yang menyediakan nilai dari
variabel target sebagai nilai prediksi. Sebagai contoh, akan dilakukan
estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan
umur pasien, jenis kelamin, indeks berat badan, dan level sodium
darah. Hubungan antara tekanan darah sistolik dan nilai variabel
prediksi dalam proses pembelajaran akan menghasilkan model
estimasi. Model estimasi yang dihasilkan dapat digunakan untuk
kasus baru lainnya.
3.2.3 Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali
bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang.
Contoh prediksi dalam bisnis dan penelitian adalah:
a. Prediksi harga beras dalam tiga bulan yang akan datang.
b. Prediksi persentase kenaikan kecelakaan lalu lintas tahun depan
jika batas bawah dinaikan.
Beberapa metode dan teknik yang digunakan dalam klasifikasi
dan estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk
prediksi.Klasifikasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
Dalam klasifikasi, terdapat terget variabel kategori. sebagai
contoh, penggolongan pendapatan dapat dipisahkan dalam tiga
kategori yaitu: pendapatan tinggi, pendapatan sedang, dan
pendapatan rendah.
Contoh lain klasifikasi dalam bisnis dan penelitian adalah:
a. Menentukan apakah suatu transaksi kartu kredit merupakan
transaksi yang curang atau bukan.
b. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah
merupakan suatu kredit yang baik atau buruk.
c. Mendiagnosis penyakit seorang pasien untuk mendapatkan
termasuk kategori penyakit apa.
3.2.4 Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan,
atau memperhatikan dan membentuk kelas objek-objek yang
memiliki kemiripan. Kluster adalah kumpulan record yang memiliki
kemiripan satu dengan yang lainnya dan tidak memiliki kemiripan
dengan record-record dalam kluster lain. Pengklusteran berbeda
dengan klasifikasi yaitu tidak adanya variabel target dalam
pengklusteran. pengklusteran tidak mencoba untuk melakukan
klasifikasi, mengestimasi, atau memprediksi nilai dari variabel
target. Akan tetapi, algoritma pengklusteran mencoba untuk
melakukan pembagian terhadap keselurahan data menjadi kelompok-
kelompok yang memiliki kemiripan (homogen), yang mana
kemiripan record dalam suatu kelompok akan bernilai maksimal,
sedangkan kemiripan dengan record dalam kelompok lain akan
bernilai minimal. Contoh pengklusteran dalam bisnis dan penelitian
adalah: Mendapatkan kelompok-kelompok konsumen untuk target
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
pemasaran dari suatu produk sebuah perusahaan yang tidak memiliki
dana pemasaran yang besar.
a. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan
terhadap perilaku finansial dalam baik maupun mencurigakan.
b. Melakukan pengklusteran terhadap ekspresi dari en, untuk
mendapatkan kemiripan perilaku dari gen dalam jumlah besar.
3.2.5 Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang
muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut
analisis keranjang pasar. Contoh asosiasi dalam bisnis dan penelitian
adalah:
a. Meneliti jumlah pelanggan dari perusahaan telekomunikasi
seluler yang diharapkan untuk memberikan respon positif
terhadap penawaran upgrade layanan yang diberikan.
b. Menemukan barang dalam supermarket yang dibeli secara
bersamaan dan barang yang tidak pernah dibeli secara
bersamaan.
2.1.3 Tahapan Data Mining
Tahapan yang dilakukan pada proses data mining diawali dari seleksi
data dari data sumber ke data target, tahap preprocessing untuk
memperbaiki kualitas data, transformasi, data mining serta tahap
interpretasi dan evaluasi yang menghasilkan output berupa pengetahuan
baru yang diharapkan memberikan kontribusi yang lebih baik.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
9
1. Data selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu
dilakukan sebelum tahap penggalian informasi dalam KDD dimulai.
Data hasil seleksi yang digunakan untuk proses data mining,
disimpan dalam suatu berkas, terpisah dari basis data operasional.
2. Pre-processing / cleaning
Sebelum proses data mining dapat dilaksanakan, perlu
dilakukan proses cleaning pada data yang menjadi fokus KDD.
Proses cleaning mencakup antara lain membuang duplikasi data,
memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada
data.
3. Transformation
Coding adalah proses transformasi pada data yang telah dipilih,
sehingga data tersebut sesuai untuk proses data mining. Proses
coding dalam KDD merupakan proses kreatif dan sangat tergantung
pada jenis atau pola informasi yang akan dicari dalam basis data.
4. Data Mining
Data mining adalah proses mencari pola atau informasi menarik
dalam data terpilih dengan menggunakan teknik atau metode
tertentu. Teknik, metode, atau algoritma dalam data mining sangat
bervariasi. Pemilihan metode atau algoritma yang tepat sangat
bergantung pada tujuan dan proses KDD secara keseluruhan.
5. Interpretation / evalution
Pola informasi yang dihasilkan dari proses data mining perlu
ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang
berkepentingan. Tahap ini merupakan bagian dari proses KDD yang
disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
atau informasi yang ditemukan bertentangan dengan fakta atau
hipotesis yang ada sebelumnya.
2.2. K-Means
K-Means Cluster merupakan salah satu metode Cluster analysis non
hirarki yang berusaha untuk mempartisi objek yang ada kedalam satu atau
lebih Cluster atau kelompok objek berdasarkan karakteristiknya, sehingga
objek yang mempu nyai karakteristik yang sama dikelompokan dalam satu
Cluster yang sama dan objek yang mempunyai karakteristik yang berbeda
dikelompokan kedalam Clusteryang lain. K-Means merupakan salah satu
metode Cluster yang sering digunakan dalam pengelompokan yang belum
diketahui jumlah jumlah kelompoknya.
Algoritma K-Means dimulai dengan pemilihan secara acak titik pusat, K
disini merupakan banyaknya Cluster yang ingin dibentuk. Kemudian tetapkan
nilai-nilai K secara random, untuk sementara nilai tersebut menjadi pusat dari
Cluster atau biasa disebut dengan centroid secara random, “means”. Hitung
jarak setiap data yang ada terhadap masing-masing centroid menggunakan
Persamaan Euclidean hingga ditemukan jarak yang paling dekat dari setiap
datadengan centroid. Klasifikasikan setiap data berdasarkakedekatannya
dengan centroid. Lakukan langkah tersebut hingga nilai centroid tidak berubah
Langkah-langkah melakukan Cluster K-Mean:
1. Menentukan jumlah Cluster titik pusat.
2. Melakukan alokasi data kedalam Cluster secara random.
3. Melakukkan alokasi semua data/objek ke Cluster terdekat. Kedekatan dua
objek ditentukanberdasarkan jarak kedua objek tersebut. Demikianjuga
kedekatan suatu data ke Cluster tertentu ditentukan jarak antara data ke tiap
pusat Cluster. Jarak paling dekat antara satu data dengan satu Cluster
tertentu akan menentukan suatu data masuk dalam Cluster mana.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
Persamaan menghitung jarak dengan euclidiance distance :
𝑑(𝑖, 𝑗) = √(𝑥1𝑖−𝑥1𝑗)2
+ (𝑥2𝑖 − 𝑥2𝑗)2
… + (𝑥𝑘𝑖 − 𝑥𝑘𝑗) (2.1)
Keterangan :
𝑑(𝑖,𝑗)= Jarak data keike pusat Cluster j
𝑥𝑖𝑗 = Data ke i pada atribut data ke k
𝑥𝑘𝑗 = Titik pusat ke j pada atribut ke k
2.3. Information Retrieval
2.3.1 Pengertian Information Retrieval
Information Retrieval adalah ilmu yang mempelajari prosedur-
prosedur dan metode-metode untuk menemukan kembali informasi
yang tersimpan dari berbagai sumber (resources) yang relevan atau
koleksi sumber informasi yang dicari atau dibutuhkan. Dengan tindakan
index (indexing), panggilan (searching), pemanggilan data kembali
(recalling)
2.3.2 Peranan Information Retrieval
Sekarang ini dengan mudah kita dapat jumpai kegunaan dari
Information Retrieval seperi dalam mesin pencarian perpustakaan ,
diapotik, ataupun yang sering diginakan oleh masyarakat yaitu mesin
Google , itu semua berkat adanya peranan Information Retrieval.
Berikut merupakan peranan Information Retrieval:
1. Menganalisis isi sumber informasi dan pertanyaan pengguna.
2. Mempertemukan pertanyaan pengguna dengan sumber informasi
untuk mendapatkan dokumen yang relevan.
Tahapan pengolahan data dengan tf. Query yang dimasukkan oleh
user juga akan diolah melalui beberapa proses yaitu :
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12
1. Melakukan preprosesing terhadap query yang dimasukkan user yaitu
menghilangkan stopword.
2. Setelah dilakukan preprocessing, maka langkah selanjutnya adalah
mengambil tiap kata/term dan
3. Menghitung jumlah kemunculannya pada dokumen tertentu.
4. Dilakukan pembobotan kata menggunakan Persamaan Tf.
5. Tahapan indexing dilakukan untuk menyimpan tiap kata/term ke
dalam database beserta bobot tiap term. Hal ini dilakukan dengan
tujuan supaya query dengan kata yang sama tidak perlu dilakukan
perhitungan lagi.
Term Frequency adalah d dan dilambangkan dengan tft, d.
Pendekatan paling sederhana dari konsep ini adalah dengan menyatakan
bobot suatu kata t sebagai jumlah kemunculannya pada dokumen d.
Sebagai contoh, jika dalah suatu dokumen, kata plagiat muncul
sebanyak 10 kali maka nilai 𝑇𝐹 adalah 10.
Persamaan perhitungan TF
𝑇𝐹(𝑑, 𝑡) = 𝑓(𝑑, 𝑡) (2.2)
Keterangan :
f(d,t) : Kemunculan kata t dalam dokumen d
2.4. Silhouette Coefficient
2.4.1 Pengertian Silhouette Coefficient
Silhouette coefficient digunakan untuk melihat kualitas dan
kekuatan Cluster, seberapa baik suatu objek ditempatkan dalam suatu
Cluster. Tahapan perhitungan Silhouette coefficient adalah sebagai
berikut (Handoyo, et al., 2014):
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
1. Hitung rata-rata jarak dari suatu data misalkan i dengan semua data lain
yang berada dalam satu Cluster .
𝑎(𝑖) = 1|𝐴| − 1𝛴 ∈ 𝐴, 𝑗 ≠ 𝑖𝑑(𝑖, 𝑗)𝑗 (2.4)
Dengan j adalah data lain dalam satu Cluster A dan d(I,j) adalah jarak
antara data I dengan j.
2. Hitung rata-rata jarak dari data i tersebut dengan semua data diCluster lain,
dan diambil nilai terkecilnya.
𝑑(𝑖, 𝐶) = 1|𝐴|𝛴𝑗 ∈ ∁ 𝑑(𝑖, 𝑗) 𝑗 (2.5)
Dengan d (I, C) adalah jarak rata-rata data I dengan semua objek pada
Cluster lain C dimana A ≠C.
𝑏(𝑖) = 𝑚𝑖𝑛𝐶 ≠ 𝐴 𝑑(𝑖, 𝐶) (2.6)
3. Persamaan Silhouette coefficient adalah:
𝑠(𝑖) = (𝑏(𝑖) − 𝑎(𝑖))/𝑚𝑎𝑥 (𝑎(𝑖), 𝑏(𝑖)) (2.7)
Dengan s(i) adalah semua rata-rata pada semua kumpulan data. Diimpl
mentasikan menggunakan metode improved K-Means.
4. Implementasi sitem merupakan penerapan dari studi literatur yang telah
dilakukan dan penerapan sistem yang telah dirancang.
5. Pengujian adalah jaminan kualitas dari perangkat lunak pada sistem yang
telah dibangun serta untuk mempresentasikan kajian pokok dari
spesifikasi, desain dan pengkodean.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14
BAB III
METODE PENELITIAN
Berdasarkan pada landasan teori yang berada pada Bab II yang telah disampaikan
oleh penulis. Pada bab ini menjelaskan cara kerja algoritma yang digunakan danproses
yang akan dibangun untuk melakukan pengelompokan.
3.1 Tahap Penelitian
Dalam subab ini akan dibahas tentang langkah langkah yang dilalui dalam
proses penelitian. Adapun tahapan yang dilali adalah sebagai berikut:
1. Tahap pencarian, pada tahapan ini pencarian data set didapatkan melalui buku
ISO (Informasi Spesialite Obat Volume 48), terbit pada tahun 2013.
2. Pencarian informasi mengenai segala sesuatu yang berhuungan dengan
penelitian ini.
3. Pengumpulan data
4. Menganalisa data yang sudah didapatkan, dan membuat perancangan
sistemnya.
5. Mengimplementasikan perancangan yang sudah dilakukan ke dalam perangkat
lunak.
6. Melakukan pengujian terhadap sistem dengan memasukan data .
7. Melakukan analisa terhadap sistem yang telah diuji menggunakan algoritma
Silhouete ceficient
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
15
3.2 Gambaran Proses K-Mean Cluster
Di bawah ini merupakan proses penelitian yang dilakukan:
GAMBAR 3. 1 PROSES K-MEAN CLUSTER
Pada gambar 3.1 Proses penelitian dimulai dari mengumpulkan data set
yang berupa teks dari buku ISO (Informasi Spesialite Obat) Volume 48. Kemudian
memasuki tahap yang kedua yaitu menguraikan kalimat menjadi beberapa kata.
Pada tahapan ketiga proses yang dilakukan adalah menyeleksi kata yang yang
terdapat pada daftar stopword. Tahapan selanjutnya merupakan pembersihan data,
kata yang telah melewati proses seleksi dan masih terdapat duplikasi akan
dihilangkan pada tahapan ini. Berikutnya dalah pembentukan TF(TermFrekuency)
matrix yang digunakan untuk pembobotan kata. Setelah itu, dilakukan
pembentukan TF-IDF matriks. Setelah proses tokenisasi, pembersihan stopword,
pembersihan data, pembentukanTF dan pembentukan TF-IDF matrik kemudian
dilakukan klusterisasi K-Means.
3.2.1 Data
Data yang digunakan adalah data dari buku Informasi Spesialite Obat
volume 48. Buku ISO merupakan buku direktori obat- obatan terpercaya
yang beredar di Indonesia.Proses pengumpulan data diambil dari buku ISO
sebanyak 7 kategori meliputi saluran nafas, saluran cerna, anti hipertensi,
analgesik non narkotik, topikal untuk kulit, antimalaria, antiseptik dan
disinfektan. Setiap kategori diambil data masing masing 10 data obat
sehingga dalam penelitian ini menggunakan data sebanyak 70.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
Berikut ini merupakan beberapa data asli dari buku ISO vol 48. Lebih
lengkapnya dapat dilihat pada Lampiran 1.
Tabel 3. 1 Data Set Obat
No NAMA INDIKASI
1 AMINOPHYLLINE MERINGANKAN DAN
MENGATASI SERANGAN ASMA
BRONKIAL
2 ASMANO ASMA BRONKIAL BRONKITIS
ASMATIK BRONKITIS KRONIK
DENGAN ENFISEMA
BRONKOSPASME EFISEMATOSA
ASMA DENGAN RINITIS ALERGI
3 ASMACEL ASMA BRONKIAL BRONKITIS
KRONIS ENFISEMA
4 ASMADEX ASMA BRONKIAL ASMA
BRONKITIS KEJANG BRONKUS
ALERGI
5 ASCOLEN ASMA BRONKIAL BRONKITIS
ASMATIS DAN ENFISEMA
PULMONUM
6 AZMACON ASMA BRONKITIS KRONIS
ENFISEMA
7 ASTHERIN BATUK BERDAHAK ASMA
BRONKIAL BRONKITIS
ENFISEMA
8 ASTOP ASMA BRONKIAL BRONKITIS
KRONIK BRONKITIS KRONIK
ENFISEMA PULMONUM
9 BIMADRYL MEREDAKAN BATUK
BERDAHAK
10 ATAROC DISPNEA KARENA ASMA
BRONKIAL BRONKITIS AKUT
DAN KRONIK
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
17
3.2.2 Case Folding
Tidak semua dokumen teks konsisten dalam menggunakan huruf
kapital. Oleh karena itu, tahapan case folding ini merupakan tahapan
mengkonversi keseluruhan teks dalam dokumen kebentuk standar.
Sebagai contoh: Meringankan Dan Mengatasi Serangan Asma Bronkial
dikonversi menjadi MERINGANKAN DAN MENGATASI
SERANGAN ASMA BRONKIAL.
3.2.3 Tokenisasi
Tokenisasi merupakan tahapan memecah data dalam bentuk teks dari
kalimat menjadi kata. berikut adalah contoh kalimat yang akan
dilakukan proses tokenisasi: “meringankan dan mengatasi serangan
asma bronkial”. Dari kalimat diatas dipecah menjadi beberapa kata,
{meringankan | dan | mengatasi | serangan | asma | bronkial} diperoleh
6 kata.
3.2.4 Pembersihan Stopword
Data yang telah melewati tokenisasi dilakukan pembersihan stopword
(kata sambung). Adapun daftar stopword antara lain: dan, dengan, atau,
dimana, pada, secara, seperti, oleh, telah, terhadap, karena, akibat, yang,
sebagai, untuk, disebabkan. Dari contoh proses tokenisasi sebelumnya
diperoleh, {meringankan | dan | mengatasi | serangan | asma | bronkial}
diperoleh 6 kata. Dilakukan pembersihan stopword sehimgga diperoleh
hasil: asma | bronkial
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18
Tabel 3. 2 Hasil Pembersihan Stopword
No NAMA INDIKASI
1 AMINOPHYLLINE
MERINGANKAN | MENGATASI |
SERANGAN | ASMA | BRONKIAL
2 ASMADEX
ASMA | BRONKIAL | ASMA | BRONKITIS
KEJANG | BRONKUS | ALERGI
3 ASMANO
ASMA | BRONKIAL | BRONKITIS |
ASMATIK | BRONKITIS | KRONIK |
ENFISEMA | BRONKOSPASME
EFISEMATOSA | ASMA | RINITIS |
ALERGI
4 ASCOLEN
ASMA | BRONKIAL | BRONKITIS |
ASMATIS | ENFISEMA | PULMONUM
5 ASTOP
ASMA | BRONKIAL | BRONKITIS
KRONIK | BRONKITIS | KRONIK |
ENFISEMA | PULMONUM
6 ASMACEL
ASMA | BRONKIAL | BRONKITIS |
KRONIS | ENFISEMA
7 AZMACON ASMA BRONKITIS KRONIS ENFISEMA
8 BIMADRYL MEREDAKAN | BATUK | BERDAHAK
9 ASTHERIN
BATUK | BERDAHAK | ASMA |
BRONKIAL | BRONKITIS | ENFISEMA
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
No NAMA INDIKASI
10 ATAROC
DISPNEA | ASMA | BRONKIAL
BRONKITIS | AKUT KRONIK
3.2.1 Tranformasi data
Agar data diatas dapat diolah menggunakan Cluster K-Means,
maka data dibuat pemodelan dengan angka menggunakan TF-IDF
Metode perhitungan
1. Menghitung Term Frekuensi
Term Frequency merupakan tahapan menghitung jumlah
frekuensi kemunculan term(t) pada dokumen (d).
Contoh:
pada dokumen1 terdapat indikasi obat asma bronkial maka sistem
akan menghitung jumlah kemunculan kata dalam dokume n tersebut.
Terdapat beberapa dokumen:
Tabel 3. 3 Tabel Data Obat
dok1 ASMA BRONKIAL
dok2
ASMA BRONKIAL BRONKITIS ASMATIK BRONKITIS
KRONIK ENFISEMA BRONKOSPASME EFISEMATOSA ASMA
RINITIS ALERGI
dok3 ASMA BRONKIAL BRONKITIS KRONIS ENFISEMA
dok4
ASMA BRONKIAL ASMA BRONKITIS KEJANG BRONKUS
ALERGI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
dok5
ASMA BRONKIAL BRONKITIS ASMATIS ENFISEMA
PULMONUM
dok6 HIPERTENSI ANGINA
dok7 HIPERTENSI ANGINA
dok8 HIPERTENSI ANGINA STABIL ANGINA VARIAN
dok9 HIPERTENSI
dok10 HIPERTENSI ANGINA STABIL VARIAN
Tabel 3. 4 Contoh Tabel Term Frekuensi (TF)
Term1 Term2 Term4 …. Term 19
DOKUMEN ALERGI ANGINA ASMA …. VARIAN
dok1 0 0 1 … 0
dok2 1 0 2 … 0
dok3 0 0 1 … 0
dok4 1 0 2 … 0
…. … … … … …
10 0 1 0 … 1
2. Menghitung dokumen frekuensi
Document frequency (df) adalah banyaknya dokumen dimana suatu
term (t) muncul. Pada tahapan ini menghitung banyaknya dokumen
dimana suatu kata muncul. Pada Gambar 3.6 ditampilkan term alergi
dalam 2 dokumen.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
21
Tabel 3. 5 Dokumen Frekuensi(df)
Term DF
ALERGI 2
ANGINA 4
ASMA 5
ASMATIK 1
ASMATIS 1
BRONKIAL 5
BRONKITIS 4
BRONKOSPASME 1
BRONKUS 1
EFISEMATOSA 1
ENFISEMA 2
HIPERTENSI 5
KEJANG 1
KRONIK 1
KRONIS 1
PULMONUM 1
RINITIS 1
STABIL 2
VARIAN 2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
3. Perhitungan IDF
Setelah pencarian dengan df kemudian dilanjutkan dengan IDF yaitu
pembobotan terbalik, dokumen yang hanya memiliki frekunsi lebih
kecil akan diberi bobot lebih tinggi.
Persamaan IDF
𝑖𝑑𝑓 = (𝑁
𝑑𝑓) (3.1)
Keterangan:
𝑁 =jumlah keseluruhan dokumen
𝑑𝑓 = dokumen frekuensi
Tabel 3. 6 Tabel Inverse Document Frekuency (idf)
Term DF idf
ALERGI 2 𝐿𝑜𝑔10(10/2) = 0.69897
ANGINA 4 𝐿𝑜𝑔10(10/4) = 0.39794
ASMA 5 𝐿𝑜𝑔10(10/5) = 0.30103
ASMATIK 1 𝐿𝑜𝑔10(10/5) = 1
ASMATIS 1 𝐿𝑜𝑔10(10/1) = 1
BRONKIAL 5 𝐿𝑜𝑔10(10/5) = 0.30103
BRONKITIS 4 𝐿𝑜𝑔10(10/2) = 0.39794
BRONKOSPASME 1 𝐿𝑜𝑔10(10/1) = 1
BRONKUS 1 𝐿𝑜𝑔10(10/2) = 1
EFISEMATOSA 1 𝐿𝑜𝑔10(10/2) = 1
ENFISEMA 2 𝐿𝑜𝑔10(10/2) = 0.69897
HIPERTENSI 5 𝐿𝑜𝑔10(10/2) = 0.30103
KEJANG 1 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
4. Perhitungan TF-IDF
Langkah selanjutnya menghitung termfrekuensi * idf
Tabel 3. 7 Tabel TF-IDF
DOKUMEN ALERGI ANGINA ASMA …. VARIAN
dok1 0 0 0.69897 … 0
dok2 0.00 0.00 0.00 … 0
dok3 0 0 0.30103 … 0
dok4 0.22184875 0 0.443697 … 0
…. … … … … …
10 0 0.39794 0 … 0.39794
5. Perhitungan K-Means
Langkah selanjutnya setelah menemukan TF*IDF mencari centroid (titik pusat),
kemudian dihitung dengan Persamaan (2.1) yang telah dijelaskan pada bab
sebelumnya.
Setelah semua data ditransformasi ke dalam bentuk angka, maka data
data tersebut dapat dikelompokan dengan algoritma K-Means Clustering.
KRONIK 1 1
KRONIS 1 1
PULMONUM 1 1
RINITIS 1 1
STABIL 2 0.69897
VARIAN 2 0.69897
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
Untuk dapat melakukan pegelompokan data-data tersebut menjadi beberap
klaster perlu dilakukan beberapa langkah, yaitu:
1. Tentukan jumlah Cluster yang diinginkan . Dalam penelitian ini
data-data yang ada akan dikelompokan menjadi dua Cluster.
2. Tentukan titik awal dari setiap Cluster dalam penelitian ini titik
awal ditentukan secara random dan didapat titik pusat dari setiap
Cluster. Pada penelitian ini diambil pusay Cluster dengan
nomor dokume dok1 dan dok4 dapat diihat pada Tabel 3.8
Tabel 3. 8 Tabel TF-IDF
DOKUMEN ALERGI ANGINA ASMA …. VARIAN
dok1 0 0 0.69897 … 0
dok2 0.00 0.00 0.00 … 0
dok3 0 0 0.30103 … 0
dok4 0.22184875 0 0.443697 … 0
…. … … … … …
10 0 0.39794 0 … 0.39794
Setelah diketahui nilai k dan pusat Cluster awal selanjutnya mengukur
jarak antara pusat Cluster menggunakan euclidian distance , kemudian akan
didapatkan matrix jarak yaitu C1, dan C2 sebagai berikut:
Persamaan euclidian distance :
𝑑(𝑖, 𝑗) = √(𝑥1𝑖−𝑥1𝑗)2
+ (𝑥2𝑖 − 𝑥2𝑗)2
… + (𝑥𝑘𝑖 − 𝑥𝑘𝑗)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
Perhitungan jarak data pertama dengan pusat Cluster pertama adalah :
d11=√(0 − 0) + (0 − 0) + ( 0.69897 − 0.69897) + ⋯ + (0 − 0)= 0
Perhitungan jarak data pertama dengan pusat Cluster kedua adalah :
d12=√(0 − 0) + (0 − 0.397) + ( 0.69897 − 0) + ⋯ + (0 − 0.397)=10.236
Tabel 3. 9 Hasil Perhitungan Clustering Kmeans
Centroid 1 Centroid 2 Cluster
Dok1 0.000 10.236 1
Dok2 2.000 6.000 1
Dok3 1.732 9.000 1
Dok4 0.000 10.000 1
Dok5 2.000 2. 828 1
Dok6 3.606 1.000 2
Dok7 3.162 0.000 2
Dok8 3.162 1.236 2
Dok9 2.828 2.000 2
Dok10 3.000 2.646 2
Jarak hasil perhitungan akan dilakukan perbandingan dan dipilih jarak
yang terdekat antara data dengan pusat Cluster, jarak ini menunjukan bahwa
data tersebut berada dalan satu kelompok dengan pusat Cluster terdekat. Berikut
ini merupakan matiks hasil pengelompokan grup, yang diberi nilai 1 berarti data
tersebut berada di dalam salah satu satu group(kelompok data).
Tabel 3. 10 Hasil Pengelopokan Jarak antara Cluster 1 dan Cluster2
Cluster 1 Cluster 2
Dok1 1
Dok2 1
Dok3 1
Dok4 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
Cluster 1 Cluster 2
Dok5 1
Dok6 1
Dok7 1
Dok8 1
Dok9 1
Dok10 1
Setelah diketahui anggota tiap tiap Cluster kemudian pusat Cluster baru
didapat dengan cara mengitung rata-rata Cluster yang berada dalam satu
Cluster. Hitung kembali jarak data dengan pusat Cluster baru. Ulangi langkah
tersebut hingga nilai rata-rata Cluster tetap atau batasi dalam iterasi tertentu.
6. Perhitungan validasi Silhouete.
Langkah selanjutnya merupakan tahapan menguji kekuatan hasil Cluster
yang telah terbentuk. Kekuatan hasil Cluster diuji kekuatannya dengan validasi
Silhouete. Untuk melakukan validasi adapun beberapa langkah sebagai berikut:
a. Menghitung jarak rata-rata setiap titik yang merupakan satu
kelompk Cluster menggunakan persamaan euclidiance distance.
b. Menghitung jarak yang merupakan beda Cluster menggunakan
persamaan euclidiance distance dicari nilai terkecilnya.
c. Menghitung jarak maksimal yang merupakan satu Cluster
maupun beda Cluster menggunakan persamaan euclidiance
distance.
d. Hitung menggunakan persamaan 𝑠(𝑖) = (𝑏(𝑖) − 𝑎(𝑖))/
𝑚𝑎𝑥 (𝑎(𝑖), 𝑏(𝑖))
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
27
e. Lakukan langkah di atas sampai semua titik terhitung kekuatan
hasil Clustering kemudian hitung rata-rata semua SI.
Tabel 3. 11 Hasil Perhitungan SI
Jarak Hasil
Perhitungan
SI
Rata-rata
jarak satu
Cluster(A)
Hasil
D2-D1 1.852084
1.48175022
-
0.67463503
D2-D3 0.988493
D2-D4 2.196373
D2-D5 1.260385
Jarak Hasil
Perhitungan
SI
Rata-rata
jarak beda
Cluster(B)
D2-D6 1.830023
0
D2-D7 1.608903
D2-D8 0
D2-D9 1.065586
D2-D10 0.39794
Max jarak
(A,B)
2.196373
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28
BAB IV
IMPLEMENTASI SISTEM DAN ANALISIS HASIL
4.1 IMPLEMENTASI
Implementasi program yang saya rancang untuk menganalisa Cluster berupa
program aplikasi perangkat lunak. Gambar 4.1 menunjukan tampilan program
yang digunakan sebagai alat uji. Adapun cara kerja sistem sebagai berikut:
a. Data obat berupa nama dan indikasi ditambahkan terlebih dahulu pada sistem.
Sebelum data akhirnya disimpan dalam database, proses yang dilakukan oleh
sistem adalah tokenisasi term. Jika terdapat kata yang sama dengan kumpulan
kata pada stopword kata tersebut akan dihilangkan dan data hasil filter ini
disimpan dalam tabel Obat.
b. Sistem melakukan perhitungan kemunculan kata, pembobotan TF-IDF dan
dilakukan proses Cluster menggunakan algoritma K-Means.
Gambar 4. 1 Gui Sistem Keseluruhan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
29
Gambar 4. 2 Input Data Obat
Pada Gambar 3.1. Gambar Gui Sistem Inputan Data. Tampilan
interface diatas merupakan tampilan sistem yang digunakan untuk
implementasi sistem. Tampilan tersebut digunakan menginputkan data
berupa text yang diketukan dalam form nama obat dan form indikasi.
Dalam sistem ini pengguna mengetikan nama obat dan indikasinya,
setelah itu klik tombol simpan maka data yang tersimpan akan
ditampilkan pada tabel yang ada dibawah form input data.
Gambar 4. 3 Hasil Proses K-Mean Cluster
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
30
Gambar 4. 4 Tampilan Tabel Gui Tabel Term(kata)
Pada Gambar 4.3 ini merupakan hasil dari pemecahan dokumen
menjadi kata. Hal ini terjadi saat pengguna menginputkan data dari form
kemudian disimpan. Sistem akan memecah dokumen menjadi
perkata(term). Data dokumen yang dipecah berasal dari variabel
indikasi. Data yang disimpan setelah melalui tahapan pembersihan
stopword.
4.2 Tabel Hasil Cluster percobaan 1
Berikut ini merupakan percoban dengan 7 Cluster dengan centroid awal
dengan nomor dokumen 1,3,14,25,36,47,58.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
31
Tabel 4. 1 Tabel Hasil Cluster percobaan 1
NO NAMA OBAT KLASTER
1 ASMANO 1
2 ASMACEL 2
3 ATAROC 2
4 AMINOPHYLLINE 2
5 ASMADEX 3
6 ASCOLEN 4
7 AZMACON 5
8 ATMACID 5
9 ACTAL 5
10 ANTASIDA-DOEN 5
11 ALLUDONA-D 5
12 BIMALCUS 5
13 CRAFAL 5
14 FAMOCID 5
15 GASTROLAN 5
16 GASTROMAG 5
17 CARDIVASK 5
18 AMCOR 5
19 LACIPIL 5
20 CYDIPIN 5
21 CALSIVAS 5
22 NORMOTEN 5
23 TENSIVASK 5
24 TENSS 5
25 PLNDIL 5
26 AFIBRAMOL 5
27 AFIDOL 5
28 ALLOGON 5
29 ALFIDON 5
30 BIMAGEN 5
NO NAMA OBAT KLASTER
31 BODREX 5
32 BIOACNE 5
33 MULO-JERAWAT 5
34 ACNOMEL 5
35 SKINOREN 5
36 ERYMED 5
37 BENZASIL 5
38 ERYDERM 5
39 BENZOLAC 5
40 MANNE 5
41 AVLOCLOR 5
42 DURAQUIN 5
43 MEXAQUIN 5
44 NIVAQUINE 5
45 QUINAL 5
46 CENDOQUINE 5
47 RIBOQUIN 5
48 MALAREX 5
49 EUCHININ 5
50 SULDOX 5
51 ALPHADINE 5
52 BONISOL 5
53 DANSEPTA 5
54 DINASEPT 5
55 MINOVAN 5
56 OXOFERIN 5
57 POVIDIN 5
58 SEPTADINE 5
59 UNIDINE 5
60 BUFANTACID 5
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
32
NO NAMA OBAT KLASTER
61 ASPILETS 5
62 DALACIN-T 5
63 ACTAPIN 5
64 ANALPIM 5
65 ANASTAN-FORTE 5
NO NAMA OBAT KLASTER
66 ASPIRIN 5
67 KOKODIN 5
68 ASTHERIN 6
69 BIMADRYL 6
70 ASTOP 7
4.2.1 Uji Silhouette
Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada
bab sebelumnya pada Persamaan diperoleh hasil Cluster menggunakan
perhitungan Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori
buruk karena hasil yang diperoleh 0.02857. Hal ini terjadi diakibatkan oleh
banyaknya term bernilai 0 sehingga hasilnya jauh dari 1. Semakin term
bernilai jauh dari 1 hasilnya menunjukan ketidak tepatan Cluster.
4.3 Tabel Hasil Cluster percobaan 2
Berikut ini merupakan percoban dengan 7 Cluster dengan
centroid awal dengan nomor dokumen 2,13,24,35,46,57,68.
Tabel 4. 2 Tabel Hasil Cluster percobaan 2
NO NAMA OBAT KLASTER
1 AFIBRAMOL 1
2 ALFIDON 1
3 BIMAGEN 1
4 BODREX 1
5 AMINOPHYLLINE 1
6 ASMACEL 4
7 ASMADEX 4
NO NAMA OBAT KLASTER
8 AZMACON 4
9 ATAROC 4
10 CARDIVASK 4
11 AMCOR 4
12 LACIPIL 4
13 CYDIPIN 4
14 CALSIVAS 4
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
34
NO NAMA OBAT KLASTER
15 NORMOTEN 4
16 TENSIVASK 4
17 TENSS 4
18 PLNDIL 4
19 AFIDOL 4
20 ALLOGON 4
21 BIOACNE 4
22 MULO-JERAWAT 4
23 ACNOMEL 4
24 SKINOREN 4
25 ERYMED 4
26 BENZASIL 4
27 ERYDERM 4
28 BENZOLAC 4
29 MANNE 4
30 AVLOCLOR 4
31 DURAQUIN 4
32 MEXAQUIN 4
33 NIVAQUINE 4
34 QUINAL 4
35 ALPHADINE 4
36 DANSEPTA 4
37 DINASEPT 4
38 MINOVAN 4
39 OXOFERIN 4
40 SEPTADINE 4
41 ASPILETS 4
42 DALACIN-T 4
NO NAMA OBAT KLASTER
43 ACTAPIN 4
44 ANALPIM 4
45
ANASTAN-
FORTE 4
46 ASPIRIN 4
47 ASMANO 5
48 ASCOLEN 5
49 ASTHERIN 5
50 ASTOP 5
51 BIMADRYL 5
52 ATMACID 5
53 ACTAL 5
54 ANTASIDA-DOEN 5
55 ALLUDONA-D 5
56 BIMALCUS 5
57 CRAFAL 5
58 FAMOCID 5
59 GASTROLAN 5
60 GASTROMAG 5
61 CENDOQUINE 5
62 RIBOQUIN 5
63 MALAREX 5
64 EUCHININ 5
65 SULDOX 5
66 BONISOL 5
67 POVIDIN 5
68 UNIDINE 5
69 BUFANTACID 5
70 KOKODIN 5
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
35
4.3.1. Uji Silhouette
Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada bab sebelumnya
pada Persamaan diperoleh hasil Cluster menggunakan perhitungan Silouethe bahwa
hasil kekuatan Cluster adalah dalam katergori buruk karena hasil yang diperoleh
0.02857. Hal ini terjadi diakibatkan oleh banyaknya term bernilai 0 sehingga hasilnya
jauh dari 1. Semakin term bernilai jauh dari 1 hasilnya menunjukan ketidak tepatan
Cluster.
4.4 Tabel Hasil Cluster percobaan 3
Berikut ini merupakan percoban dengan 7 Cluster dengan centroid awal
dengan nomor dokumen 12,4,15,26,37,48,59.
Hasil Pengelompokan K-Means
Tabel 4. 3 Tabel Hasil Cluster percobaan 3
No NAMA OBAT KLASTER
1 ASMACEL 1
2 ASMADEX 1
3 ASCOLEN 1
4 AZMACON 1
5 ASTHERIN 1
6 ASTOP 1
7 BIMADRYL 1
8 AFIDOL 1
9 RIBOQUIN 1
10 MALAREX 1
11 EUCHININ 1
12 ALPHADINE 1
No NAMA OBAT KLASTER
13 BONISOL 1
14 DINASEPT 1
15 MINOVAN 1
16 OXOFERIN 1
17 POVIDIN 1
18 UNIDINE 1
19 KOKODIN 1
20 ASMANO 2
21 CENDOQUINE 2
22 SULDOX 2
23 ATAROC 3
24 ATMACID 3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
No NAMA OBAT KLASTER
25 ACTAL 3
26 ANTASIDA-DOEN 3
27 ALLUDONA-D 3
28 BIMALCUS 3
29 CRAFAL 3
30 FAMOCID 3
31 GASTROLAN 3
32 GASTROMAG 3
33 CARDIVASK 3
34 AMCOR 3
35 LACIPIL 3
36 CYDIPIN 3
37 CALSIVAS 3
38 NORMOTEN 3
39 TENSIVASK 3
40 TENSS 3
41 PLNDIL 3
42 AFIBRAMOL 3
43 ALLOGON 3
44 ALFIDON 3
45 BIMAGEN 3
46 BODREX 3
47 BIOACNE 3
No NAMA OBAT KLASTER
48 MULO-JERAWAT 3
49 ACNOMEL 3
50 SKINOREN 3
51 ERYMED 3
52 BENZASIL 3
53 ERYDERM 3
54 BENZOLAC 3
55 MANNE 3
56 AVLOCLOR 3
57 DURAQUIN 3
58 MEXAQUIN 3
59 NIVAQUINE 3
60 QUINAL 3
61 DANSEPTA 3
62 SEPTADINE 3
63 BUFANTACID 3
64 ASPILETS 3
65 DALACIN-T 3
66 ACTAPIN 3
67 ANALPIM 3
68
ANASTAN-
FORTE 3
69 ASPIRIN 3
70 AMINOPHYLLINE 3
4.4.1 Uji Silhouette
Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada bab
sebelumnya pada Persamaan diperoleh hasil Cluster menggunakan perhitungan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
37
Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori buruk karena
hasil yang diperoleh 0.01429. Hal ini terjadi diakibatkan oleh banyaknya term
bernilai 0 sehingga hasilnya jauh dari 1. Semakin term bernilai jauh dari 1
hasilnya menunjukan ketidak tepatan Cluster.
4.5 Tabel Hasil Cluster percobaan 4
Berikut ini merupakan percoban dengan 7 Cluster dengan centroid awal
dengan nomor dokumen 23,5,16,27,38,49,60.
Hasil Pengelompokan K-Means
Tabel 4. 4 Hasil Cluster Percobaan 4
NO NAMA OBAT KLASTER
1 ASMANO 1
2 ASMADEX 2
3 BIMALCUS 3
4 CALSIVAS 4
5 TENSIVASK 4
6 ACTAPIN 4
7 BIOACNE 5
8 MULO-JERAWAT 5
9 ACNOMEL 5
10 SKINOREN 5
11 ERYMED 5
12 BENZASIL 5
13 ERYDERM 5
14 BENZOLAC 5
15 MANNE 5
16 DALACIN-T 5
NO NAMA OBAT KLASTER
17 ASMACEL 6
18 AZMACON 6
19 ASTHERIN 6
20 ASTOP 6
21 BIMADRYL 6
22 ATAROC 6
23 ATMACID 6
24 ACTAL 6
25 ANTASIDA-DOEN 6
26 ALLUDONA-D 6
27 CRAFAL 6
28 FAMOCID 6
29 GASTROLAN 6
30 GASTROMAG 6
31 CARDIVASK 6
32 AMCOR 6
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
38
NO NAMA OBAT KLASTER
33 LACIPIL 6
34 CYDIPIN 6
35 NORMOTEN 6
36 TENSS 6
37 PLNDIL 6
38 AFIBRAMOL 6
39 AFIDOL 6
40 ALLOGON 6
41 ALFIDON 6
42 BODREX 6
43 AVLOCLOR 6
44 DURAQUIN 6
45 MEXAQUIN 6
46 NIVAQUINE 6
47 QUINAL 6
48 CENDOQUINE 6
49 RIBOQUIN 6
50 MALAREX 6
51 EUCHININ 6
NO NAMA OBAT KLASTER
52 SULDOX 6
53 BUFANTACID 6
54 ASPILETS 6
55 ANALPIM 6
56
ANASTAN-
FORTE 6
57 ASPIRIN 6
58 AMINOPHYLLINE 6
59 ASCOLEN 7
60 BIMAGEN 7
61 ALPHADINE 7
62 BONISOL 7
63 DANSEPTA 7
64 DINASEPT 7
65 MINOVAN 7
66 OXOFERIN 7
67 POVIDIN 7
68 SEPTADINE 7
69 UNIDINE 7
70 KOKODIN 7
4.5.1 Uji Silhouette
Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada bab
sebelumnya pada Persamaan diperoleh hasil Cluster menggunakan perhitungan
Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori buruk karena
hasil yang diperoleh 0.01429. Hal ini terjadi diakibatkan oleh banyaknya term
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
39
bernilai 0 sehingga hasilnya jauh dari 1. Semakin term bernilai jauh dari 1
hasilnya menunjukan ketidak tepatan Cluster.
4.6 Tabel Hasil Cluster percobaan 5
Berikut ini merupakan percoban dengan 7 Cluster dengan centroid awal dengan
nomor dokumen 34,6,17,28,39,50,61.
Tabel 4. 5 Hasil Cluster Percobaan 5
NO NAMA OBAT KLASTER
1 ASTHERIN 2
2 ASTOP 2
3 BIMADRYL 2
4 ATAROC 2
5 ATMACID 2
6 ACTAL 2
7 ANTASIDA-DOEN 2
8 ALLUDONA-D 2
9 BIMALCUS 2
10 CRAFAL 2
11 FAMOCID 2
12 GASTROLAN 2
13 GASTROMAG 2
14 CARDIVASK 2
15 AMCOR 2
16 LACIPIL 2
17 CYDIPIN 2
18 CALSIVAS 2
19 NORMOTEN 2
20 TENSIVASK 2
21 TENSS 2
NO NAMA OBAT KLASTER
22 PLNDIL 2
23 AFIDOL 2
24 ALLOGON 2
25 BIOACNE 2
26 MULO-JERAWAT 2
27 ACNOMEL 2
28 SKINOREN 2
29 ERYMED 2
30 BENZASIL 2
31 ERYDERM 2
32 BENZOLAC 2
33 MANNE 2
34 AVLOCLOR 2
35 DURAQUIN 2
36 MEXAQUIN 2
37 NIVAQUINE 2
38 QUINAL 2
39 ALPHADINE 2
40 DANSEPTA 2
41 DINASEPT 2
42 OXOFERIN 2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
40
NO NAMA OBAT KLASTER
43 POVIDIN 2
44 SEPTADINE 2
45 BUFANTACID 2
46 ASPILETS 2
47 DALACIN-T 2
48 ACTAPIN 2
49 ANALPIM 2
50
ANASTAN-
FORTE 2
51 ASPIRIN 2
52 AFIBRAMOL 3
53 ALFIDON 3
54 BIMAGEN 3
55 BODREX 3
56 AMINOPHYLLINE 3
NO NAMA OBAT KLASTER
57 CENDOQUINE 4
58 ASMANO 6
59 ASMACEL 6
60 ASMADEX 6
61 ASCOLEN 6
62 AZMACON 6
63 RIBOQUIN 6
64 MALAREX 6
65 EUCHININ 6
66 SULDOX 6
67 BONISOL 6
68 MINOVAN 6
69 UNIDINE 6
70 KOKODIN 6
4.6.1 Uji Silhouette
Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada bab
sebelumnya pada Persamaan diperoleh hasil Cluster menggunakan perhitungan
Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori buruk karena hasil yang
diperoleh 0.02857. Hal ini terjadi diakibatkan oleh banyaknya term bernilai 0 sehingga
hasilnya jauh dari 1. Semakin term bernilai jauh dari 1 hasilnya menunjukan ketidak
tepatan Cluster.
4.7 Tabel Hasil Cluster percobaan 6
Berikut ini merupakan percoban dengan 7 Cluster dengan centroid awal dengan
nomor dokumen 45,7,18,29,40,51,62.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
41
Tabel 4. 6 Hasil Cluster Percobaan 6
NO NAMA OBAT KLASTER
1 AFIBRAMOL 1
2 ALFIDON 1
3 BIMAGEN 1
4 BODREX 1
5 AMINOPHYLLINE 1
6 EUCHININ 2
7 ASMANO 5
8 ASTHERIN 5
9 BIMADRYL 5
10 ATAROC 5
11 ATMACID 5
12 ACTAL 5
13 ANTASIDA-DOEN 5
14 BIMALCUS 5
15 RIBOQUIN 5
16 MALAREX 5
17 SULDOX 5
18 BONISOL 5
19 POVIDIN 5
20 UNIDINE 5
21 BUFANTACID 5
22 KOKODIN 5
23 ASMACEL 6
24 ASMADEX 6
25 ASCOLEN 6
26 AZMACON 6
27 ASTOP 6
28 ALLUDONA-D 6
NO NAMA OBAT KLASTER
29 CRAFAL 6
30 FAMOCID 6
31 GASTROLAN 6
32 GASTROMAG 6
33 CARDIVASK 6
34 AMCOR 6
35 LACIPIL 6
36 CYDIPIN 6
37 CALSIVAS 6
38 NORMOTEN 6
39 TENSIVASK 6
40 TENSS 6
41 PLNDIL 6
42 AFIDOL 6
43 ALLOGON 6
44 BIOACNE 6
45 MULO-JERAWAT 6
46 ACNOMEL 6
47 SKINOREN 6
48 ERYMED 6
49 BENZASIL 6
50 ERYDERM 6
51 BENZOLAC 6
52 MANNE 6
53 AVLOCLOR 6
54 DURAQUIN 6
55 MEXAQUIN 6
56 NIVAQUINE 6
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
42
NO NAMA OBAT KLASTER
57 QUINAL 6
58 CENDOQUINE 6
59 ALPHADINE 6
60 DANSEPTA 6
61 DINASEPT 6
62 MINOVAN 6
63 OXOFERIN 6
NO NAMA OBAT KLASTER
64 SEPTADINE 6
65 ASPILETS 6
66 DALACIN-T 6
67 ACTAPIN 6
68 ANALPIM 6
69
ANASTAN-
FORTE 6
70 ASPIRIN 6
4.7.1 Uji Silhouette
Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada bab
sebelumnya pada Persamaan diperoleh hasil Cluster menggunakan perhitungan
Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori buruk karena hasil yang
diperoleh 0.02857. Hal ini terjadi diakibatkan oleh banyaknya term bernilai 0 sehingga
hasilnya jauh dari 1. Semakin term bernilai jauh dari 1 hasilnya menunjukan ketidak
tepatan Cluster .
Gambar 4. 5 Grafik hasil uji kekuatan Cluster percobaan 1-6
0.02857 0.02857
0.01429 0.01429
0.02857 0.02857
0
0.005
0.01
0.015
0.02
0.025
0.03
0 1 2 3 4 5 6 7
Has
il U
ji K
eku
atan
Kla
ster
Index Titik Pusat Awal
Grafik Hasil Uji Klaster dengan IDF Keterangan Index
1 1,3,14,25,36,47,58
2 2,13,24,35,46,57,68
3 12,4,15,26,37,48,59
4 23,5,16,27,38,49,60
5 34,6,17,28,39,50,61
6 45,7,18,29,40,51,62
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
43
4.8 Tabel Hasil Cluster percobaan 7(Tanpa IDF)
Berikut ini merupakan percoban dengan 7 Cluster dengan centroid awal
dengan nomor dokumen 1,3,14,25,36,47,58.
Tabel 4. 7 Hasil Cluster Percobaan 7
NO NAMA OBAT KLASTER
1 ASMANO 1
2 ASTOP 1
3 ASMACEL 2
4 ASMADEX 2
5 ASCOLEN 2
6 ASTHERIN 2
7 ATAROC 2
8 ATMACID 3
9 ACTAL 3
10 ALLUDONA-D 3
11 BIMALCUS 3
12 GASTROMAG 3
13 BUFANTACID 3
14 CYDIPIN 4
15 CALSIVAS 4
16 TENSIVASK 4
17 ACTAPIN 4
18 AZMACON 5
19 BIMADRYL 5
20 ANTASIDA-DOEN 5
21 CRAFAL 5
22 FAMOCID 5
23 GASTROLAN 5
NO NAMA OBAT KLASTER
24 CARDIVASK 5
25 AMCOR 5
26 LACIPIL 5
27 NORMOTEN 5
28 TENSS 5
29 PLNDIL 5
30 AFIBRAMOL 5
31 AFIDOL 5
32 ALLOGON 5
33 ALFIDON 5
34 BIMAGEN 5
35 BODREX 5
36 BIOACNE 5
37 MULO-JERAWAT 5
38 ACNOMEL 5
39 SKINOREN 5
40 ERYMED 5
41 BENZASIL 5
42 ERYDERM 5
43 BENZOLAC 5
44 MANNE 5
45 ASPILETS 5
46 DALACIN-T 5
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
44
NO NAMA OBAT KLASTER
47 ANALPIM 5
48 ANASTAN-FORTE 5
49 ASPIRIN 5
50 AMINOPHYLLINE 5
51 AVLOCLOR 6
52 DURAQUIN 6
53 MEXAQUIN 6
54 NIVAQUINE 6
55 QUINAL 6
56 CENDOQUINE 6
57 RIBOQUIN 6
58 MALAREX 6
NO NAMA OBAT KLASTER
59 EUCHININ 6
60 SULDOX 6
61 ALPHADINE 7
62 BONISOL 7
63 DANSEPTA 7
64 DINASEPT 7
65 MINOVAN 7
66 OXOFERIN 7
67 POVIDIN 7
68 SEPTADINE 7
69 UNIDINE 7
70 KOKODIN 7
4.8.1 Uji Silhouette
Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada bab
sebelumnya pada Persamaan diperoleh hasil Cluster menggunakan perhitungan
Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori buruk karena
hasil yang diperoleh 0.04286. Hal ini terjadi diakibatkan oleh banyaknya term
bernilai 0 sehingga hasilnya jauh dari 1. Semakin term bernilai jauh dari 1
hasilnya menunjukan ketidak tepatan Cluster.
4.9 Tabel Hasil Cluster percobaan 8(Tanpa IDF)
Berikut ini merupakan percoban dengan 7 Cluster dengan centroid awal
dengan nomor dokumen 2,13,24,35,46,57,68.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
45
45
Tabel 4. 8 Hasil Cluster Percobaan 8
NO NAMA OBAT KLASTER
1 AFIBRAMOL 1
2 ALFIDON 1
3 BIMAGEN 1
4 BODREX 1
5 AMINOPHYLLINE 1
6 ASMANO 3
7 RIBOQUIN 3
8 ASMACEL 4
9 ASMADEX 4
10 ASCOLEN 4
11 AZMACON 4
12 ASTHERIN 4
13 ASTOP 4
14 BIMADRYL 4
15 ATAROC 4
16 ATMACID 4
17 ACTAL 4
18 ANTASIDA-DOEN 4
19 ALLUDONA-D 4
20 BIMALCUS 4
21 CRAFAL 4
22 FAMOCID 4
23 GASTROLAN 4
24 GASTROMAG 4
25 CARDIVASK 4
26 AMCOR 4
NO NAMA OBAT KLASTER
27 LACIPIL 4
28 CYDIPIN 4
29 CALSIVAS 4
30 NORMOTEN 4
31 TENSIVASK 4
32 TENSS 4
33 PLNDIL 4
34 AFIDOL 4
35 ALLOGON 4
36 BIOACNE 4
37 MULO-JERAWAT 4
38 ACNOMEL 4
39 SKINOREN 4
40 ERYMED 4
41 BENZASIL 4
42 ERYDERM 4
43 BENZOLAC 4
44 MANNE 4
45 AVLOCLOR 4
46 DURAQUIN 4
47 MEXAQUIN 4
48 NIVAQUINE 4
49 QUINAL 4
50 BUFANTACID 4
51 ASPILETS 4
52 DALACIN-T 4
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
46
NO NAMA OBAT KLASTER
53 ACTAPIN 4
54 ANALPIM 4
55 ANASTAN-FORTE 4
56 ASPIRIN 4
57 CENDOQUINE 5
58 SULDOX 5
59 ALPHADINE 5
60 BONISOL 5
61 DANSEPTA 5
NO NAMA OBAT KLASTER
62 DINASEPT 5
63 MINOVAN 5
64 OXOFERIN 5
65 POVIDIN 5
66 SEPTADINE 5
67 UNIDINE 5
68 KOKODIN 5
69 MALAREX 6
70 EUCHININ 6
4.9.1 Uji Silhouette
Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada bab
sebelumnya pada Persamaan diperoleh hasil Cluster menggunakan perhitungan
Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori buruk karena
hasil yang diperoleh 0.05714. Hal ini terjadi diakibatkan oleh banyaknya term
bernilai 0 sehingga hasilnya jauh dari 1. Semakin term bernilai jauh dari 1
hasilnya menunjukan ketidak tepatan Cluster.
4.10 Tabel Hasil Cluster percobaan 9(Tanpa IDF)
Berikut ini merupakan percoban dengan 7 Cluster dengan centroid awal dengan
nomor dokumen 12,4,15,26,37,48,59.
Tabel 4. 9 Hasil Cluster Percobaan 9
NO NAMA OBAT KLASTER
1 RIBOQUIN 1
2 EUCHININ 1
3 SULDOX 1
NO NAMA OBAT KLASTER
4 ALPHADINE 1
5 DANSEPTA 1
6 DINASEPT 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
47
NO NAMA OBAT KLASTER
7 OXOFERIN 1
8 SEPTADINE 1
9 ASMACEL 2
10 AZMACON 2
11 ASTOP 2
12 ATAROC 2
13 ATMACID 2
14 ACTAL 2
15 ANTASIDA-DOEN 2
16 ALLUDONA-D 2
17 BIMALCUS 2
18 CRAFAL 2
19 FAMOCID 2
20 GASTROLAN 2
21 GASTROMAG 2
22 CARDIVASK 2
23 AMCOR 2
24 LACIPIL 2
25 CYDIPIN 2
26 CALSIVAS 2
27 NORMOTEN 2
28 TENSIVASK 2
29 TENSS 2
30 PLNDIL 2
31 AFIBRAMOL 2
32 ALLOGON 2
33 ALFIDON 2
34 BIMAGEN 2
NO NAMA OBAT KLASTER
35 BODREX 2
36 BIOACNE 2
37 MULO-JERAWAT 2
38 ACNOMEL 2
39 SKINOREN 2
40 ERYMED 2
41 BENZASIL 2
42 ERYDERM 2
43 BENZOLAC 2
44 MANNE 2
45 AVLOCLOR 2
46 DURAQUIN 2
47 MEXAQUIN 2
48 NIVAQUINE 2
49 QUINAL 2
50 CENDOQUINE 2
51 BUFANTACID 2
52 ASPILETS 2
53 DALACIN-T 2
54 ACTAPIN 2
55 ANALPIM 2
56
ANASTAN-
FORTE 2
57 ASPIRIN 2
58 ASMANO 4
59 ASMADEX 4
60 ASCOLEN 4
61 ASTHERIN 4
62 BIMADRYL 4
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
48
NO NAMA OBAT KLASTER
63 AFIDOL 4
64 MALAREX 4
65 BONISOL 4
66 MINOVAN 4
NO NAMA OBAT KLASTER
67 POVIDIN 4
68 UNIDINE 4
69 KOKODIN 4
70 AMINOPHYLLINE 4
4.10.1 Uji Silhouette
Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada bab
sebelumnya pada Persamaan diperoleh hasil Cluster menggunakan perhitungan
Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori buruk karena
hasil yang diperoleh 0.05714. Hal ini terjadi diakibatkan oleh banyaknya term
bernilai 0 sehingga hasilnya jauh dari 1. Semakin term bernilai jauh dari 1
hasilnya menunjukan ketidak tepatan Cluster.
4.11 Tabel Hasil Cluster percobaan 10 (Tanpa IDF)
Berikut ini merupakan percoban dengan 7 Cluster dengan centroid awal dengan
nomor dokumen 23,5,16,27,38,49,60.
Tabel 4. 10 Hasil Cluster Percobaan 10
NO NAMA OBAT KLASTER
1 ASMANO 1
2 ASMACEL 2
3 ATAROC 2
4 AMINOPHYLLINE 2
5 ASMADEX 3
6 ASCOLEN 4
7 AZMACON 5
NO NAMA OBAT KLASTER
8 ATMACID 5
9 ACTAL 5
10 ANTASIDA-DOEN 5
11 ALLUDONA-D 5
12 BIMALCUS 5
13 CRAFAL 5
14 FAMOCID 5
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
49
NO NAMA OBAT KLASTER
15 GASTROLAN 5
16 GASTROMAG 5
17 CARDIVASK 5
18 AMCOR 5
19 LACIPIL 5
20 CYDIPIN 5
21 CALSIVAS 5
22 NORMOTEN 5
23 TENSIVASK 5
24 TENSS 5
25 PLNDIL 5
26 AFIBRAMOL 5
27 AFIDOL 5
28 ALLOGON 5
29 ALFIDON 5
30 BIMAGEN 5
31 BODREX 5
32 BIOACNE 5
33 MULO-JERAWAT 5
34 ACNOMEL 5
35 SKINOREN 5
36 ERYMED 5
37 BENZASIL 5
38 ERYDERM 5
39 BENZOLAC 5
40 MANNE 5
41 AVLOCLOR 5
42 DURAQUIN 5
NO NAMA OBAT KLASTER
43 MEXAQUIN 5
44 NIVAQUINE 5
45 QUINAL 5
46 CENDOQUINE 5
47 RIBOQUIN 5
48 MALAREX 5
49 EUCHININ 5
50 SULDOX 5
51 ALPHADINE 5
52 BONISOL 5
53 DANSEPTA 5
54 DINASEPT 5
55 MINOVAN 5
56 OXOFERIN 5
57 POVIDIN 5
58 SEPTADINE 5
59 UNIDINE 5
60 BUFANTACID 5
61 ASPILETS 5
62 DALACIN-T 5
63 ACTAPIN 5
64 ANALPIM 5
65
ANASTAN-
FORTE 5
66 ASPIRIN 5
67 KOKODIN 5
68 ASTHERIN 6
69 BIMADRYL 6
70 ASTOP 7
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
50
4.11.1 Uji Silhouette
Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada bab
sebelumnya pada Persamaan diperoleh hasil Cluster menggunakan perhitungan
Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori buruk karena
hasil yang diperoleh 0.04286. Hal ini terjadi diakibatkan oleh banyaknya term
bernilai 0 sehingga hasilnya jauh dari 1. Semakin term bernilai jauh dari 1
hasilnya menunjukan ketidak tepatan Cluster.
4.12 Tabel Hasil Cluster percobaan 11(Tanpa IDF)
Berikut ini merupakan percoban dengan 7 Cluster dengan centroid awal dengan
nomor dokumen 34,6,17,28,39,50,61.
Tabel 4. 11 Hasil Cluster Percobaan 11
NO NAMA OBAT KLASTER
1 AFIBRAMOL 1
2 ALFIDON 1
3 BIMAGEN 1
4 BODREX 1
5 AMINOPHYLLINE 1
6 ASMACEL 4
7 ASMADEX 4
8 AZMACON 4
9 ASTOP 4
10 ATAROC 4
11 CARDIVASK 4
12 AMCOR 4
13 LACIPIL 4
14 CYDIPIN 4
15 CALSIVAS 4
16 NORMOTEN 4
17 TENSIVASK 4
NO NAMA OBAT KLASTER
18 TENSS 4
19 PLNDIL 4
20 AFIDOL 4
21 ALLOGON 4
22 BIOACNE 4
23 MULO-JERAWAT 4
24 ACNOMEL 4
25 SKINOREN 4
26 ERYMED 4
27 BENZASIL 4
28 ERYDERM 4
29 BENZOLAC 4
30 MANNE 4
31 AVLOCLOR 4
32 DURAQUIN 4
33 MEXAQUIN 4
34 NIVAQUINE 4
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
51
NO NAMA OBAT KLASTER
35 QUINAL 4
36 ALPHADINE 4
37 DANSEPTA 4
38 DINASEPT 4
39 MINOVAN 4
40 OXOFERIN 4
41 SEPTADINE 4
42 ASPILETS 4
43 DALACIN-T 4
44 ACTAPIN 4
45 ANALPIM 4
46 ANASTAN-FORTE 4
47 ASPIRIN 4
48 ASMANO 5
49 ASCOLEN 5
50 ASTHERIN 5
51 BIMADRYL 5
52 ATMACID 5
NO NAMA OBAT KLASTER
53 ACTAL 5
54 ANTASIDA-DOEN 5
55 ALLUDONA-D 5
56 BIMALCUS 5
57 CRAFAL 5
58 FAMOCID 5
59 GASTROLAN 5
60 GASTROMAG 5
61 CENDOQUINE 5
62 RIBOQUIN 5
63 MALAREX 5
64 EUCHININ 5
65 SULDOX 5
66 BONISOL 5
67 POVIDIN 5
68 UNIDINE 5
69 BUFANTACID 5
70 KOKODIN 5
4.12.1 Uji Silhouette
Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada bab
sebelumnya pada Persamaan diperoleh hasil Cluster menggunakan perhitungan
Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori buruk karena
hasil yang diperoleh 0.04286. Hal ini terjadi diakibatkan oleh banyaknya term
bernilai 0 sehingga hasilnya jauh dari 1. Semakin term bernilai jauh dari 1
hasilnya menunjukan ketidak tepatan Cluster.
4.13 Tabel Hasil Cluster percobaan 12 (Tanpa IDF)
Berikut ini merupakan percoban dengan 7 Cluster dengan centroid awal dengan
nomor dokumen 45,7,18,29,40,51,62.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
52
Tabel 4. 12 Hasil Cluster Percobaan 12
NO NAMA OBAT KLASTER
1 ASMACEL 1
2 ASCOLEN 1
3 AZMACON 1
4 ASTOP 1
5 ATMACID 1
6 ACTAL 1
7 ANTASIDA-DOEN 1
8 ALLUDONA-D 1
9 BIMALCUS 1
10 CRAFAL 1
11 FAMOCID 1
12 GASTROLAN 1
13 GASTROMAG 1
14 CARDIVASK 1
15 AMCOR 1
16 LACIPIL 1
17 CYDIPIN 1
18 CALSIVAS 1
19 NORMOTEN 1
20 TENSIVASK 1
21 TENSS 1
22 PLNDIL 1
23 AFIDOL 1
24 ALLOGON 1
NO NAMA OBAT KLASTER
25 BIOACNE 1
26 MULO-JERAWAT 1
27 ACNOMEL 1
28 SKINOREN 1
29 ERYMED 1
30 BENZASIL 1
31 ERYDERM 1
32 BENZOLAC 1
33 MANNE 1
34 AVLOCLOR 1
35 DURAQUIN 1
36 MEXAQUIN 1
37 NIVAQUINE 1
38 QUINAL 1
39 ALPHADINE 1
40 DANSEPTA 1
41 DINASEPT 1
42 MINOVAN 1
43 OXOFERIN 1
44 SEPTADINE 1
45 BUFANTACID 1
46 ASPILETS 1
47 DALACIN-T 1
48 ACTAPIN 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
53
NO NAMA OBAT KLASTER
49 ANALPIM 1
50
ANASTAN-
FORTE 1
51 ASPIRIN 1
52 EUCHININ 2
53 ASMANO 3
54 ASMADEX 3
55 ASTHERIN 3
56 BIMADRYL 3
57 ATAROC 3
58 RIBOQUIN 3
59 MALAREX 3
NO NAMA OBAT KLASTER
60 SULDOX 3
61 BONISOL 3
62 POVIDIN 3
63 UNIDINE 3
64 KOKODIN 3
65 AFIBRAMOL 4
66 ALFIDON 4
67 BIMAGEN 4
68 BODREX 4
69 CENDOQUINE 4
70 AMINOPHYLLINE 4
4.5.1 Uji Silhouette
Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada bab
sebelumnya pada Persamaan diperoleh hasil Cluster menggunakan perhitungan
Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori buruk karena
hasil yang diperoleh 0.04286. Hal ini terjadi diakibatkan oleh banyaknya term
bernilai 0 sehingga hasilnya jauh dari 1. Semakin term bernilai jauh dari 1
hasilnya menunjukan ketidak tepatan Cluster.
Gambar 4. 6 Grafik Hasil Uji Kekuatan Cluster Percobaan 7-12
0.02857
0.04286
0.05714
0.04286 0.04286 0.04286
0
0.02
0.04
0.06
7 9 11Has
il U
ji K
ekuat
an
Clu
ster
Index Titik Pusat Awal
Grafik Hasil Uji Klaster tanpa IDF Keterangan index:
7 1,3,14,25,36,47,58
8 2,13,24,35,46,57,68
9 12,4,15,26,37,48,59
10 23,5,16,27,38,49,60
11 34,6,17,28,39,50,61
12 45,7,18,29,40,51,62
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
54
BAB V
PENUTUP
Bab terakhir pada penulisan ini menjelaskan mengenai kesimpulan dari
penelitian terkait terhadap pengelompikan obat-obatan yang diambil dari buku ISO
VOL 48. Pada bab ini dijelaskan saran yang diberikan pada sistem yang telah dibuat.
5.1 Analisa Hasil
Dari hasil Clustering tentang pengelompokan obat-obatan pada buku ISO vol
48 dapat diselesaikan dengan algoritma K-Mean dapat melakukan pengelompokan
dokumen dalam jumlah tujuhpuluh indikasi obat akan tetapi hasil belum efisien dalam
pengelompokan dokumen secara tepat. Penentuan centroid (titik pusat) pada tahap
awal algoritma K-Means sangat berpengaruh terhadap hasil Cluster seperti pada hasil
pengujian data diatas dengan centroid yang berbeda menghasilkan hasil yang berbeda
juga.
5.2 Saran
Saran yang diperlukan untuk pengembangan sistem untuk lenih lanjut sebagai
berikut:
1. Pada penelitian selanjutnya dapat dikembangkan dengan data serupa
dengan algoritma yang lebih baik seperti menggunakan Persamaan
menghitung jarak menggunakan cosine similarity.
2. Hasil Cluster yang terbentuk secara tepat dapat dijadikan sistem
pengelompokan jenis obat yang terindikasi dalam satu kategori obat.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
55
DAFTAR PUSTAKA
Ade Bastian, Harun Sujadi, dan Gigin Febrianto (2018). Penerapan Algoritma K-
Means Cluster Analysis Pada Penyakit Menular Manusia (Studi Kasus
Kabupaten Majalengka), vol. 14 no. 01
Gufroni, H.S. (2017). Penerapan Data mining Dalam Pengelompokan Penderita
Thalassaemia, vol. 03 no. 02
Han, Jiawei & Micheline Kamber. 2011. Second Edition. Data mining: Concepts and
Techniques. New York: Morgan Kaufman
Han, Jiawei & Micheline Kamber. 2012. Third Edition. Data mining: Concepts and
Techniques. New York: Morgan Kaufman
ISO (Informasi Spesialite Obat) Indonesia 2013, vol 48
Manning, C.D., dkk. 2008. Introduction to Information Retrieval. Cambridge:
University Press.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LAMPIRAN
Lampiran 1. Tabel Data Obat
No NAMA INDIKASI
1 AMINOPHYLLINE MERINGANKAN DAN MENGATASI
SERANGAN ASMA BRONKIAL
2 ASMANO ASMA BRONKIAL BRONKITIS
ASMATIK BRONKITIS KRONIK
DENGAN ENFISEMA BRONKOSPASME
EFISEMATOSA ASMA DENGAN RINITIS
ALERGI
3 ASMACEL ASMA BRONKIAL BRONKITIS KRONIS
ENFISEMA
4 ASMADEX ASMA BRONKIAL ASMA BRONKITIS
KEJANG BRONKUS ALERGI
5 ASCOLEN ASMA BRONKIAL BRONKITIS
ASMATIS DAN ENFISEMA PULMONUM
6 AZMACON ASMA BRONKITIS KRONIS ENFISEMA
7 ASTHERIN BATUK BERDAHAK ASMA BRONKIAL
BRONKITIS ENFISEMA
8 ASTOP ASMA BRONKIAL BRONKITIS KRONIK
BRONKITIS KRONIK ENFISEMA
PULMONUM
9 BIMADRYL MEREDAKAN BATUK BERDAHAK
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
57
10 ATAROC DISPNEA KARENA ASMA BRONKIAL
BRONKITIS AKUT DAN KRONIK
11 ATMACID MENGURANGI GEJALA KELEBIHAN
ASAM LAMBUNG GASTRITIS TUKAK
LAMBUNG TUKAK USUS
DUABELASJARI
12 ACTAL MENGURANGI GEJALA YANG
BERHUBUNGAN DENGAN KELEBIHAN
ASAM LAMBUNG GASTRITIS TUKAK
LAMBUNG TUKAK USUS
DUABELASJARI DENGAN GEJALA
MUAL NYERI LAMBUNG DAN NYERI
ULUHATI
13 ANTASIDA-DOEN OBAT SAKIT MAAG UNTUK
MENGURANGI NYERI LAMBUNG
YANG DISEBABKAN OLEH KELEBIHAN
ASAM LAMBUNG DENGAN GEJALA
SEPERTI MUAL DAN PERIH
14
ALLUDONA-D KELEBIHAN ASAM LAMBUNG
GASTRITIS HEARTBURN PREPTIK
ESOFAGITIS DAN MENGHILANGKAN
PERUT KEMBUNG
15 BUFANTACID MENGURANGI NYERI YANG
BERHUBUNGAN DENGAN KELEBIHAN
ASAM LAMBUNG TUKAK LAMBUNG
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
58
TUKAK USUS DAN GEJALA SEPERTI
MUAL
16 BIMALCUS MENGHILANGKAN KELEBIHAN ASAM
LAMBUNG PADA PREPTIK
ESOPHAGITIS TUKAK PREPTIK HIATUS
HERNIA NYERI PADA ULUHATI DAN
MENGURANGI RASA KEMBUNG
17 CRAFAL TUKAK LAMBUNG DAN USUS
DUABELASJARI GASTRITIS KRONIK
18 FAMOCID TUKAK USUS DUABELASJARI AKTIF
TERAPI PEMELIHARAAN PADA TUKAK
USUS DUABELASJARI AKTIF
HIPERSEKRESI PATOLOGIS SEPERTI
SINDROM ZOLLINGER ELLISION DAN
ADENOMA ENDOKRIN BERGANDA
19 GASTROLAN TUKAK USUS DUABELASJARI TUKAK
LAMBUNG REKUREN REFLUKS
ESOFAGITIS
20 GASTROMAG TUKAK LAMBUNG TUKAK USUS
DUABELASJARI PERUT KEMBUNG
KELEBIHAN ASAM LAMBUNG DAN
PERUT SAKIT
21 CARDIVASK HIPERTENSI DAN ANGINA
22 AMCOR HIPERTENSI DAN ANGINA
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
59
23 ACTAPIN HIPERTENSI ANGINA STABIL ANGINA
VARIAN
24 LACIPIL HIPERTENSI
25 CYDIPIN HIPERTENSI ANGINA STABIL ATAU
VARIAN
26 CALSIVAS HIPERTENSI ISKEMIA JANTUNG
KARENA ANGINA STABIL ANGINA
PRINZMETAL ATAU VARIAN
27 NORMOTEN HIPERTENSI
28 TENSIVASK HIPERTENSI ISKEMIA JANTUNG
KARENA ANGINA STABIL ANGINA
PRINZMETAL ATAU VARIAN
29 TENSS HIPERTENSI
30 PLNDIL HIPERTENSI
31 AFIBRAMOL MERINGANKAN RASA SAKIT SEPERTI
SAKIT GIGI SAKIT KEPALA DAN
MENURUNKAN DEMAM
32 AFIDOL MENGATASI NYERI RINGAN PADA
SAKIT KEPALA SAKIT GIGI SAKIT
WAKTU HAID DAN SAKIT OTOT
MENURUNKAN DEMAM SETELAH
IMUNISASI
33 ALLOGON SAKIT GIGI SAKIT KEPALA PEGAL
OTOT DAN SENDI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
60
34 ALFIDON MERINGANKAN SAKIT KEPALA NYERI
OTOT RASA SAKIT GIGI
35 ANALPIM MENURUNKAN PANAS MENGURANGI
RASA SAKIT KEPALA SAKIT GIGI
DEMAM
36 ANASTAN-FORTE MENGHILANGKAN RASA SAKIT GIGI
SAKIT KEPALA NYERI SETELAH
OPERASI DAN DISMENORE
37 ASPIRIN SAKIT KEPALA PUSING SAKIT GIGI
NYERI OTOT DEMAM
38 ASPILETS DEMAM SAKIT KEPALA SAKIT GIGI
RASA NYERI PADA OTOT DAN SENDI
39 BIMAGEN MERINGANKAN SAKIT KEPALA DAN
SAKIT GIGI
40 BODREX MERINGANKAN SAKIT KEPALA
PUSING PENING BERAT SAKIT GIGI
DAN MENURUNKAN DEMAM
41 BIOACNE MENCEGAH DAN MENGHILANGKAN
JERAWAT
42 MULO-JERAWAT MENYEMBUHKAN JERAWAT
43 ACNOMEL PENGOBATAN JERAWAT
44 SKINOREN OBAT JERAWAT
45 ERYMED PENGOBATAN JERAWAT SECARA
TOPIKAL
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
61
46 BENZASIL PENGOBATAN JERAWAT SECARA
TOPIKAL
47 ERYDERM JERAWAT
48 DALACIN-T MENGOBATI JERAWAT
49 BENZOLAC PENGOBATAN JERAWAT SECARA
TOPIKAL
50 MANNE TERAPI UNTUK BISUL DAN JERAWAT
51 AVLOCLOR ANTI MALARIA
52 DURAQUIN MALARIA
53 MEXAQUIN MALARIA
54 NIVAQUINE ANTI MALARIA
55 QUINAL ANTI MALARIA
56 CENDOQUINE MALARIA AMUBIASIS LUPUS
ERITEMATOSUS ARTRITIS
REUMATOID
57 RIBOQUIN DEMAM MALARIA LUPUS AMUBIASIS
DILUAR USUS SERTAGIARDIASIS
PENCEGAHAN DAN PENYEMBUHAN
MALARIA
58 MALAREX MALARIA HEPATITIS AMUBIK LUPUS
ERITEMATOSUS KRONIK REUMATOID
ARTRITIS
59 EUCHININ ANTI MALARIA ANTIPIRETIK
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
62
60 SULDOX ANTI MALARIA DIMANA MALARIA
FALCIPARUM TELAH RESISTEN
TERHADAP KLOROKUIN
61 ALPHADINE ANTISEPTIK DAN DISINFEKTAN
62 BONISOL ANTISEPTIK KULIT LUKA BIASA
LECET TERGORES DAN PIDERMA
63 DANSEPTA ANTISEPTIK
64 DINASEPT ANTISEPTIK DAN DISINFEKTAN
65 KOKODIN SEBAGAI DISINFEKTAN DAN
ATISEPTIK PADA KULIT LUKA SAYAT
LECET
66 MINOVAN ANTISEPTIK KHUSUS PADA BAGIAN
KEWANITAAN
67 OXOFERIN ANTISEPTIK DAN DISINFEKTAN
68 POVIDIN ANTISEPTIK DAN DISINFEKTAN PADA
LUKA-LUKA DIKULIT DAN JARINGAN
MUKOSA
69 SEPTADINE ANTISEPTIK
70 UNIDINE ANTISEPTIK DAN OBAT LUKA AKIBAT
TERGORES PERTOLONGAN PERTAMA
PADA KECELAKAAN SETELAH
KHITAN OPERASI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI