Cluster Obat Berdasarkan Keterangan Indikasi Obat SKRIPSI · Cluster Obat Berdasarkan Keterangan Indikasi Obat Menggunakan Algoritma K-Means SKRIPSI Diajukan untuk Memenuhi Salah

Cluster Obat Berdasarkan Keterangan Indikasi Obat

Menggunakan Algoritma K-Means

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Program Studi Informatika

Oleh:

Anditio Kurnia Wijaya

155314036

PROGRAM STUDI INFORMATIKA

JURUSAN INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2020

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

i



SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Program Studi Informatika

Oleh:


155314036

PROGRAM STUDI INFORMATIKA

JURUSAN INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2020


ii

Drug Cluster Based on Drug Indication Remarks

Using the K-Means Algorithm

A THESIS

Submitted In Partial Fulfillment Of The Requirements

For The Degree Of Sarjana Komputer

In Information Study Program

By:


155314036

INFORMATION STUDY PROGRAM

DEPARTMENT OF INFORMATICS

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2020


iii

HALAMAN PENGESAHAN

SKRIPSI



Dipersiapkan dan ditulis oleh:

ANDITIO KURNIA WIJAYA

155314036

Telah dipertahankan di depan panitia penguji

Pada Tanggal ………………….

dan dinyatakan memenuhi syarat

Susunan Panitia Penguji

Jabatan Nama Lengkap Tanda Tangan

Ketua : Drs. Haris Sriwindono M.Kom, Ph.D. ………………

Sekertaris : Eduardus Hardika Sandy Atmaja, S.Kom., M.Cs. ………………

Anggota : Robertus Adi Nugroho,S.T.,M.Eng. ………………

Yogyakarta, ……………….. 2020

Fakultas Sains dan Teknologi

Universitas Sanata Dharma

Dekan,

Sudi Mungkasi, S.Si., M.Math.Sc., Ph.D.


iv

HALAMAN PERSETUJUAN

SKRIPSI



Disusun oleh:

ANDITIO KURNIA WIJAYA

155314036

Telah disetujui oleh:

Dosen Pembimbing

Robetus Adi Nugroho,S.T.,M.Eng. Tanggal:……………………..


v

MOTTO

”Karena masa depan sungguh ada,

dan harapanmu tidak akan hilang.”

(Amsal 23:18)

“Jika Tuhan menuntun saya memulai sesuatu,

Tuhan Yang sama akan menuntun mengakhiri sesuatu yang telah dimulai.”

-Anditio-


vi

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis

ini tidak memuat karya atau bagian karya orang lain, kecuali yang

telah disebutkan dalam kutipan dan daftar pustaka, sebagaimana

layaknya karya ilmiah.

Yogyakarta,

Penulis



vii

LEMBAR PERSETUJUAN PUBLIKASI KARYA ILMIAH

UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan dibawah ini, saya mahasiswa Universitaas Sanata

Dharma :

Nama : Anditio Kurnia Wijaya

NIM : 155314036

Demi mengembangkan ilmu pengetahuan, saya memberikan kepada

Perpustakaan Universitas Sanata Dharma Karya Ilmiah saya yang berjudul :



Beserta perangkat yang diperlukan (bila ada). Dengan demikian, saya

memberikan kepada Universitas Sanata Dharma hak untuk memyimpan,

mengalihkan ke dalam bentuk media lain, mengelolanya dalam bentuk media

lain, mengelolanya dalam bentuk pangkalan data, mendstribusikan secara

terbatas dan mempublikasikan secara terbatas dan mempublikasikan di Internet

atau media lain untuk kepentingan akademis tanpa perlu izin dari saya maupu

memberi royalti kepada saya selama mencantumkan nama saya sebagai penulis

Demikian perrnyataan ini saya buat dengan sebenarnya.

Yang menyatakan,



viii

ABSTRAK

Berdasarkan data obat-obatan yang beredar di Indonesia diambil dari buku ISO

volume 48 menujukan banyak sekali variasi kategori kegunaannya. Untuk itu

diperlukan pengelompokan obat berdasarkan kategori obat-obatan dari keterangan

indikasi masing-masing obat. Pembagian pengkategori obat berdasarkan kegunaan

obat-obatan. Oleh karena itu, dibutuhkan metode untuk memudahkan pengelompokan

obat-obatan menggunakan algoritma K-Means.

Dengan pendekatan pengklasteran K-Means, pembagian kelompok obat

berdasarkan indikasinya. Pada penelitian ini dilakukan pengklasteran obat-obatan

menggunakan algoritma K-Means.Menggunakan K-means bertujuan untuk

memudahkan pegelompokan kategori obat-obatan berdasarkan keterangan indikasi

obat. Hasilnya adalah sebuah gambaran yang menunjukan pengelompokan obat

bedasarkan keterangan indikasi obat.

Dari penelitian yang dilakukan diperoleh bahwa hasil penentuan centroid (titik

pusat) pada tahap awal algoritma K-Means sangat berpengaruh terhadap hasil Cluster

seperti pada hasil pengujian data di atas dengan centroid yang berbeda menghasilkan

hasil yang berbeda juga.

Kata kunci : Pengelompokan, Data Mining, Cluster, Algoritma K-Means


ix

ABSTRACT

Based on data on medicines that are based in Indonesia, taken from the ISO

volume 48 book, it shows that there are many variations in their use categories. For this

reason, it is necessary to classify drugs based on drug categories from the indicative

information of each drug. The division of drugs is based on the use of drugs. Therefore,

a method is needed to facilitate the grouping of drugs using the K-Means algorithm.

With the K-Means Cluster approach, the division of drug groups is based on

their indications. In this research, Cluster of drugs uses the K-Means algorithm. Using

K-means aims to simplify the grouping of categories of drugs based on drug indication

information. The result is a picture that shows the grouping of drugs based on drug

indication information.

From the research conducted it was found that the results of the determination

of the centroid (center point) in the early stages of the K-Means algorithm are very

influential on the results of the Cluster as in the results of testing the data above with

different centroids producing different results as well.

Keywords: Grouping, Data Mining, Clusters, K-Means Algorithm


x

KATA PENGANTAR

Puji Syukur kepada Tuhan yang Maha Esa atas segala berkat dan karunia-Nya,

sehingga penulis dapat menyelesaikan tugas akhir yang berjudul “Cluster Obat

Berdasarkan Keterangan Indikasi Obat Menggunakan Algoritma K-Means”. Tugas

akhir ini merupakan salah satu mata kuliah wajib dan sebagai yyarat akademik untuk

memperoleh gelar sarjana komputer Program Studi Informatika Universitas Sanata

Dharma Yogyakarta.

Penulis menyadari bahwa selama proses penelitian dan penyusunan laporan tugas akhir

ini, banyak pihak yang telah membantu penulis, sehingga pada kesempatan ini penulis

ingin mengucapkan banyak terimakasih kepada :

1. Tuhan Yang Maha Esa, yang telah memberikan pertolongan dan kekuatan

dalam proses pembuatan tugas akhir.

2. Robertus Adi Nugroho, S.T., M.Eng. selaku dosen pembimbing tugas akhir,

atas kesabarannya dan nasehat dalam membimbing penulis, meluangkan

waktunya, memberi dukungan , motivasi serta saran yang sangat membantu

penulis.

3. Sudi Mungkasi, S.Si., M.Math.Sc., Ph.D. selaku Dekan Fakultas Sains dan

Teknologi, atas bimbingan, kritik, dan saran yang telah diberikan kepada

penulis.

4. Robertus Adi Nugroho, S.T., M.Eng. selaku Ketua Program Studi Informatika

dan selaku dosen pembimbing akademik atas bimbingan, kritik, dan saran yang

telah diberikan kepada penulis.

5. Keluarga tercinta , kedua orang tua Theo Sulistyo dan Sri Mulyani, serta adik

adik Melly Listiani dan Stefanie Christine.


xi

6. PMK Apostolos, PMK Oikumene, PMK Efata, PMK Ebenhaezer yang selalu

mendukung, memberi semangat, dan doa.

7. Teman Young Men Bang Erwin,Pak Yohanes, Ndan Hans, Yoga ,Joshua Brian,

Lukas, Nico, Jojo, Yosabel, Hapsa yang selalu memberi semangat untuk segera

menyelesaikan TA.

8. Teman-teman Taekwondo USD Sb. Kartono, Sb. Angga, Sb. Opang,Sb. Alan,

Sb Andre, Fink, Erin, Rara, Bubus dan teman-teman lain yang selalu

memberikan dukungan semangat dan motifasi.

9. Teman-teman Informatika angkatan 2015 Bima, Tebe, Willy, dan semua teman

yang tidak dapat disebutkan satupersatu yang selalu memberi bantuan,

semangat dan motivsi sehingga penulis dapat menyelesaikan tugas akhir ini.

10. Anggia, Intan, Bowo, Laurent yang selalu memberi dukungan dan semangat

serta selalu mendengarkan keluh kesah saat penulis menghadapi kendala proses

penulisan TA.

Penulis menyadari bahwa masih banyak kekurangan dalam penyusunan

tugas akhir ini . Saran dan kritik sangat diharapkan untuk perbaikan yang akan

datang.

Penulis,



xii

DAFTAR ISI

HALAMAN PENGESAHAN ................................................................................. iii

HALAMAN PERSETUJUAN ................................................................................ iv

MOTTO .................................................................................................................... v

PERNYATAAN KEASLIAN KARYA .................................................................. vi

LEMBAR PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK

KEPENTINGAN AKADEMIS .............................................................................. vii

ABSTRAK ............................................................................................................ viii

ABSTRACT ............................................................................................................ ix

KATA PENGANTAR .............................................................................................. x

DAFTAR ISI .......................................................................................................... xii

Daftar Tabel ............................................................................................................ xv

Daftar Gambar ....................................................................................................... xvi

BAB I PENDAHULUAN ........................................................................................ 1

1.1. Latar Belakang ................................................................................................... 1

1.2. Rumusan masalah............................................................................................... 2

1.3. Tujuan Penelitian ............................................................................................... 2

1.4. Batasan Masalah................................................................................................. 2

1.5. Manfaat Penelitian ............................................................................................. 2

1.6. Sistematika Penulisan ........................................................................................ 3

BAB II LANDASAN TEORI .................................................................................. 5

2.1. Data Mining ....................................................................................................... 5

2.1.1 Pengertian Data Mining .............................................................................. 5

2.1.2 Pengelompokan Data Mining ..................................................................... 5

2.1.3 Tahapan Data Mining ................................................................................. 8

2.3. Information Retrieval ................................................................................... 11

2.3.1 Pengertian Information Retrieval.............................................................. 11

2.3.2 Peranan Information Retrieval .................................................................. 11


xiii

2.4. Silhouette Coefficient ................................................................................... 12

2.4.1 Pengertian Silhouette Coefficient .............................................................. 12

BAB III METODE PENELITIAN ....................................................................... 14

3.1 Tahap Penelitian ........................................................................................... 14

3.2 Gambaran Proses K-Mean Cluster ............................................................... 15

3.2.1 Data .............................................................................................................. 15

3.2.2 Case Folding ................................................................................................. 17

3.2.3 Tokenisasi ..................................................................................................... 17

3.2.4 Pembersihan Stopword ................................................................................. 17

3.2.5 Tranformasi data ........................................................................................... 19

BAB IV IMPLEMENTASI SISTEM DAN ANALISIS HASIL ........................... 28

4.1 IMPLEMENTASI .............................................................................................. 28

4.2 Tabel Hasil Cluster percobaan 1 ........................................................................ 30

4.2.1 Uji Silhouette ................................................................................................. 32


4.3.1. Uji Silhouette ................................................................................................ 35


4.4.1 Uji Silhouette ................................................................................................. 36


4.5.1 Uji Silhouette ................................................................................................. 38


4.6.1 Uji Silhouette ................................................................................................. 40


4.7.1 Uji Silhouette ................................................................................................. 42

4.8 Tabel Hasil Cluster percobaan 7(Tanpa IDF) .............................................. 43

4.8.1 Uji Silhouette ................................................................................................. 44

4.9 Tabel Hasil Cluster percobaan 8(Tanpa IDF) .............................................. 44

4.9.1 Uji Uji Silhouette ........................................................................................... 46

4.10 Tabel Hasil Cluster percobaan 9(Tanpa IDF).................................................. 46


xiv

4.10.1 Uji Silhouette ............................................................................................... 48

4.11 Tabel Hasil Cluster percobaan 10 (Tanpa IDF)............................................... 48

4.11.1 Uji Silhouette ............................................................................................... 50

4.12 Tabel Hasil Cluster percobaan 11(Tanpa IDF) ................................................ 50

4.12.1 Uji Silhouette ............................................................................................... 51

4.13 Tabel Hasil Cluster percobaan 12 (Tanpa IDF)............................................... 51

4.5.1 Uji Silhouette ................................................................................................. 53

BAB V PENUTUP ................................................................................................. 54

DAFTAR PUSTAKA ............................................................................................. 55

LAMPIRAN ........................................................................................................... 56


xv

Daftar Tabel

Tabel 3. 1 Data Set Obat ............................................................................................. 16

Tabel 3. 2 Hasil Pembersihan Stopword ..................................................................... 18

Tabel 3. 3 Tabel Data Obat ......................................................................................... 19

Tabel 3. 4 Contoh Tabel Term Frekuensi (TF) ........................................................... 20

Tabel 3. 5 Dokumen Frekuensi(df) ............................................................................. 21

Tabel 3. 6 Tabel Inverse Document Frekuency (idf) .................................................. 22

Tabel 3. 7 Tabel TF-IDF ............................................................................................. 23

Tabel 3. 8 Tabel TF-IDF ............................................................................................. 24

Tabel 3. 9 Hasil Perhitungan Clustering Kmeans ....................................................... 25

Tabel 3. 10 Hasil Pengelopokan Jarak antara Cluster 1 dan Cluster2 ........................ 25

Tabel 3. 11 Hasil Perhitungan SI ................................................................................ 27

Tabel 4. 1 Tabel Hasil Cluster percobaan 1 ................................................................ 31



Tabel 4. 4 Hasil Cluster Percobaan 4 .......................................................................... 37






Tabel 4. 10 Hasil Cluster Percobaan 10 ...................................................................... 48




xvi

Daftar Gambar

Gambar 3. 1 Proses K-Mean Cluster .......................................................................... 15

Gambar 4. 1 Gui Sistem Keseliruhan .......................................................................... 28

Gambar 4. 3 INPUT DATA OBAT ............................................................................ 29

Gambar 4. 5 Hasil Proses K-Mean Cluster ................................................................. 29

Gambar 4. 7 Tampilan Tabel Gui Tabel Term(kata)................................................... 30

Gambar 4. 8 Grafik hasil uji kekuatan Cluster percobaan 1-6 ................................... 42

Gambar 4. 9 Grafik Hasil Uji Kekuatan Cluster Percobaan 7-12 .............................. 53


1

BAB I

PENDAHULUAN

1.1.Latar Belakang

Menurut Undang-Undang Kesehatan No. 36 tahun 2009, obat adalah bahan

atau paduan bahan, termasuk produk biologi yang digunakan untuk mempengaruhi

atau menyelidiki sistem fisiologi atau keadaan patologi dalam rangka penetapan

diagnosis, pencegahan, penyembuhan, pemulihan, peningkatan kesehatan dan

kontrasepsi, untuk manusia. Selain itu menurut Katzung (1997), obat dalam

pengertian umum adalah suatu substansi yang melaui efek kimianya membawa

perubahan dalam fungsi biologik. Masa kini obat sangat banyak jenisnya

jumlahnya mencapai ribuan bahkan jutaan jenis obat.

Selama bertahun-tahun, perusahaan-perusahaan farmasi secara berkelanjutan

terus melakukan inovasi menawarkan obat-obat baru, membantu mengobati

berbagai penyakit dan mengurangi penderitaan pasien. Namun demikian, berbagai

macam penyakit baru juga terus bermunculan, sehingga seluruh anggota IPMG

(International Pharmaceutical Manufacturers Gruop) adalah organisasi nirlaba

beranggotakan 25 perusahaan farmasi multinasional berbasis riset yang beroperasi

di Indonesia, yang berkomitmen pada penelitian, pengembangan, pembuatan serta

pemasaran obat-obatan berkualitas tinggi. IPMG berkomitmen untuk menemukan

obat-obat baru untuk menyembuhkan penyakit-penyakit tersebut. Karena sangat

banyak obat yang telah beredar dipasaran dan dijual secara umum dikalangan

masyarakat masyarakat dibingugkan oleh banyaknya nama obat. Oleh karena itu

diperlukan sistem dapat membantu pekerjaan manusia dalam mengelompokan

kategori obat yang sesuai dengan indikasi dari obat itu. Indikasi adalah keterangan

kegunaan obat yang tertulis dalam etiket obat. Pengkategorian yang dimaksud

meliputi: Analgesik (Obat nyeri), anastetik, antibiotik, obat kulit, vitamin, hormon

dll. Pengelompokan tersebut dapat menggunakan algoritma K – Means. Saya


2

memilih algoritma K-Means karena algoritma ini banyak digunakan untuk

mengelompokkan data.

Dengan data yang sudah dikelompokkan menggunakan algoritma K-Means

diharapkan dapat mempermudah masyarakat dalam mengetahui pengkategorian

obat berdasarkan indikasi obat.

1.2.Rumusan masalah

Berdasarkan latar belakang yang ada dapat dirumuskan masalah yaitu:

1. Bagaimana membangun sistem K-Means yang dapat mengelompokan nama

obat bedasarkan keterangan indikasinya?

2. Seberapa kekuatan hasil Cluster K-Means dapat mengelompokan nama

obat berdasarkan indikasinya, diuji kekuatannya dengan Silhouette

Coefficient?

1.3. Tujuan Penelitian

Adapun Tujuan dai penelitian ini sebagai berikut :

1. Melakukan pengkategorian obat berdasarkan keterangan indikasinya

2. Clustering indikasi obat berdasarkan indikasinya menggunakan algoritma

K-Means.

1.4.Batasan Masalah

Dalam batasan masalah ini, penulis membatasi masalah yang perlu yaitu :

1. Jumlah data set yang diambil dari ISO (vol 48) sebanyak 70 nama obat.

2. Pengkategorian yang diteliti berdasarkan keterangan indikasi ISO volume

48 meliputi: saluran nafas, saluran cerna, anti hipertensi, analgesik non

narkotik, topikal untuk kulit, antimalaria, antiseptik dan disinfektan.

3. Cluster tidak menggunakan lematisation

1.5.Manfaat Penelitian

Adapun manfaat dari penelitian ini sebagai berikut :


3

1. Bagi dunia kesehatan : Karena banyak sekali jenis dan nama obat-obatan,

maka sistem ini dapat membantu untuk mempermudah mengkategorikan

berdasarkan keterangan indikasinya

2. Bagi dunia penelitian : Ini merupakan teknologi masa kini yang dapat

memberikan inspirasi untuk dapat mengembangkan system pengkategorian.

3. Bagi masyarakat : membantu masyarakat dalam menggolongkan obatan

yang sangat banyak

4. Bagi dunia pendidikan: dapat mengetahui dapat membuat program untuk

mengelompokan data obat.

1.6.Sistematika Penulisan

Bab I. Pendahuluan

Dalam bab ini tentang latar belakang masalah, Persamaanan masalah, tujuan

penelitian, batasan masalah, dan sistematika penulisan.

Bab II. Landasan Teori

Dalam bab ini berisi tentang teori yang dapat menunjang penelitian yaitu berupa

pengertian data mining, pengertian information retrieval, proses datamining, dan

algoritma K-Means.

Bab III. Metode Penelitian

Dalam bab ini berisi tentang cara penerapan konsep dasaryang telah diuraikan pada

BabII untuk menganalisis dan merancang sistem sesui tahap – tahap penyelesaian

masalah tersebut dengan menggunakan algoritma K-Means.

Bab IV. Implementasi dan Analisa Sistem

Dalam bab ini berisi tentang implementasi ke program komputer berdasarkan hasil

perancangan yang dibuat, analisis perangkat lunak yang telah dibuat.


4

Bab V. Penutup

Dalam bab ini bab ini berisi tentang kesimpulan dan saran dari seluruh penulisan

tugas akhir.


5

BAB II

LANDASAN TEORI

Pada Bab II ini akan dipaparkan mengenai landasan teori yang medukung

penelitian yang dilakukan oleh penulis. Dalam Bab ini akan dijelaskan pengertian dan

metode yang akan digunakan oleh penulis.

2.1. Data Mining

2.1.1 Pengertian Data Mining

Data Mining adalah proses yang menggunakan teknik statistik,

matematika, kecerdasan buatan, machine learning untuk mengekstraksi

dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang

terkait dari berbagai database besar (Turban dkk. 2005). Data Mining

sering digunakan untuk mencari informasi dari database yang sangat

besar. Data Mining ialah suatu proses menemukan sesuatu yang

bermakna dari suatu korelasi baru, pola dan tren yang ada dengan cara

memilah-milah data berukuran besar yang disimpan dalam repositori,

menggunakan teknologi pengenalan pola serta teknik matematika dan

statistik. Data Mining juga dapat diartikan sebagai suatu proses

ekstraksi informasi berguna dan potensial dari sekumpulan data yang

terdapat secara implisit dalam suatu basis data.

2.1.2 Pengelompokan Data Mining

Data mining merupakan metode yang memiliki beberapa kelompok,

(Larose 2005). Adapun beberapa penglompokan data mining sebagai

berikut:

3.2.1 Deskripsi

Terkadang peneliti dan analis secara sederhana ingin

mencoba mencari cara untuk menggambarkan pola dan


6

kecenderungan yang terdapat dalam data. Sebagai contoh, petugas

pengumpulan suara mungkin tidak dapat mengumpulkan keterangan

atau fakta bahwa siapa yang tidak cukup profesional akan sedikit

didukung dalam pemilihan presiden. deskripsi dari pola dan

kecenderungan sering memberikan kemungkinan penjelesan untuk

suatu pola atau kecenderungan.

3.2.2 Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali variabel target

estimasi lebih kearah numerik daripada ke arah kategori. Model

dibangun dengan record lengkap yang menyediakan nilai dari

variabel target sebagai nilai prediksi. Sebagai contoh, akan dilakukan

estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan

umur pasien, jenis kelamin, indeks berat badan, dan level sodium

darah. Hubungan antara tekanan darah sistolik dan nilai variabel

prediksi dalam proses pembelajaran akan menghasilkan model

estimasi. Model estimasi yang dihasilkan dapat digunakan untuk

kasus baru lainnya.

3.2.3 Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali

bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang.

Contoh prediksi dalam bisnis dan penelitian adalah:

a. Prediksi harga beras dalam tiga bulan yang akan datang.

b. Prediksi persentase kenaikan kecelakaan lalu lintas tahun depan

jika batas bawah dinaikan.

Beberapa metode dan teknik yang digunakan dalam klasifikasi

dan estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk

prediksi.Klasifikasi


7

Dalam klasifikasi, terdapat terget variabel kategori. sebagai

contoh, penggolongan pendapatan dapat dipisahkan dalam tiga

kategori yaitu: pendapatan tinggi, pendapatan sedang, dan

pendapatan rendah.

Contoh lain klasifikasi dalam bisnis dan penelitian adalah:

a. Menentukan apakah suatu transaksi kartu kredit merupakan

transaksi yang curang atau bukan.

b. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah

merupakan suatu kredit yang baik atau buruk.

c. Mendiagnosis penyakit seorang pasien untuk mendapatkan

termasuk kategori penyakit apa.

3.2.4 Pengklusteran

Pengklusteran merupakan pengelompokan record, pengamatan,

atau memperhatikan dan membentuk kelas objek-objek yang

memiliki kemiripan. Kluster adalah kumpulan record yang memiliki

kemiripan satu dengan yang lainnya dan tidak memiliki kemiripan

dengan record-record dalam kluster lain. Pengklusteran berbeda

dengan klasifikasi yaitu tidak adanya variabel target dalam

pengklusteran. pengklusteran tidak mencoba untuk melakukan

klasifikasi, mengestimasi, atau memprediksi nilai dari variabel

target. Akan tetapi, algoritma pengklusteran mencoba untuk

melakukan pembagian terhadap keselurahan data menjadi kelompok-

kelompok yang memiliki kemiripan (homogen), yang mana

kemiripan record dalam suatu kelompok akan bernilai maksimal,

sedangkan kemiripan dengan record dalam kelompok lain akan

bernilai minimal. Contoh pengklusteran dalam bisnis dan penelitian

adalah: Mendapatkan kelompok-kelompok konsumen untuk target


8

pemasaran dari suatu produk sebuah perusahaan yang tidak memiliki

dana pemasaran yang besar.

a. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan

terhadap perilaku finansial dalam baik maupun mencurigakan.

b. Melakukan pengklusteran terhadap ekspresi dari en, untuk

mendapatkan kemiripan perilaku dari gen dalam jumlah besar.

3.2.5 Asosiasi

Tugas asosiasi dalam data mining adalah menemukan atribut yang

muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut

analisis keranjang pasar. Contoh asosiasi dalam bisnis dan penelitian

adalah:

a. Meneliti jumlah pelanggan dari perusahaan telekomunikasi

seluler yang diharapkan untuk memberikan respon positif

terhadap penawaran upgrade layanan yang diberikan.

b. Menemukan barang dalam supermarket yang dibeli secara

bersamaan dan barang yang tidak pernah dibeli secara

bersamaan.

2.1.3 Tahapan Data Mining

Tahapan yang dilakukan pada proses data mining diawali dari seleksi

data dari data sumber ke data target, tahap preprocessing untuk

memperbaiki kualitas data, transformasi, data mining serta tahap

interpretasi dan evaluasi yang menghasilkan output berupa pengetahuan

baru yang diharapkan memberikan kontribusi yang lebih baik.


9

1. Data selection

Pemilihan (seleksi) data dari sekumpulan data operasional perlu

dilakukan sebelum tahap penggalian informasi dalam KDD dimulai.

Data hasil seleksi yang digunakan untuk proses data mining,

disimpan dalam suatu berkas, terpisah dari basis data operasional.

2. Pre-processing / cleaning

Sebelum proses data mining dapat dilaksanakan, perlu

dilakukan proses cleaning pada data yang menjadi fokus KDD.

Proses cleaning mencakup antara lain membuang duplikasi data,

memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada

data.

3. Transformation

Coding adalah proses transformasi pada data yang telah dipilih,

sehingga data tersebut sesuai untuk proses data mining. Proses

coding dalam KDD merupakan proses kreatif dan sangat tergantung

pada jenis atau pola informasi yang akan dicari dalam basis data.

4. Data Mining

Data mining adalah proses mencari pola atau informasi menarik

dalam data terpilih dengan menggunakan teknik atau metode

tertentu. Teknik, metode, atau algoritma dalam data mining sangat

bervariasi. Pemilihan metode atau algoritma yang tepat sangat

bergantung pada tujuan dan proses KDD secara keseluruhan.

5. Interpretation / evalution

Pola informasi yang dihasilkan dari proses data mining perlu

ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang

berkepentingan. Tahap ini merupakan bagian dari proses KDD yang

disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola


10

atau informasi yang ditemukan bertentangan dengan fakta atau

hipotesis yang ada sebelumnya.

2.2. K-Means

K-Means Cluster merupakan salah satu metode Cluster analysis non

hirarki yang berusaha untuk mempartisi objek yang ada kedalam satu atau

lebih Cluster atau kelompok objek berdasarkan karakteristiknya, sehingga

objek yang mempu nyai karakteristik yang sama dikelompokan dalam satu

Cluster yang sama dan objek yang mempunyai karakteristik yang berbeda

dikelompokan kedalam Clusteryang lain. K-Means merupakan salah satu

metode Cluster yang sering digunakan dalam pengelompokan yang belum

diketahui jumlah jumlah kelompoknya.

Algoritma K-Means dimulai dengan pemilihan secara acak titik pusat, K

disini merupakan banyaknya Cluster yang ingin dibentuk. Kemudian tetapkan

nilai-nilai K secara random, untuk sementara nilai tersebut menjadi pusat dari

Cluster atau biasa disebut dengan centroid secara random, “means”. Hitung

jarak setiap data yang ada terhadap masing-masing centroid menggunakan

Persamaan Euclidean hingga ditemukan jarak yang paling dekat dari setiap

datadengan centroid. Klasifikasikan setiap data berdasarkakedekatannya

dengan centroid. Lakukan langkah tersebut hingga nilai centroid tidak berubah

Langkah-langkah melakukan Cluster K-Mean:

1. Menentukan jumlah Cluster titik pusat.

2. Melakukan alokasi data kedalam Cluster secara random.

3. Melakukkan alokasi semua data/objek ke Cluster terdekat. Kedekatan dua

objek ditentukanberdasarkan jarak kedua objek tersebut. Demikianjuga

kedekatan suatu data ke Cluster tertentu ditentukan jarak antara data ke tiap

pusat Cluster. Jarak paling dekat antara satu data dengan satu Cluster

tertentu akan menentukan suatu data masuk dalam Cluster mana.


11

Persamaan menghitung jarak dengan euclidiance distance :

𝑑(𝑖, 𝑗) = √(𝑥1𝑖−𝑥1𝑗)2

+ (𝑥2𝑖 − 𝑥2𝑗)2

… + (𝑥𝑘𝑖 − 𝑥𝑘𝑗) (2.1)

Keterangan :

𝑑(𝑖,𝑗)= Jarak data keike pusat Cluster j

𝑥𝑖𝑗 = Data ke i pada atribut data ke k

𝑥𝑘𝑗 = Titik pusat ke j pada atribut ke k

2.3. Information Retrieval

2.3.1 Pengertian Information Retrieval

Information Retrieval adalah ilmu yang mempelajari prosedur-

prosedur dan metode-metode untuk menemukan kembali informasi

yang tersimpan dari berbagai sumber (resources) yang relevan atau

koleksi sumber informasi yang dicari atau dibutuhkan. Dengan tindakan

index (indexing), panggilan (searching), pemanggilan data kembali

(recalling)

2.3.2 Peranan Information Retrieval

Sekarang ini dengan mudah kita dapat jumpai kegunaan dari

Information Retrieval seperi dalam mesin pencarian perpustakaan ,

diapotik, ataupun yang sering diginakan oleh masyarakat yaitu mesin

Google , itu semua berkat adanya peranan Information Retrieval.

Berikut merupakan peranan Information Retrieval:

1. Menganalisis isi sumber informasi dan pertanyaan pengguna.

2. Mempertemukan pertanyaan pengguna dengan sumber informasi

untuk mendapatkan dokumen yang relevan.

Tahapan pengolahan data dengan tf. Query yang dimasukkan oleh

user juga akan diolah melalui beberapa proses yaitu :


12

1. Melakukan preprosesing terhadap query yang dimasukkan user yaitu

menghilangkan stopword.

2. Setelah dilakukan preprocessing, maka langkah selanjutnya adalah

mengambil tiap kata/term dan

3. Menghitung jumlah kemunculannya pada dokumen tertentu.

4. Dilakukan pembobotan kata menggunakan Persamaan Tf.

5. Tahapan indexing dilakukan untuk menyimpan tiap kata/term ke

dalam database beserta bobot tiap term. Hal ini dilakukan dengan

tujuan supaya query dengan kata yang sama tidak perlu dilakukan

perhitungan lagi.

Term Frequency adalah d dan dilambangkan dengan tft, d.

Pendekatan paling sederhana dari konsep ini adalah dengan menyatakan

bobot suatu kata t sebagai jumlah kemunculannya pada dokumen d.

Sebagai contoh, jika dalah suatu dokumen, kata plagiat muncul

sebanyak 10 kali maka nilai 𝑇𝐹 adalah 10.

Persamaan perhitungan TF

𝑇𝐹(𝑑, 𝑡) = 𝑓(𝑑, 𝑡) (2.2)

Keterangan :

f(d,t) : Kemunculan kata t dalam dokumen d

2.4. Silhouette Coefficient

2.4.1 Pengertian Silhouette Coefficient

Silhouette coefficient digunakan untuk melihat kualitas dan

kekuatan Cluster, seberapa baik suatu objek ditempatkan dalam suatu

Cluster. Tahapan perhitungan Silhouette coefficient adalah sebagai

berikut (Handoyo, et al., 2014):


13

1. Hitung rata-rata jarak dari suatu data misalkan i dengan semua data lain

yang berada dalam satu Cluster .

𝑎(𝑖) = 1|𝐴| − 1𝛴 ∈ 𝐴, 𝑗 ≠ 𝑖𝑑(𝑖, 𝑗)𝑗 (2.4)

Dengan j adalah data lain dalam satu Cluster A dan d(I,j) adalah jarak

antara data I dengan j.

2. Hitung rata-rata jarak dari data i tersebut dengan semua data diCluster lain,

dan diambil nilai terkecilnya.

𝑑(𝑖, 𝐶) = 1|𝐴|𝛴𝑗 ∈ ∁ 𝑑(𝑖, 𝑗) 𝑗 (2.5)

Dengan d (I, C) adalah jarak rata-rata data I dengan semua objek pada

Cluster lain C dimana A ≠C.

𝑏(𝑖) = 𝑚𝑖𝑛𝐶 ≠ 𝐴 𝑑(𝑖, 𝐶) (2.6)

3. Persamaan Silhouette coefficient adalah:

𝑠(𝑖) = (𝑏(𝑖) − 𝑎(𝑖))/𝑚𝑎𝑥 (𝑎(𝑖), 𝑏(𝑖)) (2.7)

Dengan s(i) adalah semua rata-rata pada semua kumpulan data. Diimpl

mentasikan menggunakan metode improved K-Means.

4. Implementasi sitem merupakan penerapan dari studi literatur yang telah

dilakukan dan penerapan sistem yang telah dirancang.

5. Pengujian adalah jaminan kualitas dari perangkat lunak pada sistem yang

telah dibangun serta untuk mempresentasikan kajian pokok dari

spesifikasi, desain dan pengkodean.


14

BAB III

METODE PENELITIAN

Berdasarkan pada landasan teori yang berada pada Bab II yang telah disampaikan

oleh penulis. Pada bab ini menjelaskan cara kerja algoritma yang digunakan danproses

yang akan dibangun untuk melakukan pengelompokan.

3.1 Tahap Penelitian

Dalam subab ini akan dibahas tentang langkah langkah yang dilalui dalam

proses penelitian. Adapun tahapan yang dilali adalah sebagai berikut:

1. Tahap pencarian, pada tahapan ini pencarian data set didapatkan melalui buku

ISO (Informasi Spesialite Obat Volume 48), terbit pada tahun 2013.

2. Pencarian informasi mengenai segala sesuatu yang berhuungan dengan

penelitian ini.

3. Pengumpulan data

4. Menganalisa data yang sudah didapatkan, dan membuat perancangan

sistemnya.

5. Mengimplementasikan perancangan yang sudah dilakukan ke dalam perangkat

lunak.

6. Melakukan pengujian terhadap sistem dengan memasukan data .

7. Melakukan analisa terhadap sistem yang telah diuji menggunakan algoritma

Silhouete ceficient


15

3.2 Gambaran Proses K-Mean Cluster

Di bawah ini merupakan proses penelitian yang dilakukan:

GAMBAR 3. 1 PROSES K-MEAN CLUSTER

Pada gambar 3.1 Proses penelitian dimulai dari mengumpulkan data set

yang berupa teks dari buku ISO (Informasi Spesialite Obat) Volume 48. Kemudian

memasuki tahap yang kedua yaitu menguraikan kalimat menjadi beberapa kata.

Pada tahapan ketiga proses yang dilakukan adalah menyeleksi kata yang yang

terdapat pada daftar stopword. Tahapan selanjutnya merupakan pembersihan data,

kata yang telah melewati proses seleksi dan masih terdapat duplikasi akan

dihilangkan pada tahapan ini. Berikutnya dalah pembentukan TF(TermFrekuency)

matrix yang digunakan untuk pembobotan kata. Setelah itu, dilakukan

pembentukan TF-IDF matriks. Setelah proses tokenisasi, pembersihan stopword,

pembersihan data, pembentukanTF dan pembentukan TF-IDF matrik kemudian

dilakukan klusterisasi K-Means.

3.2.1 Data

Data yang digunakan adalah data dari buku Informasi Spesialite Obat

volume 48. Buku ISO merupakan buku direktori obat- obatan terpercaya

yang beredar di Indonesia.Proses pengumpulan data diambil dari buku ISO

sebanyak 7 kategori meliputi saluran nafas, saluran cerna, anti hipertensi,

analgesik non narkotik, topikal untuk kulit, antimalaria, antiseptik dan

disinfektan. Setiap kategori diambil data masing masing 10 data obat

sehingga dalam penelitian ini menggunakan data sebanyak 70.


16

Berikut ini merupakan beberapa data asli dari buku ISO vol 48. Lebih

lengkapnya dapat dilihat pada Lampiran 1.

Tabel 3. 1 Data Set Obat

No NAMA INDIKASI

1 AMINOPHYLLINE MERINGANKAN DAN

MENGATASI SERANGAN ASMA

BRONKIAL

2 ASMANO ASMA BRONKIAL BRONKITIS

ASMATIK BRONKITIS KRONIK

DENGAN ENFISEMA

BRONKOSPASME EFISEMATOSA

ASMA DENGAN RINITIS ALERGI

3 ASMACEL ASMA BRONKIAL BRONKITIS

KRONIS ENFISEMA

4 ASMADEX ASMA BRONKIAL ASMA

BRONKITIS KEJANG BRONKUS

ALERGI

5 ASCOLEN ASMA BRONKIAL BRONKITIS

ASMATIS DAN ENFISEMA

PULMONUM

6 AZMACON ASMA BRONKITIS KRONIS

ENFISEMA

7 ASTHERIN BATUK BERDAHAK ASMA

BRONKIAL BRONKITIS

ENFISEMA

8 ASTOP ASMA BRONKIAL BRONKITIS

KRONIK BRONKITIS KRONIK

ENFISEMA PULMONUM

9 BIMADRYL MEREDAKAN BATUK

BERDAHAK

10 ATAROC DISPNEA KARENA ASMA

BRONKIAL BRONKITIS AKUT

DAN KRONIK


17

3.2.2 Case Folding

Tidak semua dokumen teks konsisten dalam menggunakan huruf

kapital. Oleh karena itu, tahapan case folding ini merupakan tahapan

mengkonversi keseluruhan teks dalam dokumen kebentuk standar.

Sebagai contoh: Meringankan Dan Mengatasi Serangan Asma Bronkial

dikonversi menjadi MERINGANKAN DAN MENGATASI

SERANGAN ASMA BRONKIAL.

3.2.3 Tokenisasi

Tokenisasi merupakan tahapan memecah data dalam bentuk teks dari

kalimat menjadi kata. berikut adalah contoh kalimat yang akan

dilakukan proses tokenisasi: “meringankan dan mengatasi serangan

asma bronkial”. Dari kalimat diatas dipecah menjadi beberapa kata,

{meringankan | dan | mengatasi | serangan | asma | bronkial} diperoleh

6 kata.

3.2.4 Pembersihan Stopword

Data yang telah melewati tokenisasi dilakukan pembersihan stopword

(kata sambung). Adapun daftar stopword antara lain: dan, dengan, atau,

dimana, pada, secara, seperti, oleh, telah, terhadap, karena, akibat, yang,

sebagai, untuk, disebabkan. Dari contoh proses tokenisasi sebelumnya

diperoleh, {meringankan | dan | mengatasi | serangan | asma | bronkial}

diperoleh 6 kata. Dilakukan pembersihan stopword sehimgga diperoleh

hasil: asma | bronkial


18

Tabel 3. 2 Hasil Pembersihan Stopword

No NAMA INDIKASI

1 AMINOPHYLLINE

MERINGANKAN | MENGATASI |

SERANGAN | ASMA | BRONKIAL

2 ASMADEX

ASMA | BRONKIAL | ASMA | BRONKITIS

KEJANG | BRONKUS | ALERGI

3 ASMANO

ASMA | BRONKIAL | BRONKITIS |

ASMATIK | BRONKITIS | KRONIK |

ENFISEMA | BRONKOSPASME

EFISEMATOSA | ASMA | RINITIS |

ALERGI

4 ASCOLEN


ASMATIS | ENFISEMA | PULMONUM

5 ASTOP

ASMA | BRONKIAL | BRONKITIS

KRONIK | BRONKITIS | KRONIK |

ENFISEMA | PULMONUM

6 ASMACEL


KRONIS | ENFISEMA

7 AZMACON ASMA BRONKITIS KRONIS ENFISEMA

8 BIMADRYL MEREDAKAN | BATUK | BERDAHAK

9 ASTHERIN

BATUK | BERDAHAK | ASMA |

BRONKIAL | BRONKITIS | ENFISEMA


19

No NAMA INDIKASI

10 ATAROC

DISPNEA | ASMA | BRONKIAL

BRONKITIS | AKUT KRONIK

3.2.1 Tranformasi data

Agar data diatas dapat diolah menggunakan Cluster K-Means,

maka data dibuat pemodelan dengan angka menggunakan TF-IDF

Metode perhitungan

1. Menghitung Term Frekuensi

Term Frequency merupakan tahapan menghitung jumlah

frekuensi kemunculan term(t) pada dokumen (d).

Contoh:

pada dokumen1 terdapat indikasi obat asma bronkial maka sistem

akan menghitung jumlah kemunculan kata dalam dokume n tersebut.

Terdapat beberapa dokumen:

Tabel 3. 3 Tabel Data Obat

dok1 ASMA BRONKIAL

dok2

ASMA BRONKIAL BRONKITIS ASMATIK BRONKITIS

KRONIK ENFISEMA BRONKOSPASME EFISEMATOSA ASMA

RINITIS ALERGI

dok3 ASMA BRONKIAL BRONKITIS KRONIS ENFISEMA

dok4

ASMA BRONKIAL ASMA BRONKITIS KEJANG BRONKUS

ALERGI


20

dok5

ASMA BRONKIAL BRONKITIS ASMATIS ENFISEMA

PULMONUM

dok6 HIPERTENSI ANGINA

dok7 HIPERTENSI ANGINA

dok8 HIPERTENSI ANGINA STABIL ANGINA VARIAN

dok9 HIPERTENSI

dok10 HIPERTENSI ANGINA STABIL VARIAN

Tabel 3. 4 Contoh Tabel Term Frekuensi (TF)

Term1 Term2 Term4 …. Term 19

DOKUMEN ALERGI ANGINA ASMA …. VARIAN

dok1 0 0 1 … 0

dok2 1 0 2 … 0

dok3 0 0 1 … 0

dok4 1 0 2 … 0

…. … … … … …

10 0 1 0 … 1

2. Menghitung dokumen frekuensi

Document frequency (df) adalah banyaknya dokumen dimana suatu

term (t) muncul. Pada tahapan ini menghitung banyaknya dokumen

dimana suatu kata muncul. Pada Gambar 3.6 ditampilkan term alergi

dalam 2 dokumen.


21

Tabel 3. 5 Dokumen Frekuensi(df)

Term DF

ALERGI 2

ANGINA 4

ASMA 5

ASMATIK 1

ASMATIS 1

BRONKIAL 5

BRONKITIS 4

BRONKOSPASME 1

BRONKUS 1

EFISEMATOSA 1

ENFISEMA 2

HIPERTENSI 5

KEJANG 1

KRONIK 1

KRONIS 1

PULMONUM 1

RINITIS 1

STABIL 2

VARIAN 2


22

3. Perhitungan IDF

Setelah pencarian dengan df kemudian dilanjutkan dengan IDF yaitu

pembobotan terbalik, dokumen yang hanya memiliki frekunsi lebih

kecil akan diberi bobot lebih tinggi.

Persamaan IDF

𝑖𝑑𝑓 = (𝑁

𝑑𝑓) (3.1)

Keterangan:

𝑁 =jumlah keseluruhan dokumen

𝑑𝑓 = dokumen frekuensi

Tabel 3. 6 Tabel Inverse Document Frekuency (idf)

Term DF idf

ALERGI 2 𝐿𝑜𝑔10(10/2) = 0.69897

ANGINA 4 𝐿𝑜𝑔10(10/4) = 0.39794

ASMA 5 𝐿𝑜𝑔10(10/5) = 0.30103

ASMATIK 1 𝐿𝑜𝑔10(10/5) = 1

ASMATIS 1 𝐿𝑜𝑔10(10/1) = 1

BRONKIAL 5 𝐿𝑜𝑔10(10/5) = 0.30103

BRONKITIS 4 𝐿𝑜𝑔10(10/2) = 0.39794

BRONKOSPASME 1 𝐿𝑜𝑔10(10/1) = 1

BRONKUS 1 𝐿𝑜𝑔10(10/2) = 1

EFISEMATOSA 1 𝐿𝑜𝑔10(10/2) = 1

ENFISEMA 2 𝐿𝑜𝑔10(10/2) = 0.69897

HIPERTENSI 5 𝐿𝑜𝑔10(10/2) = 0.30103

KEJANG 1 1


23

4. Perhitungan TF-IDF

Langkah selanjutnya menghitung termfrekuensi * idf

Tabel 3. 7 Tabel TF-IDF


dok1 0 0 0.69897 … 0

dok2 0.00 0.00 0.00 … 0

dok3 0 0 0.30103 … 0

dok4 0.22184875 0 0.443697 … 0

…. … … … … …

10 0 0.39794 0 … 0.39794

5. Perhitungan K-Means

Langkah selanjutnya setelah menemukan TF*IDF mencari centroid (titik pusat),

kemudian dihitung dengan Persamaan (2.1) yang telah dijelaskan pada bab

sebelumnya.

Setelah semua data ditransformasi ke dalam bentuk angka, maka data

data tersebut dapat dikelompokan dengan algoritma K-Means Clustering.

KRONIK 1 1

KRONIS 1 1

PULMONUM 1 1

RINITIS 1 1

STABIL 2 0.69897

VARIAN 2 0.69897


24

Untuk dapat melakukan pegelompokan data-data tersebut menjadi beberap

klaster perlu dilakukan beberapa langkah, yaitu:

1. Tentukan jumlah Cluster yang diinginkan . Dalam penelitian ini

data-data yang ada akan dikelompokan menjadi dua Cluster.

2. Tentukan titik awal dari setiap Cluster dalam penelitian ini titik

awal ditentukan secara random dan didapat titik pusat dari setiap

Cluster. Pada penelitian ini diambil pusay Cluster dengan

nomor dokume dok1 dan dok4 dapat diihat pada Tabel 3.8

Tabel 3. 8 Tabel TF-IDF


dok1 0 0 0.69897 … 0

dok2 0.00 0.00 0.00 … 0

dok3 0 0 0.30103 … 0

dok4 0.22184875 0 0.443697 … 0

…. … … … … …

10 0 0.39794 0 … 0.39794

Setelah diketahui nilai k dan pusat Cluster awal selanjutnya mengukur

jarak antara pusat Cluster menggunakan euclidian distance , kemudian akan

didapatkan matrix jarak yaitu C1, dan C2 sebagai berikut:

Persamaan euclidian distance :

𝑑(𝑖, 𝑗) = √(𝑥1𝑖−𝑥1𝑗)2

+ (𝑥2𝑖 − 𝑥2𝑗)2

… + (𝑥𝑘𝑖 − 𝑥𝑘𝑗)


25

Perhitungan jarak data pertama dengan pusat Cluster pertama adalah :

d11=√(0 − 0) + (0 − 0) + ( 0.69897 − 0.69897) + ⋯ + (0 − 0)= 0

Perhitungan jarak data pertama dengan pusat Cluster kedua adalah :

d12=√(0 − 0) + (0 − 0.397) + ( 0.69897 − 0) + ⋯ + (0 − 0.397)=10.236

Tabel 3. 9 Hasil Perhitungan Clustering Kmeans

Centroid 1 Centroid 2 Cluster

Dok1 0.000 10.236 1

Dok2 2.000 6.000 1

Dok3 1.732 9.000 1

Dok4 0.000 10.000 1

Dok5 2.000 2. 828 1

Dok6 3.606 1.000 2

Dok7 3.162 0.000 2

Dok8 3.162 1.236 2

Dok9 2.828 2.000 2

Dok10 3.000 2.646 2

Jarak hasil perhitungan akan dilakukan perbandingan dan dipilih jarak

yang terdekat antara data dengan pusat Cluster, jarak ini menunjukan bahwa

data tersebut berada dalan satu kelompok dengan pusat Cluster terdekat. Berikut

ini merupakan matiks hasil pengelompokan grup, yang diberi nilai 1 berarti data

tersebut berada di dalam salah satu satu group(kelompok data).

Tabel 3. 10 Hasil Pengelopokan Jarak antara Cluster 1 dan Cluster2

Cluster 1 Cluster 2

Dok1 1

Dok2 1

Dok3 1

Dok4 1


26

Cluster 1 Cluster 2

Dok5 1

Dok6 1

Dok7 1

Dok8 1

Dok9 1

Dok10 1

Setelah diketahui anggota tiap tiap Cluster kemudian pusat Cluster baru

didapat dengan cara mengitung rata-rata Cluster yang berada dalam satu

Cluster. Hitung kembali jarak data dengan pusat Cluster baru. Ulangi langkah

tersebut hingga nilai rata-rata Cluster tetap atau batasi dalam iterasi tertentu.

6. Perhitungan validasi Silhouete.

Langkah selanjutnya merupakan tahapan menguji kekuatan hasil Cluster

yang telah terbentuk. Kekuatan hasil Cluster diuji kekuatannya dengan validasi

Silhouete. Untuk melakukan validasi adapun beberapa langkah sebagai berikut:

a. Menghitung jarak rata-rata setiap titik yang merupakan satu

kelompk Cluster menggunakan persamaan euclidiance distance.

b. Menghitung jarak yang merupakan beda Cluster menggunakan

persamaan euclidiance distance dicari nilai terkecilnya.

c. Menghitung jarak maksimal yang merupakan satu Cluster

maupun beda Cluster menggunakan persamaan euclidiance

distance.

d. Hitung menggunakan persamaan 𝑠(𝑖) = (𝑏(𝑖) − 𝑎(𝑖))/

𝑚𝑎𝑥 (𝑎(𝑖), 𝑏(𝑖))


27

e. Lakukan langkah di atas sampai semua titik terhitung kekuatan

hasil Clustering kemudian hitung rata-rata semua SI.

Tabel 3. 11 Hasil Perhitungan SI

Jarak Hasil

Perhitungan

SI

Rata-rata

jarak satu

Cluster(A)

Hasil

D2-D1 1.852084

1.48175022

-

0.67463503

D2-D3 0.988493

D2-D4 2.196373

D2-D5 1.260385

Jarak Hasil

Perhitungan

SI

Rata-rata

jarak beda

Cluster(B)

D2-D6 1.830023

0

D2-D7 1.608903

D2-D8 0

D2-D9 1.065586

D2-D10 0.39794

Max jarak

(A,B)

2.196373


28

BAB IV

IMPLEMENTASI SISTEM DAN ANALISIS HASIL

4.1 IMPLEMENTASI

Implementasi program yang saya rancang untuk menganalisa Cluster berupa

program aplikasi perangkat lunak. Gambar 4.1 menunjukan tampilan program

yang digunakan sebagai alat uji. Adapun cara kerja sistem sebagai berikut:

a. Data obat berupa nama dan indikasi ditambahkan terlebih dahulu pada sistem.

Sebelum data akhirnya disimpan dalam database, proses yang dilakukan oleh

sistem adalah tokenisasi term. Jika terdapat kata yang sama dengan kumpulan

kata pada stopword kata tersebut akan dihilangkan dan data hasil filter ini

disimpan dalam tabel Obat.

b. Sistem melakukan perhitungan kemunculan kata, pembobotan TF-IDF dan

dilakukan proses Cluster menggunakan algoritma K-Means.

Gambar 4. 1 Gui Sistem Keseluruhan


29

Gambar 4. 2 Input Data Obat

Pada Gambar 3.1. Gambar Gui Sistem Inputan Data. Tampilan

interface diatas merupakan tampilan sistem yang digunakan untuk

implementasi sistem. Tampilan tersebut digunakan menginputkan data

berupa text yang diketukan dalam form nama obat dan form indikasi.

Dalam sistem ini pengguna mengetikan nama obat dan indikasinya,

setelah itu klik tombol simpan maka data yang tersimpan akan

ditampilkan pada tabel yang ada dibawah form input data.

Gambar 4. 3 Hasil Proses K-Mean Cluster


30

Gambar 4. 4 Tampilan Tabel Gui Tabel Term(kata)

Pada Gambar 4.3 ini merupakan hasil dari pemecahan dokumen

menjadi kata. Hal ini terjadi saat pengguna menginputkan data dari form

kemudian disimpan. Sistem akan memecah dokumen menjadi

perkata(term). Data dokumen yang dipecah berasal dari variabel

indikasi. Data yang disimpan setelah melalui tahapan pembersihan

stopword.

4.2 Tabel Hasil Cluster percobaan 1

Berikut ini merupakan percoban dengan 7 Cluster dengan centroid awal

dengan nomor dokumen 1,3,14,25,36,47,58.


31

Tabel 4. 1 Tabel Hasil Cluster percobaan 1

NO NAMA OBAT KLASTER

1 ASMANO 1

2 ASMACEL 2

3 ATAROC 2

4 AMINOPHYLLINE 2

5 ASMADEX 3

6 ASCOLEN 4

7 AZMACON 5

8 ATMACID 5

9 ACTAL 5

10 ANTASIDA-DOEN 5

11 ALLUDONA-D 5

12 BIMALCUS 5

13 CRAFAL 5

14 FAMOCID 5

15 GASTROLAN 5

16 GASTROMAG 5

17 CARDIVASK 5

18 AMCOR 5

19 LACIPIL 5

20 CYDIPIN 5

21 CALSIVAS 5

22 NORMOTEN 5

23 TENSIVASK 5

24 TENSS 5

25 PLNDIL 5

26 AFIBRAMOL 5

27 AFIDOL 5

28 ALLOGON 5

29 ALFIDON 5

30 BIMAGEN 5


31 BODREX 5

32 BIOACNE 5

33 MULO-JERAWAT 5

34 ACNOMEL 5

35 SKINOREN 5

36 ERYMED 5

37 BENZASIL 5

38 ERYDERM 5

39 BENZOLAC 5

40 MANNE 5

41 AVLOCLOR 5

42 DURAQUIN 5

43 MEXAQUIN 5

44 NIVAQUINE 5

45 QUINAL 5

46 CENDOQUINE 5

47 RIBOQUIN 5

48 MALAREX 5

49 EUCHININ 5

50 SULDOX 5

51 ALPHADINE 5

52 BONISOL 5

53 DANSEPTA 5

54 DINASEPT 5

55 MINOVAN 5

56 OXOFERIN 5

57 POVIDIN 5

58 SEPTADINE 5

59 UNIDINE 5

60 BUFANTACID 5


32


61 ASPILETS 5

62 DALACIN-T 5

63 ACTAPIN 5

64 ANALPIM 5

65 ANASTAN-FORTE 5


66 ASPIRIN 5

67 KOKODIN 5

68 ASTHERIN 6

69 BIMADRYL 6

70 ASTOP 7

4.2.1 Uji Silhouette

Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada

bab sebelumnya pada Persamaan diperoleh hasil Cluster menggunakan

perhitungan Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori

buruk karena hasil yang diperoleh 0.02857. Hal ini terjadi diakibatkan oleh

banyaknya term bernilai 0 sehingga hasilnya jauh dari 1. Semakin term

bernilai jauh dari 1 hasilnya menunjukan ketidak tepatan Cluster.


Berikut ini merupakan percoban dengan 7 Cluster dengan

centroid awal dengan nomor dokumen 2,13,24,35,46,57,68.



1 AFIBRAMOL 1

2 ALFIDON 1

3 BIMAGEN 1

4 BODREX 1

5 AMINOPHYLLINE 1

6 ASMACEL 4

7 ASMADEX 4


8 AZMACON 4

9 ATAROC 4

10 CARDIVASK 4

11 AMCOR 4

12 LACIPIL 4

13 CYDIPIN 4

14 CALSIVAS 4


34


15 NORMOTEN 4

16 TENSIVASK 4

17 TENSS 4

18 PLNDIL 4

19 AFIDOL 4

20 ALLOGON 4

21 BIOACNE 4

22 MULO-JERAWAT 4

23 ACNOMEL 4

24 SKINOREN 4

25 ERYMED 4

26 BENZASIL 4

27 ERYDERM 4

28 BENZOLAC 4

29 MANNE 4

30 AVLOCLOR 4

31 DURAQUIN 4

32 MEXAQUIN 4

33 NIVAQUINE 4

34 QUINAL 4

35 ALPHADINE 4

36 DANSEPTA 4

37 DINASEPT 4

38 MINOVAN 4

39 OXOFERIN 4

40 SEPTADINE 4

41 ASPILETS 4

42 DALACIN-T 4


43 ACTAPIN 4

44 ANALPIM 4

45

ANASTAN-

FORTE 4

46 ASPIRIN 4

47 ASMANO 5

48 ASCOLEN 5

49 ASTHERIN 5

50 ASTOP 5

51 BIMADRYL 5

52 ATMACID 5

53 ACTAL 5

54 ANTASIDA-DOEN 5

55 ALLUDONA-D 5

56 BIMALCUS 5

57 CRAFAL 5

58 FAMOCID 5

59 GASTROLAN 5

60 GASTROMAG 5

61 CENDOQUINE 5

62 RIBOQUIN 5

63 MALAREX 5

64 EUCHININ 5

65 SULDOX 5

66 BONISOL 5

67 POVIDIN 5

68 UNIDINE 5

69 BUFANTACID 5

70 KOKODIN 5


35

4.3.1. Uji Silhouette

Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada bab sebelumnya

pada Persamaan diperoleh hasil Cluster menggunakan perhitungan Silouethe bahwa

hasil kekuatan Cluster adalah dalam katergori buruk karena hasil yang diperoleh

0.02857. Hal ini terjadi diakibatkan oleh banyaknya term bernilai 0 sehingga hasilnya

jauh dari 1. Semakin term bernilai jauh dari 1 hasilnya menunjukan ketidak tepatan

Cluster.




Hasil Pengelompokan K-Means


No NAMA OBAT KLASTER

1 ASMACEL 1

2 ASMADEX 1

3 ASCOLEN 1

4 AZMACON 1

5 ASTHERIN 1

6 ASTOP 1

7 BIMADRYL 1

8 AFIDOL 1

9 RIBOQUIN 1

10 MALAREX 1

11 EUCHININ 1

12 ALPHADINE 1


13 BONISOL 1

14 DINASEPT 1

15 MINOVAN 1

16 OXOFERIN 1

17 POVIDIN 1

18 UNIDINE 1

19 KOKODIN 1

20 ASMANO 2

21 CENDOQUINE 2

22 SULDOX 2

23 ATAROC 3

24 ATMACID 3


36


25 ACTAL 3

26 ANTASIDA-DOEN 3

27 ALLUDONA-D 3

28 BIMALCUS 3

29 CRAFAL 3

30 FAMOCID 3

31 GASTROLAN 3

32 GASTROMAG 3

33 CARDIVASK 3

34 AMCOR 3

35 LACIPIL 3

36 CYDIPIN 3

37 CALSIVAS 3

38 NORMOTEN 3

39 TENSIVASK 3

40 TENSS 3

41 PLNDIL 3

42 AFIBRAMOL 3

43 ALLOGON 3

44 ALFIDON 3

45 BIMAGEN 3

46 BODREX 3

47 BIOACNE 3


48 MULO-JERAWAT 3

49 ACNOMEL 3

50 SKINOREN 3

51 ERYMED 3

52 BENZASIL 3

53 ERYDERM 3

54 BENZOLAC 3

55 MANNE 3

56 AVLOCLOR 3

57 DURAQUIN 3

58 MEXAQUIN 3

59 NIVAQUINE 3

60 QUINAL 3

61 DANSEPTA 3

62 SEPTADINE 3

63 BUFANTACID 3

64 ASPILETS 3

65 DALACIN-T 3

66 ACTAPIN 3

67 ANALPIM 3

68

ANASTAN-

FORTE 3

69 ASPIRIN 3

70 AMINOPHYLLINE 3


Pada pengujian terhadap kekuatan Cluster yang telah dijelaskan pada bab

sebelumnya pada Persamaan diperoleh hasil Cluster menggunakan perhitungan


37

Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori buruk karena

hasil yang diperoleh 0.01429. Hal ini terjadi diakibatkan oleh banyaknya term

bernilai 0 sehingga hasilnya jauh dari 1. Semakin term bernilai jauh dari 1

hasilnya menunjukan ketidak tepatan Cluster.




Hasil Pengelompokan K-Means

Tabel 4. 4 Hasil Cluster Percobaan 4


1 ASMANO 1

2 ASMADEX 2

3 BIMALCUS 3

4 CALSIVAS 4

5 TENSIVASK 4

6 ACTAPIN 4

7 BIOACNE 5

8 MULO-JERAWAT 5

9 ACNOMEL 5

10 SKINOREN 5

11 ERYMED 5

12 BENZASIL 5

13 ERYDERM 5

14 BENZOLAC 5

15 MANNE 5

16 DALACIN-T 5


17 ASMACEL 6

18 AZMACON 6

19 ASTHERIN 6

20 ASTOP 6

21 BIMADRYL 6

22 ATAROC 6

23 ATMACID 6

24 ACTAL 6

25 ANTASIDA-DOEN 6

26 ALLUDONA-D 6

27 CRAFAL 6

28 FAMOCID 6

29 GASTROLAN 6

30 GASTROMAG 6

31 CARDIVASK 6

32 AMCOR 6


38


33 LACIPIL 6

34 CYDIPIN 6

35 NORMOTEN 6

36 TENSS 6

37 PLNDIL 6

38 AFIBRAMOL 6

39 AFIDOL 6

40 ALLOGON 6

41 ALFIDON 6

42 BODREX 6

43 AVLOCLOR 6

44 DURAQUIN 6

45 MEXAQUIN 6

46 NIVAQUINE 6

47 QUINAL 6

48 CENDOQUINE 6

49 RIBOQUIN 6

50 MALAREX 6

51 EUCHININ 6


52 SULDOX 6

53 BUFANTACID 6

54 ASPILETS 6

55 ANALPIM 6

56

ANASTAN-

FORTE 6

57 ASPIRIN 6

58 AMINOPHYLLINE 6

59 ASCOLEN 7

60 BIMAGEN 7

61 ALPHADINE 7

62 BONISOL 7

63 DANSEPTA 7

64 DINASEPT 7

65 MINOVAN 7

66 OXOFERIN 7

67 POVIDIN 7

68 SEPTADINE 7

69 UNIDINE 7

70 KOKODIN 7







39




Berikut ini merupakan percoban dengan 7 Cluster dengan centroid awal dengan

nomor dokumen 34,6,17,28,39,50,61.



1 ASTHERIN 2

2 ASTOP 2

3 BIMADRYL 2

4 ATAROC 2

5 ATMACID 2

6 ACTAL 2

7 ANTASIDA-DOEN 2

8 ALLUDONA-D 2

9 BIMALCUS 2

10 CRAFAL 2

11 FAMOCID 2

12 GASTROLAN 2

13 GASTROMAG 2

14 CARDIVASK 2

15 AMCOR 2

16 LACIPIL 2

17 CYDIPIN 2

18 CALSIVAS 2

19 NORMOTEN 2

20 TENSIVASK 2

21 TENSS 2


22 PLNDIL 2

23 AFIDOL 2

24 ALLOGON 2

25 BIOACNE 2

26 MULO-JERAWAT 2

27 ACNOMEL 2

28 SKINOREN 2

29 ERYMED 2

30 BENZASIL 2

31 ERYDERM 2

32 BENZOLAC 2

33 MANNE 2

34 AVLOCLOR 2

35 DURAQUIN 2

36 MEXAQUIN 2

37 NIVAQUINE 2

38 QUINAL 2

39 ALPHADINE 2

40 DANSEPTA 2

41 DINASEPT 2

42 OXOFERIN 2


40


43 POVIDIN 2

44 SEPTADINE 2

45 BUFANTACID 2

46 ASPILETS 2

47 DALACIN-T 2

48 ACTAPIN 2

49 ANALPIM 2

50

ANASTAN-

FORTE 2

51 ASPIRIN 2

52 AFIBRAMOL 3

53 ALFIDON 3

54 BIMAGEN 3

55 BODREX 3

56 AMINOPHYLLINE 3


57 CENDOQUINE 4

58 ASMANO 6

59 ASMACEL 6

60 ASMADEX 6

61 ASCOLEN 6

62 AZMACON 6

63 RIBOQUIN 6

64 MALAREX 6

65 EUCHININ 6

66 SULDOX 6

67 BONISOL 6

68 MINOVAN 6

69 UNIDINE 6

70 KOKODIN 6




Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori buruk karena hasil yang

diperoleh 0.02857. Hal ini terjadi diakibatkan oleh banyaknya term bernilai 0 sehingga

hasilnya jauh dari 1. Semakin term bernilai jauh dari 1 hasilnya menunjukan ketidak

tepatan Cluster.



nomor dokumen 45,7,18,29,40,51,62.


41



1 AFIBRAMOL 1

2 ALFIDON 1

3 BIMAGEN 1

4 BODREX 1

5 AMINOPHYLLINE 1

6 EUCHININ 2

7 ASMANO 5

8 ASTHERIN 5

9 BIMADRYL 5

10 ATAROC 5

11 ATMACID 5

12 ACTAL 5

13 ANTASIDA-DOEN 5

14 BIMALCUS 5

15 RIBOQUIN 5

16 MALAREX 5

17 SULDOX 5

18 BONISOL 5

19 POVIDIN 5

20 UNIDINE 5

21 BUFANTACID 5

22 KOKODIN 5

23 ASMACEL 6

24 ASMADEX 6

25 ASCOLEN 6

26 AZMACON 6

27 ASTOP 6

28 ALLUDONA-D 6


29 CRAFAL 6

30 FAMOCID 6

31 GASTROLAN 6

32 GASTROMAG 6

33 CARDIVASK 6

34 AMCOR 6

35 LACIPIL 6

36 CYDIPIN 6

37 CALSIVAS 6

38 NORMOTEN 6

39 TENSIVASK 6

40 TENSS 6

41 PLNDIL 6

42 AFIDOL 6

43 ALLOGON 6

44 BIOACNE 6

45 MULO-JERAWAT 6

46 ACNOMEL 6

47 SKINOREN 6

48 ERYMED 6

49 BENZASIL 6

50 ERYDERM 6

51 BENZOLAC 6

52 MANNE 6

53 AVLOCLOR 6

54 DURAQUIN 6

55 MEXAQUIN 6

56 NIVAQUINE 6


42


57 QUINAL 6

58 CENDOQUINE 6

59 ALPHADINE 6

60 DANSEPTA 6

61 DINASEPT 6

62 MINOVAN 6

63 OXOFERIN 6


64 SEPTADINE 6

65 ASPILETS 6

66 DALACIN-T 6

67 ACTAPIN 6

68 ANALPIM 6

69

ANASTAN-

FORTE 6

70 ASPIRIN 6




Silouethe bahwa hasil kekuatan Cluster adalah dalam katergori buruk karena hasil yang

diperoleh 0.02857. Hal ini terjadi diakibatkan oleh banyaknya term bernilai 0 sehingga

hasilnya jauh dari 1. Semakin term bernilai jauh dari 1 hasilnya menunjukan ketidak

tepatan Cluster .

Gambar 4. 5 Grafik hasil uji kekuatan Cluster percobaan 1-6

0.02857 0.02857

0.01429 0.01429

0.02857 0.02857

0

0.005

0.01

0.015

0.02

0.025

0.03

0 1 2 3 4 5 6 7

Has

il U

ji K

eku

atan

Kla

ster

Index Titik Pusat Awal

Grafik Hasil Uji Klaster dengan IDF Keterangan Index

1 1,3,14,25,36,47,58

2 2,13,24,35,46,57,68

3 12,4,15,26,37,48,59

4 23,5,16,27,38,49,60

5 34,6,17,28,39,50,61

6 45,7,18,29,40,51,62


43

4.8 Tabel Hasil Cluster percobaan 7(Tanpa IDF)





1 ASMANO 1

2 ASTOP 1

3 ASMACEL 2

4 ASMADEX 2

5 ASCOLEN 2

6 ASTHERIN 2

7 ATAROC 2

8 ATMACID 3

9 ACTAL 3

10 ALLUDONA-D 3

11 BIMALCUS 3

12 GASTROMAG 3

13 BUFANTACID 3

14 CYDIPIN 4

15 CALSIVAS 4

16 TENSIVASK 4

17 ACTAPIN 4

18 AZMACON 5

19 BIMADRYL 5

20 ANTASIDA-DOEN 5

21 CRAFAL 5

22 FAMOCID 5

23 GASTROLAN 5


24 CARDIVASK 5

25 AMCOR 5

26 LACIPIL 5

27 NORMOTEN 5

28 TENSS 5

29 PLNDIL 5

30 AFIBRAMOL 5

31 AFIDOL 5

32 ALLOGON 5

33 ALFIDON 5

34 BIMAGEN 5

35 BODREX 5

36 BIOACNE 5

37 MULO-JERAWAT 5

38 ACNOMEL 5

39 SKINOREN 5

40 ERYMED 5

41 BENZASIL 5

42 ERYDERM 5

43 BENZOLAC 5

44 MANNE 5

45 ASPILETS 5

46 DALACIN-T 5


44


47 ANALPIM 5

48 ANASTAN-FORTE 5

49 ASPIRIN 5

50 AMINOPHYLLINE 5

51 AVLOCLOR 6

52 DURAQUIN 6

53 MEXAQUIN 6

54 NIVAQUINE 6

55 QUINAL 6

56 CENDOQUINE 6

57 RIBOQUIN 6

58 MALAREX 6


59 EUCHININ 6

60 SULDOX 6

61 ALPHADINE 7

62 BONISOL 7

63 DANSEPTA 7

64 DINASEPT 7

65 MINOVAN 7

66 OXOFERIN 7

67 POVIDIN 7

68 SEPTADINE 7

69 UNIDINE 7

70 KOKODIN 7












45

45



1 AFIBRAMOL 1

2 ALFIDON 1

3 BIMAGEN 1

4 BODREX 1

5 AMINOPHYLLINE 1

6 ASMANO 3

7 RIBOQUIN 3

8 ASMACEL 4

9 ASMADEX 4

10 ASCOLEN 4

11 AZMACON 4

12 ASTHERIN 4

13 ASTOP 4

14 BIMADRYL 4

15 ATAROC 4

16 ATMACID 4

17 ACTAL 4

18 ANTASIDA-DOEN 4

19 ALLUDONA-D 4

20 BIMALCUS 4

21 CRAFAL 4

22 FAMOCID 4

23 GASTROLAN 4

24 GASTROMAG 4

25 CARDIVASK 4

26 AMCOR 4


27 LACIPIL 4

28 CYDIPIN 4

29 CALSIVAS 4

30 NORMOTEN 4

31 TENSIVASK 4

32 TENSS 4

33 PLNDIL 4

34 AFIDOL 4

35 ALLOGON 4

36 BIOACNE 4

37 MULO-JERAWAT 4

38 ACNOMEL 4

39 SKINOREN 4

40 ERYMED 4

41 BENZASIL 4

42 ERYDERM 4

43 BENZOLAC 4

44 MANNE 4

45 AVLOCLOR 4

46 DURAQUIN 4

47 MEXAQUIN 4

48 NIVAQUINE 4

49 QUINAL 4

50 BUFANTACID 4

51 ASPILETS 4

52 DALACIN-T 4


46


53 ACTAPIN 4

54 ANALPIM 4

55 ANASTAN-FORTE 4

56 ASPIRIN 4

57 CENDOQUINE 5

58 SULDOX 5

59 ALPHADINE 5

60 BONISOL 5

61 DANSEPTA 5


62 DINASEPT 5

63 MINOVAN 5

64 OXOFERIN 5

65 POVIDIN 5

66 SEPTADINE 5

67 UNIDINE 5

68 KOKODIN 5

69 MALAREX 6

70 EUCHININ 6










nomor dokumen 12,4,15,26,37,48,59.



1 RIBOQUIN 1

2 EUCHININ 1

3 SULDOX 1


4 ALPHADINE 1

5 DANSEPTA 1

6 DINASEPT 1


47


7 OXOFERIN 1

8 SEPTADINE 1

9 ASMACEL 2

10 AZMACON 2

11 ASTOP 2

12 ATAROC 2

13 ATMACID 2

14 ACTAL 2

15 ANTASIDA-DOEN 2

16 ALLUDONA-D 2

17 BIMALCUS 2

18 CRAFAL 2

19 FAMOCID 2

20 GASTROLAN 2

21 GASTROMAG 2

22 CARDIVASK 2

23 AMCOR 2

24 LACIPIL 2

25 CYDIPIN 2

26 CALSIVAS 2

27 NORMOTEN 2

28 TENSIVASK 2

29 TENSS 2

30 PLNDIL 2

31 AFIBRAMOL 2

32 ALLOGON 2

33 ALFIDON 2

34 BIMAGEN 2


35 BODREX 2

36 BIOACNE 2

37 MULO-JERAWAT 2

38 ACNOMEL 2

39 SKINOREN 2

40 ERYMED 2

41 BENZASIL 2

42 ERYDERM 2

43 BENZOLAC 2

44 MANNE 2

45 AVLOCLOR 2

46 DURAQUIN 2

47 MEXAQUIN 2

48 NIVAQUINE 2

49 QUINAL 2

50 CENDOQUINE 2

51 BUFANTACID 2

52 ASPILETS 2

53 DALACIN-T 2

54 ACTAPIN 2

55 ANALPIM 2

56

ANASTAN-

FORTE 2

57 ASPIRIN 2

58 ASMANO 4

59 ASMADEX 4

60 ASCOLEN 4

61 ASTHERIN 4

62 BIMADRYL 4


48


63 AFIDOL 4

64 MALAREX 4

65 BONISOL 4

66 MINOVAN 4


67 POVIDIN 4

68 UNIDINE 4

69 KOKODIN 4

70 AMINOPHYLLINE 4








4.11 Tabel Hasil Cluster percobaan 10 (Tanpa IDF)


nomor dokumen 23,5,16,27,38,49,60.



1 ASMANO 1

2 ASMACEL 2

3 ATAROC 2

4 AMINOPHYLLINE 2

5 ASMADEX 3

6 ASCOLEN 4

7 AZMACON 5


8 ATMACID 5

9 ACTAL 5

10 ANTASIDA-DOEN 5

11 ALLUDONA-D 5

12 BIMALCUS 5

13 CRAFAL 5

14 FAMOCID 5


49


15 GASTROLAN 5

16 GASTROMAG 5

17 CARDIVASK 5

18 AMCOR 5

19 LACIPIL 5

20 CYDIPIN 5

21 CALSIVAS 5

22 NORMOTEN 5

23 TENSIVASK 5

24 TENSS 5

25 PLNDIL 5

26 AFIBRAMOL 5

27 AFIDOL 5

28 ALLOGON 5

29 ALFIDON 5

30 BIMAGEN 5

31 BODREX 5

32 BIOACNE 5

33 MULO-JERAWAT 5

34 ACNOMEL 5

35 SKINOREN 5

36 ERYMED 5

37 BENZASIL 5

38 ERYDERM 5

39 BENZOLAC 5

40 MANNE 5

41 AVLOCLOR 5

42 DURAQUIN 5


43 MEXAQUIN 5

44 NIVAQUINE 5

45 QUINAL 5

46 CENDOQUINE 5

47 RIBOQUIN 5

48 MALAREX 5

49 EUCHININ 5

50 SULDOX 5

51 ALPHADINE 5

52 BONISOL 5

53 DANSEPTA 5

54 DINASEPT 5

55 MINOVAN 5

56 OXOFERIN 5

57 POVIDIN 5

58 SEPTADINE 5

59 UNIDINE 5

60 BUFANTACID 5

61 ASPILETS 5

62 DALACIN-T 5

63 ACTAPIN 5

64 ANALPIM 5

65

ANASTAN-

FORTE 5

66 ASPIRIN 5

67 KOKODIN 5

68 ASTHERIN 6

69 BIMADRYL 6

70 ASTOP 7


50










nomor dokumen 34,6,17,28,39,50,61.



1 AFIBRAMOL 1

2 ALFIDON 1

3 BIMAGEN 1

4 BODREX 1

5 AMINOPHYLLINE 1

6 ASMACEL 4

7 ASMADEX 4

8 AZMACON 4

9 ASTOP 4

10 ATAROC 4

11 CARDIVASK 4

12 AMCOR 4

13 LACIPIL 4

14 CYDIPIN 4

15 CALSIVAS 4

16 NORMOTEN 4

17 TENSIVASK 4


18 TENSS 4

19 PLNDIL 4

20 AFIDOL 4

21 ALLOGON 4

22 BIOACNE 4

23 MULO-JERAWAT 4

24 ACNOMEL 4

25 SKINOREN 4

26 ERYMED 4

27 BENZASIL 4

28 ERYDERM 4

29 BENZOLAC 4

30 MANNE 4

31 AVLOCLOR 4

32 DURAQUIN 4

33 MEXAQUIN 4

34 NIVAQUINE 4


51


35 QUINAL 4

36 ALPHADINE 4

37 DANSEPTA 4

38 DINASEPT 4

39 MINOVAN 4

40 OXOFERIN 4

41 SEPTADINE 4

42 ASPILETS 4

43 DALACIN-T 4

44 ACTAPIN 4

45 ANALPIM 4

46 ANASTAN-FORTE 4

47 ASPIRIN 4

48 ASMANO 5

49 ASCOLEN 5

50 ASTHERIN 5

51 BIMADRYL 5

52 ATMACID 5


53 ACTAL 5

54 ANTASIDA-DOEN 5

55 ALLUDONA-D 5

56 BIMALCUS 5

57 CRAFAL 5

58 FAMOCID 5

59 GASTROLAN 5

60 GASTROMAG 5

61 CENDOQUINE 5

62 RIBOQUIN 5

63 MALAREX 5

64 EUCHININ 5

65 SULDOX 5

66 BONISOL 5

67 POVIDIN 5

68 UNIDINE 5

69 BUFANTACID 5

70 KOKODIN 5








4.13 Tabel Hasil Cluster percobaan 12 (Tanpa IDF)


nomor dokumen 45,7,18,29,40,51,62.


52



1 ASMACEL 1

2 ASCOLEN 1

3 AZMACON 1

4 ASTOP 1

5 ATMACID 1

6 ACTAL 1

7 ANTASIDA-DOEN 1

8 ALLUDONA-D 1

9 BIMALCUS 1

10 CRAFAL 1

11 FAMOCID 1

12 GASTROLAN 1

13 GASTROMAG 1

14 CARDIVASK 1

15 AMCOR 1

16 LACIPIL 1

17 CYDIPIN 1

18 CALSIVAS 1

19 NORMOTEN 1

20 TENSIVASK 1

21 TENSS 1

22 PLNDIL 1

23 AFIDOL 1

24 ALLOGON 1


25 BIOACNE 1

26 MULO-JERAWAT 1

27 ACNOMEL 1

28 SKINOREN 1

29 ERYMED 1

30 BENZASIL 1

31 ERYDERM 1

32 BENZOLAC 1

33 MANNE 1

34 AVLOCLOR 1

35 DURAQUIN 1

36 MEXAQUIN 1

37 NIVAQUINE 1

38 QUINAL 1

39 ALPHADINE 1

40 DANSEPTA 1

41 DINASEPT 1

42 MINOVAN 1

43 OXOFERIN 1

44 SEPTADINE 1

45 BUFANTACID 1

46 ASPILETS 1

47 DALACIN-T 1

48 ACTAPIN 1


53


49 ANALPIM 1

50

ANASTAN-

FORTE 1

51 ASPIRIN 1

52 EUCHININ 2

53 ASMANO 3

54 ASMADEX 3

55 ASTHERIN 3

56 BIMADRYL 3

57 ATAROC 3

58 RIBOQUIN 3

59 MALAREX 3


60 SULDOX 3

61 BONISOL 3

62 POVIDIN 3

63 UNIDINE 3

64 KOKODIN 3

65 AFIBRAMOL 4

66 ALFIDON 4

67 BIMAGEN 4

68 BODREX 4

69 CENDOQUINE 4

70 AMINOPHYLLINE 4








Gambar 4. 6 Grafik Hasil Uji Kekuatan Cluster Percobaan 7-12

0.02857

0.04286

0.05714

0.04286 0.04286 0.04286

0

0.02

0.04

0.06

7 9 11Has

il U

ji K

ekuat

an

Clu

ster

Index Titik Pusat Awal

Grafik Hasil Uji Klaster tanpa IDF Keterangan index:

7 1,3,14,25,36,47,58

8 2,13,24,35,46,57,68

9 12,4,15,26,37,48,59

10 23,5,16,27,38,49,60

11 34,6,17,28,39,50,61

12 45,7,18,29,40,51,62


54

BAB V

PENUTUP

Bab terakhir pada penulisan ini menjelaskan mengenai kesimpulan dari

penelitian terkait terhadap pengelompikan obat-obatan yang diambil dari buku ISO

VOL 48. Pada bab ini dijelaskan saran yang diberikan pada sistem yang telah dibuat.

5.1 Analisa Hasil

Dari hasil Clustering tentang pengelompokan obat-obatan pada buku ISO vol

48 dapat diselesaikan dengan algoritma K-Mean dapat melakukan pengelompokan

dokumen dalam jumlah tujuhpuluh indikasi obat akan tetapi hasil belum efisien dalam

pengelompokan dokumen secara tepat. Penentuan centroid (titik pusat) pada tahap

awal algoritma K-Means sangat berpengaruh terhadap hasil Cluster seperti pada hasil

pengujian data diatas dengan centroid yang berbeda menghasilkan hasil yang berbeda

juga.

5.2 Saran

Saran yang diperlukan untuk pengembangan sistem untuk lenih lanjut sebagai

berikut:

1. Pada penelitian selanjutnya dapat dikembangkan dengan data serupa

dengan algoritma yang lebih baik seperti menggunakan Persamaan

menghitung jarak menggunakan cosine similarity.

2. Hasil Cluster yang terbentuk secara tepat dapat dijadikan sistem

pengelompokan jenis obat yang terindikasi dalam satu kategori obat.


55

DAFTAR PUSTAKA

Ade Bastian, Harun Sujadi, dan Gigin Febrianto (2018). Penerapan Algoritma K-

Means Cluster Analysis Pada Penyakit Menular Manusia (Studi Kasus

Kabupaten Majalengka), vol. 14 no. 01

Gufroni, H.S. (2017). Penerapan Data mining Dalam Pengelompokan Penderita

Thalassaemia, vol. 03 no. 02

Han, Jiawei & Micheline Kamber. 2011. Second Edition. Data mining: Concepts and

Techniques. New York: Morgan Kaufman

Han, Jiawei & Micheline Kamber. 2012. Third Edition. Data mining: Concepts and

Techniques. New York: Morgan Kaufman

ISO (Informasi Spesialite Obat) Indonesia 2013, vol 48

Manning, C.D., dkk. 2008. Introduction to Information Retrieval. Cambridge:

University Press.


LAMPIRAN

Lampiran 1. Tabel Data Obat

No NAMA INDIKASI

1 AMINOPHYLLINE MERINGANKAN DAN MENGATASI

SERANGAN ASMA BRONKIAL

2 ASMANO ASMA BRONKIAL BRONKITIS

ASMATIK BRONKITIS KRONIK

DENGAN ENFISEMA BRONKOSPASME

EFISEMATOSA ASMA DENGAN RINITIS

ALERGI

3 ASMACEL ASMA BRONKIAL BRONKITIS KRONIS

ENFISEMA

4 ASMADEX ASMA BRONKIAL ASMA BRONKITIS

KEJANG BRONKUS ALERGI

5 ASCOLEN ASMA BRONKIAL BRONKITIS

ASMATIS DAN ENFISEMA PULMONUM

6 AZMACON ASMA BRONKITIS KRONIS ENFISEMA

7 ASTHERIN BATUK BERDAHAK ASMA BRONKIAL

BRONKITIS ENFISEMA

8 ASTOP ASMA BRONKIAL BRONKITIS KRONIK

BRONKITIS KRONIK ENFISEMA

PULMONUM

9 BIMADRYL MEREDAKAN BATUK BERDAHAK


57

10 ATAROC DISPNEA KARENA ASMA BRONKIAL

BRONKITIS AKUT DAN KRONIK

11 ATMACID MENGURANGI GEJALA KELEBIHAN

ASAM LAMBUNG GASTRITIS TUKAK

LAMBUNG TUKAK USUS

DUABELASJARI

12 ACTAL MENGURANGI GEJALA YANG

BERHUBUNGAN DENGAN KELEBIHAN

ASAM LAMBUNG GASTRITIS TUKAK

LAMBUNG TUKAK USUS

DUABELASJARI DENGAN GEJALA

MUAL NYERI LAMBUNG DAN NYERI

ULUHATI

13 ANTASIDA-DOEN OBAT SAKIT MAAG UNTUK

MENGURANGI NYERI LAMBUNG

YANG DISEBABKAN OLEH KELEBIHAN

ASAM LAMBUNG DENGAN GEJALA

SEPERTI MUAL DAN PERIH

14

ALLUDONA-D KELEBIHAN ASAM LAMBUNG

GASTRITIS HEARTBURN PREPTIK

ESOFAGITIS DAN MENGHILANGKAN

PERUT KEMBUNG

15 BUFANTACID MENGURANGI NYERI YANG

BERHUBUNGAN DENGAN KELEBIHAN

ASAM LAMBUNG TUKAK LAMBUNG


58

TUKAK USUS DAN GEJALA SEPERTI

MUAL

16 BIMALCUS MENGHILANGKAN KELEBIHAN ASAM

LAMBUNG PADA PREPTIK

ESOPHAGITIS TUKAK PREPTIK HIATUS

HERNIA NYERI PADA ULUHATI DAN

MENGURANGI RASA KEMBUNG

17 CRAFAL TUKAK LAMBUNG DAN USUS

DUABELASJARI GASTRITIS KRONIK

18 FAMOCID TUKAK USUS DUABELASJARI AKTIF

TERAPI PEMELIHARAAN PADA TUKAK

USUS DUABELASJARI AKTIF

HIPERSEKRESI PATOLOGIS SEPERTI

SINDROM ZOLLINGER ELLISION DAN

ADENOMA ENDOKRIN BERGANDA

19 GASTROLAN TUKAK USUS DUABELASJARI TUKAK

LAMBUNG REKUREN REFLUKS

ESOFAGITIS

20 GASTROMAG TUKAK LAMBUNG TUKAK USUS

DUABELASJARI PERUT KEMBUNG

KELEBIHAN ASAM LAMBUNG DAN

PERUT SAKIT

21 CARDIVASK HIPERTENSI DAN ANGINA

22 AMCOR HIPERTENSI DAN ANGINA


59

23 ACTAPIN HIPERTENSI ANGINA STABIL ANGINA

VARIAN

24 LACIPIL HIPERTENSI

25 CYDIPIN HIPERTENSI ANGINA STABIL ATAU

VARIAN

26 CALSIVAS HIPERTENSI ISKEMIA JANTUNG

KARENA ANGINA STABIL ANGINA

PRINZMETAL ATAU VARIAN

27 NORMOTEN HIPERTENSI

28 TENSIVASK HIPERTENSI ISKEMIA JANTUNG

KARENA ANGINA STABIL ANGINA

PRINZMETAL ATAU VARIAN

29 TENSS HIPERTENSI

30 PLNDIL HIPERTENSI

31 AFIBRAMOL MERINGANKAN RASA SAKIT SEPERTI

SAKIT GIGI SAKIT KEPALA DAN

MENURUNKAN DEMAM

32 AFIDOL MENGATASI NYERI RINGAN PADA

SAKIT KEPALA SAKIT GIGI SAKIT

WAKTU HAID DAN SAKIT OTOT

MENURUNKAN DEMAM SETELAH

IMUNISASI

33 ALLOGON SAKIT GIGI SAKIT KEPALA PEGAL

OTOT DAN SENDI


60

34 ALFIDON MERINGANKAN SAKIT KEPALA NYERI

OTOT RASA SAKIT GIGI

35 ANALPIM MENURUNKAN PANAS MENGURANGI

RASA SAKIT KEPALA SAKIT GIGI

DEMAM

36 ANASTAN-FORTE MENGHILANGKAN RASA SAKIT GIGI

SAKIT KEPALA NYERI SETELAH

OPERASI DAN DISMENORE

37 ASPIRIN SAKIT KEPALA PUSING SAKIT GIGI

NYERI OTOT DEMAM

38 ASPILETS DEMAM SAKIT KEPALA SAKIT GIGI

RASA NYERI PADA OTOT DAN SENDI

39 BIMAGEN MERINGANKAN SAKIT KEPALA DAN

SAKIT GIGI

40 BODREX MERINGANKAN SAKIT KEPALA

PUSING PENING BERAT SAKIT GIGI

DAN MENURUNKAN DEMAM

41 BIOACNE MENCEGAH DAN MENGHILANGKAN

JERAWAT

42 MULO-JERAWAT MENYEMBUHKAN JERAWAT

43 ACNOMEL PENGOBATAN JERAWAT

44 SKINOREN OBAT JERAWAT

45 ERYMED PENGOBATAN JERAWAT SECARA

TOPIKAL


61

46 BENZASIL PENGOBATAN JERAWAT SECARA

TOPIKAL

47 ERYDERM JERAWAT

48 DALACIN-T MENGOBATI JERAWAT

49 BENZOLAC PENGOBATAN JERAWAT SECARA

TOPIKAL

50 MANNE TERAPI UNTUK BISUL DAN JERAWAT

51 AVLOCLOR ANTI MALARIA

52 DURAQUIN MALARIA

53 MEXAQUIN MALARIA

54 NIVAQUINE ANTI MALARIA

55 QUINAL ANTI MALARIA

56 CENDOQUINE MALARIA AMUBIASIS LUPUS

ERITEMATOSUS ARTRITIS

REUMATOID

57 RIBOQUIN DEMAM MALARIA LUPUS AMUBIASIS

DILUAR USUS SERTAGIARDIASIS

PENCEGAHAN DAN PENYEMBUHAN

MALARIA

58 MALAREX MALARIA HEPATITIS AMUBIK LUPUS

ERITEMATOSUS KRONIK REUMATOID

ARTRITIS

59 EUCHININ ANTI MALARIA ANTIPIRETIK


62

60 SULDOX ANTI MALARIA DIMANA MALARIA

FALCIPARUM TELAH RESISTEN

TERHADAP KLOROKUIN

61 ALPHADINE ANTISEPTIK DAN DISINFEKTAN

62 BONISOL ANTISEPTIK KULIT LUKA BIASA

LECET TERGORES DAN PIDERMA

63 DANSEPTA ANTISEPTIK

64 DINASEPT ANTISEPTIK DAN DISINFEKTAN

65 KOKODIN SEBAGAI DISINFEKTAN DAN

ATISEPTIK PADA KULIT LUKA SAYAT

LECET

66 MINOVAN ANTISEPTIK KHUSUS PADA BAGIAN

KEWANITAAN

67 OXOFERIN ANTISEPTIK DAN DISINFEKTAN

68 POVIDIN ANTISEPTIK DAN DISINFEKTAN PADA

LUKA-LUKA DIKULIT DAN JARINGAN

MUKOSA

69 SEPTADINE ANTISEPTIK

70 UNIDINE ANTISEPTIK DAN OBAT LUKA AKIBAT

TERGORES PERTOLONGAN PERTAMA

PADA KECELAKAAN SETELAH

KHITAN OPERASI


Documents

Cluster Obat Berdasarkan Keterangan Indikasi Obat SKRIPSI · Cluster Obat Berdasarkan Keterangan Indikasi Obat Menggunakan Algoritma K-Means SKRIPSI Diajukan untuk Memenuhi Salah