of 8 /8
Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X Jurnal Kajian Ilmiah 111 Universitas Bhayangkara Jakarta Raya Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru Joko Sulis Setyo 1 , Adjat Sudradjat 2 1 STMIK Nusa Mandiri Jakarta, [email protected] 2 AMIK BSI Jakarta, [email protected] ABSTRAK Kesehatan merupakan hal yang sangat berharga bagi semua orang. Tuberkulosis paru menjadi penyakit menular yang umum dan dalam banyak kasus bersifat mematikan. Tuberkulosis paru menular melalui udara ketika berinteraksi dengan orang yang sudah terinfeksi saat ia batuk dan bersin, atau melalui butiran ludah mereka yang menyebar di udara. Tuberkulosis paru dapat menyerang siapa saja, baik tua atau muda, laki-laki atau perempuan. Banyak gejala yang bisa terjadi pada seseorang yang terjangkit tuberkulosis paru, dan untuk menganalisa gejala tersebut bukan hal yang mudah, perlu dilakukan tes dahak pada penderita. Selain itu, dibutuhkan juga sebuah metode yang dapat mempermudah saat melakukan analisa dan menggali informasi pasien dari data rekam medik yang tersedia. Metode C4.5 (Decision Tree) adalah algoritma pengklasifikasian popular yang sederhana dan mudah diterapkan. Hasil yang diperoleh dari decision tree lebih mudah untuk dibaca dan ditafsirkan, melalui fitur untuk mengakses data detail profil pasien yang tersedia dalam pohon keputusan. Dengan perhitungan metode C4.5 diharapkan dapat membantu lebih awal dan memberikan banyak manfaat bagi pihak puskesmas dalam menangani pasien yang terjangkit tuberkulosis paru. Kata Kunci: Tuberkulosis Paru, Metode C4.5, Catatan Medis Pasien, Pusat Kesehatan ABSTRACT – Health is a very valuable thing for everybody. Pulmonary tuberculosis is a common contagious disease and in many cases deadly. Pulmonary tuberculosis is transmitted through the air when interacting with an infected person at the time when they cough and sneeze, or through their spittle granules that spread in the air. Pulmonary tuberculosis can affect all people, whether young or old, male or female. Many symptoms can occur in someone who contracted pulmonary tuberculosis, and to analyze the symptoms is not an easy thing, it needs to do sputum tests in patients. In addition, it is also necessary a method that can facilitate when performing analysis and extract patient information from medical record data available. The C4.5 (Decision Tree) method is a simple and easy-to-apply classification algorithm. The results obtained from the decision tree are easier to read and interpret, through features to access the detailed patient profile data available in the decision tree. With the calculation of C4.5 method is expected to help early and provide many benefits for the puskesmas in dealing with patients affected by pulmonary tuberculosis. Key Words: Pulmonary Tuberculosis, C4.5 Method, Patient Medical Records, Health Centers Naskah diterima : 15 Agustus 2017, Naskah dipublikasikan : 15 September 2017 PENDAHULUAN Kesehatan merupakan nikmat yang paling berharga bagi diri manusia. Pada umumnya setiap orang menginginkan hidup sehat. Namun bukan hal yang mudah untuk menjaga kesehatan, ditambah lagi pola hidup yang kurang baik. Salah satu yang bisa dilihat adalah kebiasaan merokok, ditambah lagi pencemaran udara yang sangat tinggi dari polusi. Itu semua dapat menimbulkan berbagai penyakit paru-paru. Paru-paru adalah organ dari sistem pernapasan (respirasi) dan berhubungan dengan sistem peredaran darah. Pada organ paru terdapat beberapa jenis penyakit yang dapat dikelompokan menjadi dua yaitu

Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru...tuberkulosis paru dan apakah ada penyakit penyerta lainnya dari data pasien yang terjangkit tuberkulosis paru menggunakan

  • Author
    others

  • View
    6

  • Download
    0

Embed Size (px)

Text of Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru...tuberkulosis paru dan apakah ada...

  • Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

    Jurnal Kajian Ilmiah 111

    Universitas Bhayangkara Jakarta Raya

    Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru

    Joko Sulis Setyo1, Adjat Sudradjat2 1STMIK Nusa Mandiri Jakarta, [email protected]

    2AMIK BSI Jakarta, [email protected]

    ABSTRAK – Kesehatan merupakan hal yang sangat berharga bagi semua orang.

    Tuberkulosis paru menjadi penyakit menular yang umum dan dalam banyak kasus bersifat mematikan. Tuberkulosis paru menular melalui udara ketika berinteraksi dengan orang yang

    sudah terinfeksi saat ia batuk dan bersin, atau melalui butiran ludah mereka yang menyebar di udara. Tuberkulosis paru dapat menyerang siapa saja, baik tua atau muda, laki-laki atau perempuan. Banyak gejala yang bisa terjadi pada seseorang yang terjangkit tuberkulosis paru,

    dan untuk menganalisa gejala tersebut bukan hal yang mudah, perlu dilakukan tes dahak pada penderita. Selain itu, dibutuhkan juga sebuah metode yang dapat mempermudah saat

    melakukan analisa dan menggali informasi pasien dari data rekam medik yang tersedia. Metode C4.5 (Decision Tree) adalah algoritma pengklasifikasian popular yang sederhana dan mudah diterapkan. Hasil yang diperoleh dari decision tree lebih mudah untuk dibaca dan

    ditafsirkan, melalui fitur untuk mengakses data detail profil pasien yang tersedia dalam pohon keputusan. Dengan perhitungan metode C4.5 diharapkan dapat membantu lebih awal dan

    memberikan banyak manfaat bagi pihak puskesmas dalam menangani pasien yang terjangkit tuberkulosis paru. Kata Kunci: Tuberkulosis Paru, Metode C4.5, Catatan Medis Pasien, Pusat Kesehatan

    ABSTRACT – Health is a very valuable thing for everybody. Pulmonary tuberculosis is a

    common contagious disease and in many cases deadly. Pulmonary tuberculosis is transmitted through the air when interacting with an infected person at the time when they cough and sneeze, or through their spittle granules that spread in the air. Pulmonary tuberculosis can

    affect all people, whether young or old, male or female. Many symptoms can occur in someone who contracted pulmonary tuberculosis, and to analyze the symptoms is not an easy

    thing, it needs to do sputum tests in patients. In addition, it is also necessary a method that can facilitate when performing analysis and extract patient information from medical record data available. The C4.5 (Decision Tree) method is a simple and easy-to-apply classification

    algorithm. The results obtained from the decision tree are easier to read and interpret, through features to access the detailed patient profile data available in the decision tree. With

    the calculation of C4.5 method is expected to help early and provide many benefits for the puskesmas in dealing with patients affected by pulmonary tuberculosis. Key Words: Pulmonary Tuberculosis, C4.5 Method, Patient Medical Records, Health Centers

    Naskah diterima : 15 Agustus 2017, Naskah dipublikasikan : 15 September 2017

    PENDAHULUAN

    Kesehatan merupakan nikmat yang

    paling berharga bagi diri manusia. Pada umumnya setiap orang menginginkan hidup sehat. Namun bukan hal yang mudah untuk

    menjaga kesehatan, ditambah lagi pola hidup yang kurang baik. Salah satu yang

    bisa dilihat adalah kebiasaan merokok,

    ditambah lagi pencemaran udara yang sangat tinggi dari polusi. Itu semua dapat

    menimbulkan berbagai penyakit paru-paru. Paru-paru adalah organ dari sistem pernapasan (respirasi) dan berhubungan

    dengan sistem peredaran darah. Pada organ paru terdapat beberapa jenis penyakit yang

    dapat dikelompokan menjadi dua yaitu

    mailto:[email protected]:[email protected]

  • Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

    Jurnal Kajian Ilmiah 112

    Universitas Bhayangkara Jakarta Raya

    penyakit paru spesifik (Tuberkulosis Paru) dan penyakit paru nonspesifik seperti bronchitis, pneumonia bronchiectasis,

    bronchial asthma, tumor paru, dan lain-lain. Di antara penyakit paru, penyakit yang

    paling menular dan berbahaya adalah tuberkulosis paru. Tuberculosis (TBC) merupakan penyakit menular yang umum,

    dan dalam banyak kasus bersifat mematikan. penyakit ini disebabkan oleh

    berbagai strain mikrobakteria, umumnya mycrobacterium tuberculosis. Biasanya menyerang paru-paru, namun juga bisa

    berdampak pada bagian tubuh lainnya. Tuberkulosis menyerang melalui udara

    ketika orang yang terinfeksi TB aktif batuk, bersin, atau menyebarkan melalui butiran ludah mereka melalui udara. TBC dapat

    menyerang siapa saja, baik tua maupun muda, laki-laki ataupun perempuan.

    Pusat Kesehatan Masyarakat (Puskesmas) merupakan salah satu sarana pelayanan kesehatan masyarakat yang amat

    penting di Indonesia. Puskesmas adalah pintu pertama pelayanan kesehatan di masyarakat. Jika ditinjau dari sistem

    pelayanan kesehatan di Indonesia, maka peranan dan kedudukan puskesmas adalah

    sebagai ujung tombak sistem pelayanan kesehatan di Indonesia.

    Seluruh data rekam medik pasien

    yang tersimpan di puskesmas dapat digunakan untuk penambangan data (data

    mining), sehingga bisa mengekstrak pengetahuan atau menemukan pola dari suatu data yang ada.

    LANDASAN TEORI Data Mining adalah proses untuk

    menemukan hubungan, pola dan tren baru yang bermakna dengan menyaring data sangat besar, yang tersimpan dalam

    penyimpanan, menggunakan teknik pengenalan pola seperti teknik statistik dan

    matematika (Kusrini dan Luthfi, 2009). Jadi, data mining adalah sebagai serangkaian proses mendapatkan

    pengetahuan atau pola dari kumpulan data.

    Data Mining adalah perpaduan dari Statistik, Artificial Inteligent dan Database (Gorunescu, 2011). Data Mining kemudian

    dikenal dengan nama Knowladge-discovery in Database. Knowladge-discovery in

    Database (KDD) adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola

    atau hubungan dalam set data berukuran besar. Keluaran dari data mining ini bisa

    dipakai untuk memperbaiki pengambilan keputusan di masa depan berdasarkan informasi yang di peroleh dari data masa

    lalu. Tergantung pada aplikasinya, data ini bisa berupa pasien, mahasiswa,

    permohonan kredit, image atau signal atau pengukuran lain yang perlu diklasifikasikan atau dicari fungsi regesinya atau relasi antar

    atribut. (Santosa, 2007). Pohon keputusan (Decision Tree)

    adalah, sebuah struktur data yang terdiri dari simpul (node) dan rusuk (edge). Simpul pada sebuah pohon dibedakan

    menjadi tiga, yaitu simpul akar (root node), simpul percabangan/internal (branch/internal node) dan simpul daun

    (leaf node). Metode decision tree dengan

    algoritma C4.5 dapat digunakan untuk mengumpulkan berbagai informasi dari data yang ada di Puskesmas. Decision Tree

    adalah algoritma pengklasifikasian yang popular yang sederhana dan mudah

    diterapkan, tidak membutuhkan pengetahuan domain atau parameter pengetahuan dan dapat menangani data

    dengan dimensional tinggi. Hasil yang diperoleh dari decision tree lebih mudah

    untuk membaca dan menafsirkan melalui fitur untuk mengakses data detail profil pasien yang tersedia dalam pohon

    keputusan. Pada penelitian ini, diagnosis yang dikembangkan akan lebih mengarah

    kepada perhitungan klasifikasi gejala apa saja yang mempengaruhi seseorang terkena tuberkulosis paru.

  • Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

    Jurnal Kajian Ilmiah 113

    Universitas Bhayangkara Jakarta Raya

    METODOLOGI PENELITIAN

    Tahapan Penelitian

    Penelitian yang dilakukan oleh

    penulis melalui tahapan sebagai berikut: 1. Perumusan Masalah

    Setiap penelitian didasarkan pada permasalahan yang dihadapi. Tahap perumusan masalah yaitu klasifikasi

    hal- hal yang mempengaruhi seseorang terjangkit penyakit TB paru dan apakah

    ada penyakit penyerta lainnya dengan batasan ruang lingkup yang akan diteliti.

    2. Penentuan Tujuan Penelitian

    Menentukan tujuan yang akan didapat dari perumusan masalah yang terjadi dari

    penelitian ini. Tujuan penelitian adalah untuk klasifikasi faktor yang mempengaruhi seseorang terkena

    tuberkulosis paru dan apakah ada penyakit penyerta lainnya dari data

    pasien yang terjangkit tuberkulosis paru menggunakan algoritma C4.5, sehingga membantu mendapatkan informasi untuk

    memprediksi kondisi pasien yang akan berobat.

    3. Studi Pustaka

    Langkah selanjutnya adalah memantapkan diri untuk meneliti

    masalah tersebut dengan teori yang berhubungan. Peneliti mempelajari buku-buku, jurnal penelitian, dan e-book

    teori tentang data mining yang akan digunakan sebagai kajian teori dalam

    penelitian. 4. Pengumpulan Data Primer

    Data yang dikumpulkan dari data pasien

    poli paru tahun 2016 pada di Puskesmas Kecamatan Cengkareng.

    5. Pengolahan Data Pengolahan data yang penulis lakukan menggunakan teknik Data Mining

    Algoritma C4.5 atau lebih dikenal pohon keputusan (Decision Tree).

    6. Deskripsi Hasil Penelitian Menganalisa hasil pengolahan data berdasarkan hasil penelitian dan teori

    yang ada dengan menggunakan perhitungan metode data mining

    algoritma C4.5 sehingga diperoleh hasil

    penelitian dan mendeskripsikan kesimpulan dari hasil penelitian yang telah dilakukan.

    Instrumen Penelitian

    Instrumen penelitian adalah suatu alat

    yang digunakan untuk mengukur fenomena alam maupun sosial yang diamati, fenomena tersebut disebut variabel

    penelitian (Sugiyono, 2009). Jadi instrumen penelitian merupakan alat bantu dalam

    mengumpulkan data yang diperlukan terkait dengan penelitian tersebut. Karena data tersebut adalah data kuantitatif yang

    dihitung dengan statistik dan menghasilkan deretan angka, maka instrumen yang

    digunakan adalah melakukan pencatatan, wawancara informal dan dokumentasi dengan terjun langsung ke lapangan guna

    mengambil data primer yang dibutuhkan saat observasi. Informasi yang dihasilkan

    dari berbagai instrumen tidak perlu dicari validitas reliabelnya, sebab data yang diproses bersumber dari lembaga

    bersangkutan yang menjadi tempat penelitian. Data yang diambil yaitu data historis rekam medik pasien yang terjangkit

    penyakit tuberkulosis paru pada Puskesmas Kecamatan Cengkareng, Jakarta Barat.

    Metode Pengumpulan Data

    Pengumpulan data pada penelitan ini dilakukan dengan cara sebagai berikut:

    a. Penelitian Lapangan Penelitian lapangan adalah penelitian

    yang dilakukan langsung pada objek yang diteliti. Dalam hal ini pengumpulan data diperoleh melalui:

    b. Wawancara (Interview) Penulis melakukan wawancara secara

    langsung oleh sumber informasi yaitu kepala bagian poli paru Ibu Dr. Fitriani pada Puskesmas Kecamatan

    Cengkareng. c. Observasi

    Pengunpulan data ini dilakukan dengan pengamatan dan pencatatan secara langsung pada objek penelitian untuk

    mendapatkan data-data yang diperlukan dalam penelitian. Seperti pencatatan dan

  • Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

    Jurnal Kajian Ilmiah 114

    Universitas Bhayangkara Jakarta Raya

    pengamatan langsung pada saat wawancara.

    d. Dokumentasi

    Pengumpulan data ini dilakukan dengan cara pengambilan data-data dokumen

    yang diperlukan untuk kebutuhan penelitian. Dengan mengambil Data rekam medik pasien tahun 2016 yang

    terjangkit penyakit Tuberkulosis Paru, visi dan misi perusahaan.

    Populasi

    Populasi adalah wilayah generalisasi yang terdiri atas: obyek/subyek yang

    mempunyai kualitas dan karakteristik tertentu yang ditetapkan oleh peneliti untuk

    dipelajari dan kemudian ditarik kesimpulannya. Jadi populasi tidak hanya orang tetapi obyek dan benda-benda alam

    yang lain. Populasi juga bukan sekedar jumlah yang ada pada obyek/subyek yang

    dipelajari, tetapi meliputi seluruh karakteristik/sifat yang dimiliki oleh subyek atau obyek itu (Sugiyono, 2009).

    Berdasarkan kesimpulan di atas, populasi dalam penelitian ini yaitu Data 247 data pasien poli paru Tahun 2016 pada

    Puskesmas Kec. Cengkareng Jl. Kamal Raya No.02 RT.9/RW.7, Kelurahan

    Cengkareng Barat, Kecamatan Cengkareng –Jakarta Barat 11730.

    Sample Penelitian

    Sample adalah bagian dari jumlah dan karakteristik yang dimiliki oleh populasi

    besar dan peneliti tidak mungkin mempelajari semua yang ada pada populasi, kesimpulannya akan dapat diberlakukan

    untuk populasi sample yang di ambil harus betul- betul mawakili (Sugiyono, 2009).

    Analisis Data

    Dalam penelitian ini penulis menggunakan analisis data kuantitatif, yaitu

    suatu analisa data yang dipergunakan apabila kesimpulan-kesimpulan yang

    diperoleh dapat dibuktikan dengan angka-angka dan juga dalam perhitungan dipergunakan rumus yang ada hubungannya

    dengan analisis penelitian. Dalam hal ini

    akan dipegunakan analisis Algoritma C4.5 (Decision Tree). Selanjutnya penulis melakukan pengamatan serta analisa

    terhadap permasalahan di Puskesmas Kecamatan Cengkareng yang terjadi pada

    Bagian Poli Paru dengan menggunakan metode pengolahan Data Algoritma C4.5 (Decision Tree).

    Ada beberapa tahap dalam membuat pohon keputusan dengan algoritma C4.5

    (Kusrini, 2007). Yaitu : 1. Menyiapkan data training. 2. Data training biasanya diambil dari data

    histori yang pernah terjadi sebelumnya dan sudah dikelompokan ke

    dalam kelas-kelas tertentu. 3. Menentukan akar dari pohon. Akar akan

    mengambil dari atribut yang terpilih,

    dengan cara menghitung niali gain dari masing – masing atribut, niali gain yang

    paling tinggi yang akan menjadi akar pertama. Sebelum menghitung nilai gain dari atribut, hitung dahulu nilai entropy.

    Untuk menghitung nilai entropy digunakan rumus:

    Keterangan :

    S = himpunan kasus n = jumlah partisi S pi = proposi Si terhadap S

    4. Kemudian hitung nilai gain dengan

    rumus :

    Keterangan : S = himpunan kasus A = fitur

    n = jumlah partisi atribut A |Si| = proposi Si terhadap S

    |S| = jumlah kasus dalam S

    5. Ulangi langkah ke-2 hingga semua

    record terpartisi 6. Proses partisi pohon keputusan akan

    berhanti saat:

  • Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

    Jurnal Kajian Ilmiah 115

    Universitas Bhayangkara Jakarta Raya

    a. Semua record dalam simpul N mendapat kelas yang sama.

    b. Tidak ada atribut di dalam record

    yang dipartisi lagi. c. Tidak ada record di dalam cabang

    yang kosong. Setelah hasil perhitungan algoritma

    C4.5 didapat dengan perhitungan manual,

    maka akan lebih akurat dengan software Rapid Miner. Dengan cara menginput table

    ke dalam Ms. Excel yang kemudian akan dimasukan ke software Rapid Miner file akan terbaca apabila format yang digunakan

    xls.

    PEMBAHASAN

    Berdasarkan data rekam medik pasien yang berobat tahun 2016 di poli paru Puskesmas Kecamatan Cengkareng dapat

    diperoleh data sebagai berikut:

    Tabel 1. Data Rekam Medik Pasien Poli Paru

    No

    .

    Jen

    is k

    ela

    min

    Um

    ur

    Ba

    tuk

    2-3

    min

    gg

    u

    Ker

    ing

    at

    ma

    lam

    Ber

    at

    ba

    da

    n t

    uru

    n

    Na

    fsu

    ma

    ka

    n b

    erk

    ura

    ng

    Riw

    ay

    t k

    on

    tak

    TB

    Ba

    tuk

    ber

    da

    ha

    k

    Ba

    tuk

    ber

    da

    rah

    Ha

    sil

    BC

    G m

    un

    cul

    Cep

    at

    Ben

    jola

    n d

    i le

    her

    Ha

    sil

    1 Prmpn 55-64 y t y y t y t t t -

    2 Laki2 15-24 y y y y t y y t t +

    3 Laki2 >65 y t y t t y t t t -

    4 Laki2 25-34 y y y t t y t t t -

    5 Laki2 15-24 y y y y y y y t t +

    6 Laki2 35-44 y y y t t y t t t -

    7 Prmpn 15-24 y y y t t y t t t -

    8 Prmpn 15-24 y y y y t y y t t +

    9 Prmpn 25-34 y y y y t y y t t +

    10 Prmpn 15-24 y y y t t y t t t -

    11 Laki2 25-34 y t y y t y t t t -

    12 Laki2 55-64 y y y y t y t t t +

    13 Laki2 35-44 y t y y t t t t t -

    14 Laki2 45-54 y y y t t y t t t -

    15 Laki2 45-54 y y y t t y t t t -

    16 Prmpn 15-24 y y y t t y t t t -

    17 Prmpn 15-24 y y y t t y t t t -

    18 Laki2 25-34 y t y y y y y t t +

    19 Prmpn >65 y t y y t y t t t -

    20 Prmpn >65 y t y y t y t t t -

    21 Laki2 45-54 y y y t t y t t t -

    22 Laki2 35-44 y t y y t y t t t -

    23 Laki2 35-44 y t y y t y t t t -

    24 Prmpn 25-34 y y y y y y t t t +

    25 Laki2 25-34 y y y y y y t t t +

    26 Laki2 25-34 y y y y t y y t t +

    27 Laki2 45-54 y y y y t y y t t +

    28 Laki2 0-14 y t y y t y y y y +

    29 Laki2 45-54 y t y y t t t t t -

    Sumber: Puskesmas Cengkareng (2016)

    Berdasarkan tabel tersebut dengan menggunakan metode C4.5 (Decision Tree) akan ditentukan seseorang positif atau

    negatif terjangkit tuberkulosis paru dengan melihat Jenis kelamin, umur, batuk 2-

    minggu, keringat malam, berat badan turun, nafsu makan berkurang, riwayat kontak TB, batuk berdahak, batuk berdarah, hasil

    suntikan BCG muncul lebih cepat 1 minggu dan muncul benjolan di leher.

    Tabel 2. Proses Klasifikasi Data

    JUM

    LAH

    K

    ASU

    S

    NEG

    ATI

    F

    PO

    SITI

    F

    ENTR

    OP

    Y

    GA

    IN

    TOTAL

    247 106 141 0,985467

    jenis kelamin

    0,014028

    Laki2 146 71 75 0,999458

    Prmpn 101 35 66 0,930935

    Umur

    0,122861

    0-14 44 3 41 0,359101

    15-24 47 22 25 0,997059

    25-34 46 18 28 0,965636

    35-44 48 25 23 0,998747

    45-54 32 19 13 0,974489

    55-64 23 13 10 0,987692

    >65 7 6 1 0,591672

    Batuk

    2-3 minggu

    0,000340

    YA 244 105 139 0,985948

    TIDAK 3 1 2 0,918295

    Keringat malam

    0,039899

    YA 158 54 104 0,926504

    TIDAK 89 52 37 0,979411

    Berat badan

    turun

    0,000340

    YA 244 105 139 0,985948

    TIDAK 3 1 2 0,918295

    Nafsu

    makan

    0,283186

    Berkurang YA 174 41 133 0,787700

    TIDAK 73 65 8 0,498675

    Riwayat

    kontak TB

    0,153185

    YA 48 1 47 0,14609

  • Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

    Jurnal Kajian Ilmiah 116

    Universitas Bhayangkara Jakarta Raya

    TIDAK 199 105 94 0,99779

    Batuk

    berdahak

    0,030374

    YA 196 94 102 0,99879

    TIDAK 51 12 39 0,78712

    Batuk

    berdarah

    0,182145

    YA 68 4 64 0,32275

    TIDAK 179 102 77 0,98588

    Hasil BCG

    muncul cepat

    0,128261

    YA 42 1 41 0,16232

    TIDAK 205 105 100 0,99957

    Muncul

    benjolan dileher

    0,128261

    YA 42 1 41 0,16232

    TIDAK 205 105 100 0,999570 Sumber: Hasil olahan data

    Untuk memilih atribut sebagai akar,

    didasarkan pada nilai gain tertinggi dari atribut-atribut yang ada. Sebelum

    menghitung nilai gain dari atribut, hitung dahulu nilai entropy yaitu:

    Berdasarkan tabel rekam medik

    diatas, maka dihitung nilai entropy terlebih dahulu

    1. Menghitung Nilai Entropy Total

    Entropy (Total) =

    (-106/247*log2(106/247))+(-141/247* log2 (141/247))

    Entropy (Total) = 0,985467

    2. Menghitung nilai entropy Jenis

    Kelamin

    Entropy (jenis kelamin,laki-laki) =

    (-71/146*log2(71/146))+(-75/146* log2 (75/146))

    Entropy (jenis kelamin,laki-laki l) = 0,999458

    Entropy (jenis kelamin,perempuan) = (-35/101*log2(35/101))+ (-66/101* log2 66/101))

    Entropy (jenis kelamin,perempuan) = 0,930935

    Gain (Total,jenis kelamin) = 0,985467196–((-146/247*

    0,999458482)+(101/247*0,930935072))

    Gain(Total, jenis kelamin)= 0,014028

    3. Menghitung Entropy Umur: Entropy(umur,0-14)=

    (-3/44*log2(3/44))+(-41/44* log2(41/44))

    Entropy(umur,0-14)= 0,359101

    Entropy(umur,15-24)= (-22/47*log2(22/47))+(-25/47*

    log2(25/47))

    Entropy(umur,15-24)= 0,997059

    Entropy(umur,25-34)= (-18/46*log2(18/46))+(-28/46*

    log2(28/46))

    Entropy(umur, 25-34)= 0,965636

    Entropy(umur,35-44)=

    (-25/48*log2(25/48))+(-23/48* log2(23/48))

    Entropy(umur,35-44)= 0,998747

    Entropy(umur,45-54)=

    (-19/32*log2(19/32))+(-13/32* log2(13/32))

    Entropy(umur,45-54)= 0,974489 Entropy(umur,55-64)=

    (-13/23*log2(13/23))+(-10/23* log2(10/23))

    Entropy(umur, 55-64)= 0,987692

    Entropy(umur,>65)= (-6/7*log2(6/7))+(-1/7* log2(1/7))

    Entropy(umur,>65)= 0,591672

    Gain(Total,umur)=

    0,985467196–((-44/247*0,359101626)+ (47/247*0,997059057)+ (46/247*0,965636133)+

    (48/247*0,998747298)+

  • Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

    Jurnal Kajian Ilmiah 117

    Universitas Bhayangkara Jakarta Raya

    (32/247*0,974489403)+ (23/247*0,987692509)+ (7/247*0,591672779))

    Gain(Total,umur) = 0,122861

    4. Menghitung Entropy Batuk 2-3

    Minggu

    Entropy(batuk 2-3 minggu,YA)= (-105/244*log2(105/244))+

    (-139/244*log2139/244))

    Entropy(batuk 2-3 minggu,YA)=

    0,985948

    Entropy(batuk 2-3 minggu,TIDAK)= (-1/3*log2(1/3))+(- 2/3* log2(2/3))

    Entropy(batuk 2-3 minggu,TIDAK)= 0,918295

    Gain(Total, batuk 2-3 minggu) = 0,985467196–((-244/247*0,985948041)+

    (3/247*0,918295834))

    Gain(Total,umur) = 0,000340

    5. Menghitung Entropy Keringat malam

    Entropy(keringat malam,YA)= (-54/158*log2(154/58))+ (-104/158*log2(104/158))

    Entropy(keringat malam,YA)= 0,926504

    Entropy(keringat malam,TIDAK)= (-52/89*log2(52/89))+ (-37/89*log2(37/89))

    Entropy(keringat malam,TIDAK)= 0,979411

    Gain(Total,keringat malam) =

    0,985467196–((-158/247*0,926504446)+ (89/247*0,979411635))

    Gain(Total,umur) =0,039899

    Dari perhitungan pada tabel IV.2 dihasilkan gain tertinggi pada nafsu makan Berkurang dengan nilai 0,283186. Dengan

    demikian nasfu makan berkurang menjadi

    node akar. Ada dua nilai atribut dari nasfu makan berkurang yaitu YA dan TIDAK keduanya masih perlu dilakukan

    perhitungan lagi.

    KESIMPULAN DAN SARAN

    Dari uraian yang telah disampaikan

    penulis, dapat diambil kesimpulan sebagai berikut: 1. Hasil perhitungan secara manual bahwa

    yang menjadi node akar adalah atribut nafsu makan berkurang dan hasil akhir

    kelas pada atribut jenis kelamin dan keringat malam.

    2. Hasil perhitungan menggunakan

    Aplikasi Rapid Miner, yang menjadi node akar adalah atribut nafsu makan

    berkurang dan hasil akhir kelas pada atribut jenis kelamin,hasil suntikan BCG muncul, dan keringat malam.

    3. Dari hasil perhitungan secara manual dan menggunakan aplikasi Rapid Miner didapat hasil yang hampir sama. Yaitu

    atribut nafsu makan berkurang menjadi node akar seseorang terkena

    Tuberkulusis Paru. Sedangkan hasil akhir kelas pada perhitungan manual didapat atribut jenis kelamin, keringat

    malam dan perhitungan Rapid miner didapat atribut jenis kelamin, keringat

    malam dan hasil suntikan BCG muncul cepat. Yang membedakan hanya atribut hasil suntikan BCG muncul pada

    perhitungan Rapid miner. 4. Dari hasil penelitian yang penulis ambil

    dari data pasien yang ada, Penulis menyimpulkan bahwa faktor seseorang batuk lebih 2-3 minggu, batuk

    berdahak,dan batuk berdarah belum tentu terkena Tuberkulosis Paru. Bisa

    saja terjangkit penyakit lain, seperti bronchitis, pneumonia brockiectasis, asma bronkiole dan penyakit pernafasan

    lainnya.

  • Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

    Jurnal Kajian Ilmiah 118

    Universitas Bhayangkara Jakarta Raya

    Berdasarkan hasil penelitian penerapan algoritma C4.5 pada penyakit Tuberkulosis yang akan diajukan, maka

    saran yang selayaknya dapat dan dipertimbangkan agar dalam implementasi

    nanti dapat bermanfaat dimasa depan sebagai berikut:

    1. Memperluas ruang lingkup dari penelitian, sehingga menghasilkan informasi yang lebih menyeluruh

    terhadap kondisi pasien dan menjadi bahan pertimbangan dalam pengambilan

    keputusan untuk menentukan strategi pihak puskesmas.

    2. Perlunya pemeliharaan dan pengawasan

    data pasien yang berguna sebagai bahan informasi menganalisa kondisi dimasa

    yang akan datang. 3. Mengembangkan pengarsipan data yang

    lebih terkomputerisasi yang berhubung

    dengan data mining, seperti data warehouse.

    DAFTAR PUSTAKA

    Gorunescu, Florin. (2011). Data Mining-

    Concepts, Models, and Techniques. Berlin: Springer.

    Hermawati, Fajar Astuti. (2013). Data

    Mining. Yogyakarta: Andi Offset.

    Himawan, Hidayatulah, Oliver S.

    Simanjuntak, Triawan, Agus. (2015). Diagnosa Tingkat Kesehatan Pasien Menggunakan Metode Decision Tree.

    ISSN: 1979-2328. Yogyakarta: Jurnal Ilmiah UPN “Veteran” Vol I, No. 1

    Yogyakarta 2015 : 178-181. Diambil dari: http://jurnal.upnyk.ac.id/index.php/se

    mnasif/article/view/1380 (23 Oktober 2016)

    Ihsan dan Wajhillah, Rusda. (2015).

    Penerapan Algoritma C4.5 terhadap

    Diagnosa Penyakit demam Tifoid Berbasis Mobile. ISSN: 2355-990.

    Sukabumi: Jurnal Ilmiah Swabumi Vol III, No. 1 September 2015: 24-

    30. Diambil dari: https://www.researchgate.net/publication/290438140 (22 Oktober 2016)

    Iswanto, Mukhammad Hasim, Adhistya

    Erna Permanasari, dan Hanung Adi Nugroho. (2015). Pemanfaatan Teknik Data Mining Untuk Diagnosis

    Penyakit Tuberculosis (TBC). ISSN: 2302-3805. Yogyakarta: Jurnal Ilmiah

    Semnasteknomedia Vol III, No.1 6-7 Februari 2015: 121-124. Diambil dari:

    http://ojs.amikom.ac.id/index.php/semnasteknomedia/article/view/901 (16

    Oktober 2016) Kusrini. (2007). Konsep dan Aplikasi

    Sistem Pendukung Keputusan. Yogyakarta: Andi Offset.

    Kusrini dan Luthfi, E.T. (2009). Algoritma

    Data Mining. Yogyakarta: Andi

    Offset. Santosa, Budi. (2007). Data Mining

    Terapan dengan Matlab. Yogyakarta: Graha Ilmu.

    Sugiyono. (2009). Metode Penelitian Bisnis

    (Pendekatan Kuantitatif, Kualitatif,

    dan R&D). Bandung: Alfabeta.

    Widodo, Prabowo Pudjo, Rahmadya Trias Handayanto, dan Herlawati. (2013). Penerapan Data Mining Dengan

    Matlab. Bandung: Rekayasa Sains.

    http://jurnal.upnyk.ac.id/index.php/semnasif/article/view/1380http://jurnal.upnyk.ac.id/index.php/semnasif/article/view/1380https://www.researchgate.net/publication/290438140https://www.researchgate.net/publication/290438140http://ojs.amikom.ac.id/index.php/semnasteknomedia/article/view/901http://ojs.amikom.ac.id/index.php/semnasteknomedia/article/view/901