13
perpustakaan.uns.ac.id digilib.uns.ac.id commit to user Penentuan Model Terbaik pada Metode Naïve Bayes Classifier dalam Menentukan Status Gizi Balita Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Jurusan Informatika Disusun Oleh: Apriliya Fitri Cahyanti NIM. M0510009 JURUSAN INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2015

Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

  • Upload
    doanbao

  • View
    254

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

dalam Menentukan Status Gizi Balita

Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu

Jurusan Informatika

Disusun Oleh:

Apriliya Fitri Cahyanti

NIM. M0510009

JURUSAN INFORMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET

SURAKARTA

2015

Page 2: Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

ii

SKRIPSI

Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

dalam Menentukan Status Gizi Balita

Disusun Oleh:

Apriliya Fitri Cahyanti

M0510009

Skripsi ini telah disetujui untuk dipertahankan di hadapan dewan penguji,

Pada tanggal : 30 Januari 2015

PERSETUJUAN PEMBIMBING

Tugas Akhir ini telah disetujui oleh :

Pembimbing 1,

Ristu Saptono S.Si, M.T

NIP. 19790210 200212 1 001

Pembimbing 2,

Sari Widya Sihwi, S.Kom., M.T.I

NIP. 19830412 200912 2 003

Page 3: Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

iii

SKRIPSI

Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

dalam Menentukan Status Gizi Balita

Disusun Oleh:

Apriliya Fitri Cahyanti

M0510009

Telah dipertahankan di hadapan Dewan Penguji

Pada tanggal : 30 Januari 2015

Susunan Dewan Penguji

1. Ristu Saptono, S.Si, M.T. ( )

NIP. 19790210 200212 1 001

2. Sari Widya Sihwi, S.Kom., M. T. I ( )

NIP. 19830412 200912 2 003

3. Hasan Dwi Cahyono, S.Kom., M.Kom ( )

NIP. 19820524 201404 1 001

4. Afrizal Doewes, S.Kom., M.Sc ( )

NIP. 19850831 201212 1 004

Disahkan oleh:

Ketua Jurusan Informatika

Drs. Bambang Harjito, M.App.Sc., Ph.D

NIP. 19621130 199103 1 002

Page 4: Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

iv

MOTTO

“Do not pray for an easy life, pray for the strength to endure a difficult one.”

(Bruce Lee)

“Hidup adalah perjuangan, kebahagiaan harus direngkuh dengan banyak

pengorbanan”

(Darwis Tere Liye)

Page 5: Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

v

PERSEMBAHAN

Kaya ini penulis persembahkan untuk:

“Bapak Ahmad Sairi dan Ibu Supriyati, kedua orang tua yang selalu

memberikan doa dan kasih sayang tak terhingga”

“Kurnia Rahmawati dan Anggita Tantri Utami, kakak dan adik tercinta yang

selalu memberikan doa dan dukungan”

“Viko Basmalah Wicaksono, yang selalu mendampingi dan memberi

dukungan”

“Teman-teman Informatika UNS 2010 khususnya Cerren, Lydia, Diannita,

Hedik, Adit, Taufik, Aji, Ashar, Miftah”

“Anak – anak d’brandies Aish, Tika, Ika, Mania, Eva, Shofi, Dian, Pingky”

Page 6: Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

vi

KATA PENGANTAR

Puji dan syukur penulis ucapkan kepada Allah SWT, yang hanya karena

rahmat dan karunia-Nya, penulis dapat menyelesaikan Tugas Akhir dengan judul

“Penentuan Model Terbaik pada Metode Naïve Bayes Classifier dalam

Menentukan Status Gizi Balita dengan Mempertimbangkan Independensi Antar

Parameter”. Penulis menyadari akan keterbatasan yang dimiliki. Begitu banyak

bantuan dan bimbingan yang diberikan dalam penyusunan Tugas Akhir ini. Oleh

karena itu, penulis mengucapkan terima kasih kepada :

1. Ayah, ibu, kakak, dan adik yang senantiasa selalu memberikan motivasi,

doa dan dukungannya.

2. Bapak Ristu Saptono, S.Si., M.T. Selaku Dosen Pembimbing I yang telah

memberikan pengarahan selama proses penyusunan Tugas Akhir ini,

3. Ibu Sari Widya Sihwi, S.Kom., M.T.I. selaku Dosen Pembimbing II yang

telah memberikan masukan, kritik dan saran yang membangun,

4. Bapak Ibu dosen Informatika FMIPA UNS,

5. Viko Basmalah Wicaksono yang selalu memberikan doa dan dukungan,

6. Seluruh teman – teman informatika 2010 yang telah memberikan

kebersamaannya dan membantu selama ini,

7. Semua pihak yang tidak dapat disebutkan satu persatu.

Semoga Tugas Akhir ini bermanfaat dan memberikan inspirasi bagi semua

pihak yang berkepentingan.

Surakarta, 22 Januari 2015

Penulis

Page 7: Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

vii

Determination the Best Model in Naïve Bayes Classifier Methods in Determine

of Under-Five Children's Nutritional Status

Apriliya Fitri Cahyanti

Informatics Department. Faculty of Mathematics and Natural Science.

Sebelas Maret University

ABSTRACT

Naïve Bayes Classifier method has assumption to be optimal when its

parameters are independent. But in the reality, this assumption is often ignored.

An independent parameters can be determined from value of correlation between

each parameters. This study discusses about the determination of the best model

using Naive Bayes Classifier method in the case study of assessment of under-five

children's nutritional status. To make the data model, it used Backward Feature

Selection with correlation testing using Cosine Similarity. The correlation testing

is applied for knowing the relation of parameters between classes of classification

and independence each parameter.

The determination of the best model can be shown from accuracy,

simplicity, time, and data acquisition. In the 60%:40% scenario data, the best

model consist of weight, BMI, and age that resulting 94.4% for the accuracy.

While in the 80%:20% scenario data, the best model shown in model which

consist of weight, BMI, height, age, and gender that resulting 94.8% for the

accuracy. This study shows that correlation of parameters affect the classification

results, whereas the use of the independent parameters is not necessarily produce

an optimal accuracy. In fact, the best model in this study consist of the dependent

parameters.

Keyword— Cosine Similarity, Naïve Bayes Classifier, Determining Nutritional

Status.

Page 8: Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

viii

Penentuan Model Terbaik pada Metode Naïve Bayes Classifier dalam

Menentukan Status Gizi Balita

Apriliya Fitri Cahyanti

Jurusan Informatika. Fakultas Matematika dan Ilmu Pengetahuan Alam.

Universitas Sebelas Maret

ABSTRAK

Metode Naïve Bayes Classifier memiliki asumsi parameter yang saling

independen. Padahal pada kenyataannya asumsi ini sering dilangggar. Suatu

parameter dikatakan sebagai parameter independen dapat dilihat dari korelasi

antar parameter tersebut. Artikel ini membahas mengenai penentuan model terbaik

menggunakan Naive Bayes dalam studi kasus penilaian status gizi balita.

Pembentukan model data menggunakan Backward Feature Selection, dengan

melakukan uji korelasi menggunakan Cosine Similarity. Uji korelasi dilakukan

untuk mengetahui hubungan antara parameter dengan kelas klasifikasi, dan

independensi antar parameter.

Penentuan model terbaik dilihat dari akurasi, kesederhanaan, waktu, dan

akuisisi data. Pada skenario data 60%:40%, model terbaik terdiri dari parameter

berat, BMI, dan umur, dengan akurasi sebesar 94.4%. Sedangkan pada skenario

data 80%:20% model terbaik terdiri dari parameter berat, BMI, tinggi, umur, dan

jenis kelamin, dengan akurasi 94,8%. Penelitian ini menunjukkan bahwa kolerasi

parameter dengan kelas klasifikasi lebih mempengaruhi hasil klasifikasi,

sedangkan penggunaan parameter independen belum tentu menghasilkan akurasi

yang optimal. Bahkan, model terbaik pada penelitian ini terdiri dari parameter

dependen.

Kata Kunci — Cosine Similarity, Naïve Bayes Classifier, Penilaian Status Gizi.

Page 9: Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

ix

DAFTAR ISI

HALAMAN JUDUL ............................................................................................... i

HALAMAN PERSETUJUAN ................................................................................ ii

HALAMAN PENGESAHAN ............................................................................... iii

MOTTO ................................................................................................................. iv

HALAMAN PERSEMBAHAN ..............................................................................v

KATA PENGANTAR ............................................................................................. vi

ABSTRACT ............................................................................................................ vii

ABSTRAK ........................................................................................................... viii

DAFTAR ISI .......................................................................................................... ix

DAFTAR TABEL .................................................................................................. xi

DAFTAR GAMBAR ............................................................................................ xii

DAFTAR LAMPIRAN ........................................................................................ xiii

BAB I .......................................................................................................................1

1.1. Latar Belakang .........................................................................................1

1.2. Rumusan Masalah ....................................................................................2

1.3. Batasan Masalah ......................................................................................2

1.4. Tujuan Penelitian .....................................................................................2

1.5. Manfaat Penelitian ...................................................................................3

1.6. Sistematika Penulisan ..............................................................................3

BAB II ......................................................................................................................4

TINJAUAN PUSTAKA ...........................................................................................4

2.1. Landasan Teori .........................................................................................4

2.1.1. Naïve Bayesian Classifier ........................................................................4

2.1.2. Backward Feature Selection ....................................................................6

2.1.3. Korelasi ....................................................................................................7

2.1.4. Cosine Similarity ......................................................................................7

2.1.5. Holdout atau Stratified Random Sampling ..............................................8

2.1.6. Penilaian Status Gizi Balita .....................................................................8

2.2. Penelitian Terkait ...................................................................................10

2.3. Kerangka Pemikiran ...............................................................................12

BAB III ..................................................................................................................14

Page 10: Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

x

3.1. Analisa Kasus dan Pengumpulan Data ..................................................14

3.2. Analisis dan Perancangan ......................................................................15

3.3. Pengembangan Aplikasi .........................................................................18

3.4. Pengujian ................................................................................................18

BAB IV ..................................................................................................................19

4.1. Deskripsi Data ........................................................................................19

4.2. Pemodelan Data .....................................................................................19

4.2.1. Uji Korelasi Parameter dengan Cosine Similarity .................................19

4.2.2. Pembentukan Model Data dengan Backward Feature Selection ...........22

4.3. Hasil dan Evaluasi ..................................................................................26

4.3.1. Pengujian Sistem Penentuan Model Terbaik..........................................26

4.3.2. Pengujian WEKA ...................................................................................30

BAB V ....................................................................................................................32

5.1. KESIMPULAN ......................................................................................32

5.2. SARAN ..................................................................................................33

DAFTAR PUSTAKA .............................................................................................34

Page 11: Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

xi

DAFTAR TABEL

Tabel 2.1. Contoh Dataset Perhitungan Naïve Bayes Classifier ..............................5

Tabel 2.2. Simulasi Backward Feature Selection.....................................................6

Tabel 2.3. Kategori Ambang Batas Kategori Berat Badan ......................................9

Tabel 2.4. Kategori Ambang Batas Tinggi Badan ....................................................9

Tabel 2.5. Kategori Ambang Batas BMI ................................................................10

Tabel 2.6. Keterkaitan Penelitian dengan Penelitian Sebelumnya .........................13

Tabel 3.1. Nilai Parameter untuk Penilaian Status Gizi .........................................15

Tabel 3.2. Prosedur Percobaan ...............................................................................18

Tabel 4.1. Uji Korelasi Status Gizi Dengan Parameter pada Skenario 60%:40% .20

Tabel 4.2. Uji Korelasi Antar Parameter pada Skenario 60%:40% .......................20

Tabel 4.3. Uji Korelasi Status Gizi Dengan Parameter pada Skenario 80%:20% .21

Tabel 4.4. Uji Korelasi Antar Parameter pada Skenario 80%:20% .......................22

Tabel 4.5. Model Data pada Skenario 60%:40% ...................................................23

Tabel 4.6. Model Data pada Skenario 80%:20% ...................................................25

Tabel 4.7. Model Data pada Skenario 60%:40% ...................................................27

Tabel 4.8. Model Data pada Skenario 80%:20% ...................................................29

Tabel 4.9. Perbandingan Hasil Akurasi Testing .....................................................30

Page 12: Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

xii

DAFTAR GAMBAR

Gambar 3.1. Alur Penelitian ...................................................................................16

Gambar 3.2. Alur Pembentukan Model Backward ................................................17

Page 13: Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

xiii

DAFTAR LAMPIRAN

LAMPIRAN A Data Gizi Balita dari Posyandu.....................................................36

LAMPIRAN B Data Gizi Balita Sebelum Pendiskritan ........................................62

LAMPIRAN C Data Gizi Balita Sesudah Pendiskritan .........................................68

LAMPIRAN D Hasil Pengujian Skenario Data 60%:40% ....................................74

LAMPIRAN E Hasil Pengujian Skenario Data 80%:20% ....................................80

LAMPIRAN F Pedoman Standar Antropometri Menurut Menteri Kesehatan

Republik Indonesia ................................................................................................86