100
IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA PENGENALAN EMOSI BERDASARKAN SUARA MANUSIA Skripsi Oleh: LULUT DWI PUTRI BAGASWARI NIM: 11140910000041 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 2019 M / 1440 H

IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

  • Upload
    others

  • View
    12

  • Download
    0

Embed Size (px)

Citation preview

Page 1: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

i UIN Syarif Hidayatullah Jakarta

IMPLEMENTASI ALGORITMA BACKPROPAGATION

PADA PENGENALAN EMOSI

BERDASARKAN SUARA MANUSIA

Skripsi

Oleh:

LULUT DWI PUTRI BAGASWARI

NIM: 11140910000041

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

JAKARTA

2019 M / 1440 H

Page 2: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

ii UIN Syarif Hidayatullah Jakarta

IMPLEMENTASI ALGORITMA BACKPROPAGATION

PADA PENGENALAN EMOSI

BERDASARKAN SUARA MANUSIA

Skripsi

Oleh:

LULUT DWI PUTRI BAGASWARI

NIM: 11140910000041

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

JAKARTA

2019 M / 1440 H

Page 3: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

iii UIN Syarif Hidayatullah Jakarta

LEMBAR PERSETUJUAN

IMPLEMENTASI ALGORITMA BACKPROPAGATION

PADA PENGENALAN EMOSI

BERDASARKAN SUARA MANUSIA

Skripsi

Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Komputer

Fakultas Sains dan Teknologi

Universitas Islam Negeri Syarif Hidayatullah Jakarta

Oleh:

Lulut Dwi Putri Bagaswari

11140910000041

Menyetujui,

Pembimbing I,

Feri Fahrianto, M.Sc

NIP. 19800829 201101 1 002

Pembimbing II,

Luh Kesuma Wardhani, MT

NIP. 19780424 200801 2 022

Mengetahui,

Ketua Program Studi Teknik Informatika

Imam M. Shofi, MT

NIP. 19720205 200801 1 010

Page 4: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

iv UIN Syarif Hidayatullah Jakarta

LEMBAR PENGESAHAN

Skripsi berjudul “Implementasi Algoritma Backpropagation Pada Pengenalan

Emosi Berdasarkan Suara Manusia” yang ditulis oleh Lulut Dwi Putri Bagaswari,

NIM 11140910000041 telah diuji dan dinyatakan lulus dalam sidang munaqosyah

Fakultas Sains dan Teknologi, UIN Syarif Hidayatullah Jakarta pada hari Rabu, 29

Mei 2019. Skripsi ini telah diterima sebagai salah satu syarat untuk memperoleh

gelar Sarjana Komputer (S.Kom) pada Program Studi Teknik Informatika.

Jakarta, 29 Mei 2019

Tim Penguji,

Penguji I,

Fitri Mintarsih, M.Sc

NIP. 19800829 201101 1 002

Penguji II,

Hendra Bayu Suseno, M.Kom

NIP. 1982121 200912 1 003

Tim Pembimbing,

Pembimbing I,

Feri Fahrianto, M.Sc

NIP. 19800829 201101 1 002

Pembimbing II,

Luh Kesuma Wardhani, MT

NIP. 19780424 200801 2 022

Mengetahui,

Page 5: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

v UIN Syarif Hidayatullah Jakarta

PERNYATAAN ORISINALITAS

Dengan ini saya menyatakan bahwa:

1. Skripsi ini merupakan hasil karya asli saya yang diajukan untuk memenuhi salah

satu persyaratan memperoleh gelar strata 1 di UIN Syarif Hidayatullah Jakarta.

2. Semua sumber yang tercantum dalam penulisan ini telah saya cantumkan sesuai

dengan ketentuan yang berlaku di UIN Syarif Hidayatullah Jakarta.

3. Apabila di kemudian hari terbukti karya ini bukan hasil karya asli saya, maka

saya bersedia menerima sanksi yang telah ditetapkan di UIN Syarif Hidayatullah

Jakarta.

Jakarta, 29 Mei 2019

Lulut Dwi Putri Bagaswari

Page 6: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

vi UIN Syarif Hidayatullah Jakarta

PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI

Sebagai civitas akademik UIN Syarif Hidayatullah Jakarta, saya yang bertanda

tangan di bawah ini:

Nama : Lulut Dwi Putri Bagaswari

NIM : 11140910000041

Program Studi : Teknik Informatika

Fakultas : Sains dan Teknologi

Jenis Karya : Skripsi

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada

Universitas Islam negeri Syarif Hidayatullah Jakarta Hak Bebas Royalti

Noneksklusif (Non-exclusive Royalty Free Right) atas karya ilmiah saya yag

berjudul:

IMPLEMENTASI ALGORITMA BACKPROPAGATION

PADA PENGENALAN EMOSI

BERDASARKAN SUARA MANUSIA

Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti

Noneksklusif ini Universitas Islam Negeri Syarif Hidayatullah Jakarta berhak

menyimpan, mengalihmedia/formatkan, mengelola dalam bentuk pangkalan data

(database), merawat, dan mempublikasikan tugas akhir saya selama tetap

mencantumkan nama saya sebagai penulis/pencipta dan pemilik Hak Cipta.

Demikian pernyataan ini saya buat dengan sebenarnya.

Jakarta, 29 Mei 2019

Lulut Dwi Putri Bagaswari

Page 7: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

vii UIN Syarif Hidayatullah Jakarta

Nama : Lulut Dwi Putri Bagaswari (11140910000041)

Program Studi : Teknik Informatika

Judul : Implementasi Algoritma Backpropagation Pada Pengenalan

Emosi Berdasarkan Suara Manusia

ABSTRAK

Speech recognition merupakan salah satu komponen penting dalam interaksi

manusia dan komputer. Speech membawa informasi penting, salah satunya adalah

kondisi emosional. Terdapat empat kondisi emosi dasar pada manusia, yakni

marah, netral, sedih, dan senang. Dalam proses pengenalan emosi berdasarkan

suara manusia terdapat empat modul utama, mulai dari input data, ekstraksi ciri,

klasifikasi, hingga output yang berupa hasil identifikasi emosinya. Telah banyak

penelitian terkait dengan berbagai macam metode pengklasifikasian, namun belum

banyak yang mendapatkan tingkat keberhasilan yang mendekati sempurna.

Sehingga penulis mencoba berkontribusi untuk melakukan implementasi

pengenalan emosi berdasarkan suara ini dengan menggunakan algoritma

backpropagation. Sebelum dilakukan pengenalan, suara yang telah direkam dalam

bentuk .wav ini harus diekstraksi cirinya terlebih dahulu untuk mendapatkan

informasi mengenai kandungan emosinya. Beberapa ekstraksi ciri yang penulis

gunakan adalah frekuensi, energi, pitch, dan formant. Hasil dari penelitian ini

menunjukkan bahwa sistem ini memiliki rata-rata tingkat keberhasilan sebesar

73,05%.

Kata Kunci : Speech recognition, Emosi, Frekuensi, Energi, Pitch,

Formant, Backpropagation

Jumlah Halaman : xvii + 83

Jumlah Pustaka : 21 sumber (15 buku + 5 jurnal + 1 website)

Page 8: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

viii UIN Syarif Hidayatullah Jakarta

Author : Lulut Dwi Putri Bagaswari (11140910000041)

Stydy Program : Informatics

Title : Implementation Backpropagation Algorithm for Human

Speech Emotion Recognition

ABSTRACT

Speech recognition is one of the important components in human and computer

interaction. Speech brings important information, one of which is emotional

conditions. There are four basic emotional conditions in humans, namely anger,

neutral, sad, and happy. In the process of speech emotion recognition there are four

main modules, starting from input data, feature extraction, classification, to output

in the form of the identification of emotions. There have been many studies related

to various types of classification methods, but not many have achieved near-perfect

success rates. With that, the author tried to contribute by implementing speech

emotion recognition using backpropagation algorithm. Before recognition was

made, the speech that has been recorded in the form of .wav format must be

extracted first to get information about the content of the emotions. Some feature

extractions that the author used are frequency, energy, pitch, and formant. The

results of this study indicate that this system has an average success rate of 73.05%.

Keywords : Speech recognition, Emotion, Frequency, Energy, Pitch,

Formant, Backpropagation

Number of Pages : xvii + 83

Number of Reference : 21 references (15 books + 5 journals + 1 website)

Page 9: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

ix UIN Syarif Hidayatullah Jakarta

KATA PENGANTAR

Alhamdulillah segala puji dan syukur penulis panjatkan kehadirat Allah

SWT yang telah memberikan Rahmat dan Hidayahnya-Nya sehingga penulis

dapat menyelesaikan skripsi ini. Tak lupa shalawat serta salam kepada Nabi

Muhammad SAW, beserta keluarga, para sahabat, dan para pengikutnya dari awal

hingga akhir zaman.

Skripsi berjudul “IMPLEMENTASI ALGORITMA

BACKPROPAGATION PADA PENGENALAN EMOSI BERDASARKAN

SUARA MANUSIA” disusun untuk memenuhi persyaratan guna mendapatkan

gelar Sarjana Komputer (S.Kom) pada Program Studi Teknik Informatika di

Universitas Islam Negeri Syarif Hidayatullah Jakarta.

Selama proses penyusunan skripsi ini, penulis mendapat banyak bimbingan,

bantuan, masukan, dukungan, serta motivasi yang sangat bermanfaat dari berbagai

pihak. Oleh karena itu melalui kata pengantar ini penulis ingin menyampaikan

terima kasih banyak kepada:

1. Prof. Dr. Lily Surayya Eka Putri M.Env.Stud selaku dekan Fakultas Sains

dan Teknologi.

2. Bapak Imam M. Shofi, MT. selaku Ketua Program Studi Teknik

Informatika.

3. Bapak Feri Fahrianto, M.Sc dan Ibu Luh Kesuma Wardhani, MT. selaku

Dosen Pembimbing I dan II yang senantiasa memberikan bimbingan,

semangat, motivasi serta arahan yang sangat membantu penulis untuk dapat

menyelesaikan skripsi ini.

4. Seluruh dosen dan staff UIN Jakarta, khususnya Fakultas Sains dan

Teknologi yang telah memberikan ilmu dan pengalaman yang berharga.

Page 10: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

x UIN Syarif Hidayatullah Jakarta

5. Kedua orang tua, ibu dan bapak yang senantiasa memberikan dukungan.

Terima kasih banyak, atas doa-doa dan jerih payah kalian lah penulis dapat

menyelesaikan studi di jenjang perguruan tinggi ini.

6. Kedua saudara penulis, mbak Febty dan dek Sukma serta kakak ipar yang

selalu memberikan semngat selama ini, membantu penulis agar dapat

menyelesaikan studi ini.

7. Siti Nurul Hidayati, sahabat penulis yang telah membantu, menyemangati

serta menghibur dalam penelitian skripsi ini juga masa perkuliahan.

8. Seluruh teman-teman Teknik Informatika angkatan 2014, khususnya kelas

TI-B tercinta. Terima kasih atas kebersamaan, kenangan, ilmu dan

pengalaman selama masa kuliah.

9. Seluruh pihak yang tidak dapat disebutkan satu persatu yang secara

langsung maupun tidak langsung telah membantu dalam menyelesaikan

skripsi ini.

Penulisan skripsi ini masih jauh dari kata sempurna. Untuk itu, sangat

diperlukan kritik dan saran yang membangun bagi penulis. Akhir kata, semoga

laporan skripsi ini dapat bermanfaat bagi penulis dan orang lain.

Jakarta, 29 Mei 2019

Penulis

Lulut Dwi Putri Bagaswari

11140910000041

Page 11: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

xi UIN Syarif Hidayatullah Jakarta

DAFTAR ISI

LEMBAR PERSETUJUAN................................................................................... iii

LEMBAR PENGESAHAN ................................................................................... iv

PERNYATAAN ORISINALITAS ......................................................................... v

PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI .................................. vi

ABSTRAK ............................................................................................................ vii

ABSTRACT ......................................................................................................... viii

KATA PENGANTAR ........................................................................................... ix

DAFTAR ISI .......................................................................................................... xi

DAFTAR GAMBAR ............................................................................................ xv

DAFTAR TABEL ............................................................................................... xvii

BAB I PENDAHULUAN ....................................................................................... 1

1.1. Latar Belakang ............................................................................................... 1

1.2. Rumusan Masalah .......................................................................................... 3

1.3. Batasan Masalah ............................................................................................ 3

1.4. Tujuan dan Manfaat Penelitian ...................................................................... 3

1.5. Metodologi Penelitian .................................................................................... 4

1.5.1. Metode Pengumpulan Data ............................................................... 4

1.5.2. Metode Pengembangan Sistem ......................................................... 5

1.6. Sistematika Penulisan .................................................................................... 5

BAB II LANDASAN TEORI ................................................................................. 7

2.1. Sinyal Suara Manusia .................................................................................... 7

2.2. Teori Emosi ................................................................................................... 8

2.3. Pengenalan Emosi Berdasarkan Suara........................................................... 9

Page 12: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

xii UIN Syarif Hidayatullah Jakarta

2.4. Preprocessing ............................................................................................... 10

2.4.1. Sampling ......................................................................................... 11

2.5. Ekstraksi Ciri ............................................................................................... 13

2.5.1. Frekuensi ......................................................................................... 13

2.5.2. Energi .............................................................................................. 14

2.5.3. Pitch ................................................................................................ 15

2.5.4. Formant ........................................................................................... 16

2.6. Jaringan Syaraf Tiruan ................................................................................. 18

2.6.1. Komponen Jaringan Syaraf Tiruan ................................................. 18

2.6.2. Fungsi Aktivasi ............................................................................... 21

2.7. Algoritma Backpropagation......................................................................... 22

2.7.1. Arsitektur Backpropagation ............................................................ 22

2.7.2. Fungsi Aktivasi ............................................................................... 23

2.7.3. Pelatihan Backpropagation.............................................................. 25

2.8. Metode Prototipe ......................................................................................... 27

2.9. Matlab .......................................................................................................... 28

2.10. Teknik Sampling .......................................................................................... 28

2.11. Studi Literatur Sejenis ................................................................................. 30

BAB III METODOLOGI PENELITIAN.............................................................. 32

3.1. Metode Pengumpulan Data.......................................................................... 32

3.1.1. Studi Pustaka ................................................................................... 32

3.1.2. Studi Literatur ................................................................................. 32

3.2. Metode Pengembangan Sistem .................................................................... 33

3.2.1. Komunikasi ..................................................................................... 33

3.2.2. Perancangan Cepat .......................................................................... 34

Page 13: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

xiii UIN Syarif Hidayatullah Jakarta

3.2.3. Pemodelan Desain Cepat................................................................. 35

3.2.4. Konstruksi Prototipe ....................................................................... 35

3.2.5. Deployment Delivery and Feedback ............................................... 35

3.3. Data yang Digunakan .................................................................................. 35

3.4. Alur Penelitian ............................................................................................. 38

BAB IV PERANCANGAN SISTEM DAN IMPLEMENTASI .......................... 39

4.1. Komunikasi .................................................................................................. 39

4.1.1. Analisa Masalah .............................................................................. 39

4.1.2. Identifikasi Masalah ........................................................................ 40

4.1.3. Usulan Penyelesaian Masalah ......................................................... 40

4.1.4. Kebutuhan Perangkat Keras dan Perangkat Lunak ......................... 40

4.2. Perancangan Cepat....................................................................................... 41

4.2.1. Sinyal Suara .................................................................................... 41

4.2.2. Preprocessing .................................................................................. 43

4.2.3. Ekstraksi Ciri ................................................................................... 45

4.2.4. Klasifikasi Backpropagation ........................................................... 51

4.3. Pemodelan Desain Cepat ............................................................................. 56

4.4. Konstruksi Prototipe .................................................................................... 57

4.3.1. Ekstraksi Ciri ................................................................................... 57

4.3.2. Pelatihan Backpropagation.............................................................. 60

4.3.3. Pengujian Backpropagation ............................................................ 60

BAB V ANALISIS DAN PENGUJIAN SISTEM .............................................. 62

5.1. Analisis Masukan dan Keluaran .................................................................. 62

5.2. Tujuan Pengujian Sistem ............................................................................. 62

5.3. Skenario Pengujian ...................................................................................... 62

Page 14: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

xiv UIN Syarif Hidayatullah Jakarta

5.3.1. Skenario Pertama ............................................................................ 63

5.3.2. Skenario Kedua ............................................................................... 65

5.3.3. Skenario Ketiga ............................................................................... 66

BAB VI PENUTUP .............................................................................................. 71

6.1. Kesimpulan .................................................................................................. 71

6.2. Saran ............................................................................................................ 71

DAFTAR PUSTAKA ........................................................................................... 72

LAMPIRAN .......................................................................................................... 74

Page 15: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

xv UIN Syarif Hidayatullah Jakarta

DAFTAR GAMBAR

Gambar 2.1. Ilustrasi plot F0 untuk emosi bahagia dan bosan ............................. 10

Gambar 2.2. Ilustrasi proses sampling pada domain waktu .................................. 11

Gambar 2.3. Ilustrasi teorema sampling Nyquist .................................................. 12

Gambar 2.4. Spektral Frekuensi kalimat “a-i-u-e-o”.............................................14

Gambar 2.5. Bentuk gelombang dan fungsi autokorelasi pada estimasi pitch...... 16

Gambar 2.6. Susunan Neuron Jaringan Syaraf Tiruan .......................................... 19

Gambar 2.7. Jaringan Syaraf dengan 3 lapisan ..................................................... 20

Gambar 2.8. Arsitektur Backpropagation dengan n buah masukan ...................... 23

Gambar 2.9. Grafik fungsi sigmoid biner ............................................................. 24

Gambar 2.10. Grafik fungsi sigmoid bipolar ........................................................ 24

Gambar 2.11. Pendekatan Prototipe ...................................................................... 27

Gambar 3.1. Alur Penelitian.................................................................................. 38

Gambar 4.1. Diagram Blok Sistem Pengenalan Emosi ......................................... 41

Gambar 4.2. Contoh Sinyal Suara Manusia dalam Emosi Marah ........................ 42

Gambar 4.3. Contoh Sinyal Suara Manusia dalam Emosi Netral ......................... 42

Gambar 4.4. Contoh Sinyal Suara Manusia dalam Emosi Sedih .......................... 43

Gambar 4.5. Contoh Sinyal Suara Manusia dalam Emosi Senang ....................... 43

Gambar 4.6. Contoh Hasil Preprocessing............................................................. 45

Gambar 4.7. Proses Ekstraksi Ciri ........................................................................ 46

Gambar 4.8. Contoh Representasi Sinyal pada Domain Frekuensi ..................... 47

Gambar 4.9. Contoh Representasi Energi Terhadap Sinyal Asli .......................... 49

Gambar 4.10. Persebaran Nilai Pitch pada Data Latih ......................................... 50

Gambar 4.11. Diagram Alir Proses Pelatihan Backpropagation .......................... 53

Page 16: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

xvi UIN Syarif Hidayatullah Jakarta

Gambar 4.12. Diagram Alir Proses Pengujian Backpropagation ......................... 55

Gambar 4.13. Desain antar muka pengguna ......................................................... 57

Gambar 4.14. Screenshot pengkodean tahap preprocessing ................................. 58

Gambar 4.15 Screenshot pengkodean tahap ekstraksi ciri .................................... 59

Gambar 4.16 Screenshot pengkodean tahap pelatihan backpropagation ............. 60

Gambar 4.17 Screenshot pengkodean tahap pengujian backpropagation ............ 61

Gambar 5.1. Akurasi Rata-Rata Hasil Pengujian .................................................. 66

Page 17: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

xvii UIN Syarif Hidayatullah Jakarta

DAFTAR TABEL

Tabel 3.1. Perhitungan Jumlah Data Latih Tiap Jenis Emosi ............................... 36

Tabel 4.1. Perangkat Lunak Yang Digunakan ...................................................... 40

Tabel 5.1. Pengaruh jumlah Hidden Layer dan Hidden Neuron terhadap parameter

lainnya ................................................................................................................... 65

Tabel 5.2. Akurasi Rata-rata Hasil Pengujian ....................................................... 65

Tabel 5.3. Rentang nilai ekstraksi ciri dari masin-masing label emosi ................. 65

Tabel 5.4. Pengenalan data uji “Marah (37).wav” ................................................ 67

Tabel 5.5. Pengenalan data uji “Netral (30).wav” ................................................ 68

Tabel 5.6. Pengenalan data uji “Sedih (24).wav” ................................................. 69

Tabel 5.7. Pengenalan data uji “Senang (27).wav” ............................................... 70

Page 18: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

1

BAB I

PENDAHULUAN

1.1. Latar Belakang

Perkembangan ilmu pengetahuan dan teknologi telah memberikan

dampak yang sangat besar dalam kehidupan manusia. Salah satunya adalah

teknologi interaksi manusia dan komputer yang sedang berkembang pesat

beberapa tahun terakhir ini. Untuk mewujudkan komunikasi antara manusia

dan komputer, komputer perlu mengenali, memahami, dan menanggapi

ucapan manusia. Pengenalan suara manusia (speech recognition) merupakan

salah satu komponen terpenting dalam komunikasi manusia dan komputer.

Dalam bahasa manusia, selain informasi linguistik, informasi paralinguistik

yang mengacu pada pesan implisit seperti keadaan emosional dari pembicara

juga disampaikan. Emosi manusia merupakan kondisi mental dan fisiologis,

yang tidak hanya mencerminkan suasana hati, tetapi juga kepribadian

manusia. Hal ini berkaitan dengan perasaan, pikiran, dan perilaku manusia.

Meskipun keadaan emosional yang disampaikan tidak mengubah konten

linguistik, emosi membawa informasi penting pada pembicara, seperti

keinginan, niat, dan tanggapannya terhadap dunia luar. Untuk mewujudkan

interaksi yang alami antara manusia dan komputer, komputer harus mampu

mengenali tidak hanya isi linguistik tetapi juga keadaan emosional yang

disampaikan dalam bahasa manusia sehingga tanggapan yang dipersonalisasi

dapat disampaikan dengan tepat dalam aplikasi interaksi manusia dan

komputer (Konar & Chakraborty, 2015: 216).

Menurut Cen et al. (dalam Konar & Chakraborty, 2015: 216),

pengenalan emosi manusia telah diimplementasikan pada banyak aplikasi di

berbagai bidang, seperti pembelajaran (e-learning), keamanan, obat-obatan,

dan hiburan. Namun, untuk memahami emosi berdasarkan suara bukanlah

tugas yang mudah karena tidak ada definisi dan model emosi yang tepat.

Menurut Krothapalli & Koolagudi (2013:2), ada lebih dari 300 emosi yang

UIN Syarif Hidayatullah Jakarta

Page 19: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

2

UIN Syarif Hidayatullah Jakarta

diidentifikasi oleh para peneliti. Tetapi, tidak semuanya dialami dalam

kehidupan sehari-hari. Menurut Mower et al. (dalam Chakraborty et al.,

2017:12), terdapat empat emosi dasar yakni marah, senang, netral, dan sedih.

Pengenalan emosi berbasis suara bertujuan untuk mengidentifikasi

keadaan emosional manusia dari suaranya secara otomatis. Hal ini didasarkan

pada analisis mendalam dari mekanisme generasi sinyal suara, penggalian

beberapa fitur atau ciri yang berisi informasi emosional dari suara pembicara,

dan mengambil metode pengenalan pola yang khas, sistem pengenalan emosi

terdiri dari empat modul utama, yaitu emosi masukan, ekstraksi ciri,

klasifikasi, dan emosi keluaran. Banyak peneliti telah mengusulkan ciri suara

penting yang mengandung informasi mengenai emosi, seperti energi,

frekuensi, frekuensi pitch, frekuensi formant, dan beberapa ciri spektrum

seperti Linear Predictive Coefficients (LPC), Linear Prediction Cepstrum

Coefficients (LPCC), Mel-Frequency Cepstrum Coefficients ( MFCC), dan

turunan pertamanya. Selain itu, banyak peneliti telah mengeksplorasi

beberapa metode klasifikasi, seperti Jaringan Syaraf, Gaussian Mixture

Model (GMM), Hidden Markov Model (HMM), Maximum Likelihood

Bayesian Classifier (MLC), K-Nearest Neighbor (KNN), dan Support Vector

Machines (SVM) (Pan et al., 2012: 101-102).

Penelitian terdahulu menghasilkan tingkat keberhasilan 74% pada

pengenalan pola suara menggunakan ekstraksi LPC dan klasifikasi

backpropagation (Faradiba, 2017), tingkat keberhasilan 86,66% pada

pengenalan suara emosi menggunakan ekstraksi pitch, energi, dan formant

dengan klasifikasi HMM (Prasetio et al., 2017), tingkat keberhasilan 89%

pada pengenalan suara emosi menggunakan ekstraksi MFCC dan klasifikasi

backpropagation (Putra et al., 2019).

Dari uraian latar belakang di atas, penulis tertarik untuk melakukan

penelitian mengenai pengenalan emosi berdasarkan suara dengan

menggabungkan beberapa ekstraksi ciri menggunakan algoritma

Backpropagation. Adapun judul yang diangkat adalah “Implementasi

Page 20: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

3

UIN Syarif Hidayatullah Jakarta

Algoritma Backpropagation Pada Pengenalan Emosi Berdasarkan Suara

Manusia”.

1.2. Rumusan Masalah

Rumusan masalah dari penelitian ini adalah bagaimana implementasi

algoritma backpropagation pada pengenalan emosi berdasarkan suara

manusia.

1.3. Batasan Masalah

Pada penelitian ini, penulis membatasi pembahasannya pada:

1. Metode pengumpulan data pada penelitian ini menggunakan studi pustaka

dan studi literatur.

2. Metode pengembangan sistem pada penelitian ini menggunakan metode

prototipe

3. Sistem dirancang menggunakan tools Matlab

4. Jenis emosi yang digunakan adalah marah, senang, netral, dan sedih.

5. Ciri yang diekstraksi adalah frekuensi, energi, pitch, dan formant

6. Metode pengenalan emosi berdasarkan suara yang digunakan adalah

Algoritma Backpropagation.

7. Data yang digunakan berasal dari rekaman suara pria yang diperoleh dari

Berlin Database of Emotional Speech.

1.4. Tujuan dan Manfaat Penelitian

1.4.1. Tujuan Penelitian

Tujuan dari penelitian ini adalah mengimplementasikan

algoritma backpropagation pada pengenalan emosi berdasarkan suara

manusia.

Page 21: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

4

UIN Syarif Hidayatullah Jakarta

1.4.2. Manfaat Penelitian

a. Bagi Penulis

1. Dapat menerapkan Algoritma Backpropagation pada

pengenalan emosi berdasarkan suara.

2. Menambah wawasan penulis tentang interaksi manusia dan

komputer, khususnya di bidang pengenalan suara (speech

recognition).

3. Untuk memenuhi salah satu syarat dalam meraih gelar sarjana

dalam Fakultas Sains dan Teknologi jurusan Teknik Informatika

Universitas Islam Negeri Syarif Hidayatullah Jakarta.

b. Bagi Universitas

1. Menambah referensi literatur kepustakaan Universitas Islam

Negeri Syarif Hidayatullah Jakarta

2. Bahan masukan bagi mahasiswa Universitas Islam Negeri

Syarif Hidayatulladfrttttth Jakarta dalam pengembangan

penulisan atau penelitian lainnya terkait penulisan ini.

3. Mengetahui kemampuan mahasiswanya dalam menguasai ilmu

yang telah didapatkan di bangku perkuliahan.

c. Bagi Pengguna

1. Dalam pengimplementasiannya dapat dijadikan salah satu alat

komunikasi antara komputer dengan manusia yang didesain

untuk melayani pemiliknya.

1.5. Metodologi Penelitian

Metode penelitian yang penulis gunakan dalam penelitian skripsi ini

adalah sebagai berikut:

1.5.1. Metode Pengumpulan Data

Metode yang digunakan dalam pengumpulan data pada

penilitian ini adalah:

Page 22: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

5

UIN Syarif Hidayatullah Jakarta

1. Studi Pustaka

Penulis melakukan studi pustaka sebagai bahan dalam

pembuatan skripsi. Pengumpulan data diambil dari sumber-

sumber media cetak maupun elektronik yang dapat dijadikan

sebagai acuan penelitian dan penulisan skripsi ini.

2. Studi Literatur

Penulis melakukan studi literatur beberapa jurnal terdahulu

yang berkaitan dengan pengenalan emosi berdasarkan suara,

ekstraksi ciri, dan juga mengenai algoritma backpropagation.

1.5.2. Metode Pengembangan Sistem

Metode pengembangan sistem yang digunakan penulis dalam

penelitian ini adalah metode Prototipe, tahapan-tahapannya adalah

sebagai berikut:

1. Komunikasi

2. Perancangan Cepat

3. Pemodelan Desain Cepat

4. Konstruksi Prototipe

5. Deployment Delivery and Feedback

1.6. Sistematika Penulisan

Sistematika penulisan pada skripsi ini disusun ke dalam lima bab,

secara singkat akan diuraikan sebagai berikut :

BAB I PENDAHULUAN

Pada bab ini menjelaskan tentang latar belakang, rumusan masalah,

batasan masalah, tujuan dan manfaat penelitian, dan sistematika

penulisan.

BAB II LANDASAN TEORI

Pada bab ini akan diuraikan teori-teori yang digunakan dalam

pengembangan aplikasi dan relevan dengan permasalah yang ada.

Page 23: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

6

UIN Syarif Hidayatullah Jakarta

BAB III METODOLOGI PENELITIAN

Bab ini akan dijabarkan metodologi yang digunakan dalam

menyusun skripsi ini, seperti metodologi pengumpulan data dan

metodologi pengembangan sistem.

BAB IV PERANCANGAN SISTEM DAN IMPLEMENTASI

Pada bab ini menjelaskan mengenai pembahasan dan pemaparan

mengenai langkah-langkah perancangan hingga implementasi

pembangunan sistem berdasarkan metode prototipe

BAB V ANALISIS DAN PENGUJIAN SISTEM

Bab ini menjabarkan pengujian dan evaluasi terhadap sistem yang

telah dibangun sehingga mendapatkan hasil pengujian yang sesuai

dengan tujuan yang telah ditentukan

BAB VI PENUTUP

Bab ini berisi tentang kesimpulan dari penelitian yang dilakukan dan

saran untuk pengembangan sistem ke depannya agar menjadi lebih

baik lagi.

Page 24: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

7

UIN Syarif Hidayatullah Jakarta

BAB II

LANDASAN TEORI

2.1. Sinyal Suara Manusia

Speech (wicara) adalah modalitas utama komunikasi dengan cara yang

alami dan paling efektif untuk bertukar informasi antar manusia (Abhang et

al., 2016:13). Cara merepresentasikan wicara sendiri dapat melalui sinyal atau

bentuk gelombang yang membawa pesan atau informasi. Sinyal wicara

ditransmisikan, disimpan, dan diproses dengan berbagai cara dalam sistem

komunikasi.

Wicara yang dihasilkan oleh manusia adalah dalam bentuk sinyal

analog yang terus berubah seiring berjalannya waktu. Untuk pemrosesan

sinyal wicara menjadi digital, kita dapat mengubah sinyal wicara analog

menjadi digital. Bentuk yang paling mudah untuk merepresentasikan sinyal

wicara adalah dengan jumlah sinusoid, karena mengarah ke solusi mudah

untuk masalah seperti estimasi formant, estimasi pitch, dan lain-lain (Anne et

al., 2015:1).

Sistem komunikasi ucapan atau wicara manusia menghasilkan gagasan

(urutan kata) yang dibuat di dalam otak pembicara. Urutan kata-kata ini

disampaikan oleh generator teksnya. Sistem vokal manusia pada umumnya

dimodelkan oleh generator wicara. Generator wicara mengubah urutan kata

menjadi sinyal wicara dan ditransfer ke pendengar melalui udara atau dengan

kata lain wicara dihasilkan oleh gelombang tekanan udara yang berasal dari

mulut dan lubang hidung pembicara. Sedangkan disisi pendengar, sistem

pengdengaran manusia menerima sinyal akustik ini dan otak pendengar

memulai pemrosesan sinyal untuk memahami isinya. Pengenal ucapan atau

wicara yang dimodelkan ole dekoder ucapan menerjemakan sinyal akustik ke

dalam urutan kata. Jadi, produksi wicara dan persepsi wicara berada dalam

proses terbalik dalam aplikasi pengenalan wicara (Anne et al., 2015:2).

7

Page 25: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

8

UIN Syarif Hidayatullah Jakarta

Ada berbagai cara untuk mengklasifikasikan bagian-bagian atau

komponen sinyal suara. Salah satu cara yang sederhana adalah dengan cara

mengklasifikasikannya menjadi tiga keadaan yang berbeda, yaitu:

1. Silence (S), keadaan pada saat tidak ada ucapan yang diucapkan.

2. Unvoiced (U), keadaan pada saat vocal cord tidak melakukan vibrasi,

sehingga suara yang dihasilkan bersifat tidak periodik atau bersifat

random.

3. Voiced (V), keadaan pada saat terjadiya vibrasi pada vocal cord,

sehingga menggerakkan udara ke kerongkongan melalui mekanisme

akustik sampai keluar dari mulut dan menghasilkan sinyal wicara

(Rabiner & Juang, 1993: 18).

Sinyal suara mentransmisikan dua pesan utama. Pertama, berisi pesan

eksplisit atau informasi mengenai sesuatu atau tidak sama sekali. Kedua,

berisi pesan implisit mengenai pembicara, seperti usia, jenis kelamin, emosi,

kondisi kesehatan, dan lain-lain.

2.2. Teori Emosi

Emosi secara instrinsik terhubung dengan cara orang berinteraksi satu

sama lain. Emosi memberikan pengaruh yang besar dalam menentukan

perilaku manusia. Manusia dapat membaca keadaan emosional manusia lain

dan berperilaku dengan cara terbaik untuk meningkatkan komunikasi mereka

pada saat itu. Hal ini dikarenakan emosi dapat dikenali melalui kata-kata,

intonasi suara, ekspresi wajah, dan bahasa tubuh.

Emosi telah dipelajari dalam beberapa disiplin ilmu, seperti fisiologi,

psikologi, ilmu bicara, ilmu saraf, psikiatri, komunikasi, dan sebagainya.

Akibatnya, perspektif yang khas pada konsep emosi telah muncul, sesuai

dengan kompleksitas dan variasi emosi. Emosi manusia dapat dilihat sebagai

pengalaman kompleks dari kesadaran (psikologi), reaksi tubuh (fisiologi),

dan perilaku (Abhang et al., 2016:1-2).

Page 26: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

9

UIN Syarif Hidayatullah Jakarta

Perubahan psikologi dan fisiologi yang disebabkan karena pengalaman

emosional menyebabkan tindakan tertentu. Wicara adalah salah satu hasil

penting dari keadaan emosi manusia. Sinyal wicara dihasilkan dari kontribusi

sistem vocal tract yang digerakkan sinyal sumber eksitasi. Oleh karena itu,

informasi spesifik suara dapat diekstraksi dari sistem vocat tract dan

karakteristik sumber eksitasi. Karakteristik emosi dari wicara dapat dikaitkan

dengan:

1. Karakteristik sumber eksitasi

2. Urutan bentuk sistem vocal tract saat mengeluarkan emosi yang

berbeda

3. Karakteristik supra-segmental (durasi, pitch, dan energi)

4. Informasi linguistik (Krothapalli & Koolagudi, 2013:3)

Pada umumnya emosi diungkapkan dengan cara positif dan negatif.

Emosi positif seperti kebahagiaan (happiness), kegembiraan (excitement),

sukacita (joy), dan lain-lain. Sedangkan emosi negatif seperti kesedihan,

kemarahan, ketakutan, dan lain-lain. Menurut Mower et al. (dalam

Chakraborty et al., 2017:12), emosi dasar manusia terdiri dari empat, yaitu

marah, senang, netral, dan sedih.

2.3. Pengenalan Emosi Berdasarkan Suara

Perubahan psikologis yang intens karena lingkungan di mana individu

bertahan dapat menimbulkan perasaan marah, bosan, jijik, takut, dan bahagia

yang disebut sebagai emosi. Konten linguistik adalah isyarat penting untuk

pengenalan emosi manusia. Ketika informasi linguistik tidak tersedia,

menjadi lebih sulit untuk menentukan emosi yang tepat. Manifestasi emosi

dalam berbicara juga tergantung pada pembicara. Pilihan kata yang

digunakan oleh pembicara merupakan isyarat penting untuk pengenalan

emosi.

Manusia mengenali emosi seorang pembicara dari ekspresi wajah dan

ciri-ciri ucapan tertentu. Saat berbicara, manusia tidak hanya menyampaikan

pesan, tetapi juga informasi mengenai pembicara, bahasa, dan emosi yang

Page 27: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

10

UIN Syarif Hidayatullah Jakarta

mendasarinya. Kualitas suara manusia ini dapat digunakan untuk mengenali

emosi bahkan tanpa pengetahuan bahasa yang digunakan untuk

menyampaikannya. Analisis suara emosional telah menunjukkan bahwa

parameter prosodik seperti pitch dan durasi memainkan peran penting dalam

manifestasi emosi. Pitch dalam suara berisi informasi mengenai emosi,

karena tergantung pada ketegangan lipatan vokal dan tekanan udara

subglottal yang bervariasi dengan emosi. Untuk mengilustrasikan efek pitch,

kontur F0 untuk dua emosi yang berbeda – kebahagiaan dan kebosanan,

adalah sebagai berikut (Mary, 2019:15-16):

Gambar 2.1. Ilustrasi plot F0 untuk emosi bahagia dan bosan

Sumber: (Mary, 2019:17)

2.4. Preprocessing

Sinyal ucapan biasanya diproses terlebih dahulu sebelum ciri

diekstraksi untuk meningkatkan akurasi dan efisiensi proses ekstraksi ciri

(Anne et al., 2015:18).

Page 28: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

11

UIN Syarif Hidayatullah Jakarta

2.4.1. Sampling

Gambar 2.2. Ilustrasi proses sampling pada domain waktu

Sumber: (Owens, 1993:18)

Proses sampling sinyal diilustrasikan pada gambar 2.2.

Pengambilan sampel dilakukan pada interval waktu T yang berbeda,

di mana ini dikenal sebagai periode sampel. Jumlah sampel per detik

atau frekuensi sampling f, pada Hz sama dengan reciprocal dari

periode sampel, yaitu fs = 1/T. Nilai frekuensi sampling digunakan

dalam situasi tertentu yang ditentukan oleh teorema sampling

Nyquist, yang menyatakan bahwa jika komponen frekuensi tertinggi

dalam sinyal yaitu fh Hz, maka nilai frekuensi sampling minimum dua

kali nilai ini ( fs ≥ 2 fh ), agar sinyal dapat dibangun kembali dengan

benar dari sampel digital. Dengan kata lain, jumlah minimum sampel

yang diperlukan untuk mewakili sinusoid adalah 2 sampel per siklus

seperti yang diilustrasikan pada gambar 2.3 (a). Jika sampel lebih

sedikit digunakan maka fenomena yang dikenal sebagai aliasing

terjadi di mana sinyal frekuensi tertentu dapat muncul sebagai

frekuensi yang lebih rendah pada saat konstruksi ulang. Ini

diilustrasikan pada gambar 2.3 (b). Garis tebal menunjukkan sinusoid

Page 29: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

12

UIN Syarif Hidayatullah Jakarta

yang diambil sampelnya kurang dari tingkat Nyquist. Jika sinyal harus

dibangun kembali dari sampel, maka sinyal frekuensi rendah yang

ditunjukkan oleh garis putus-putus dapat terjadi. Oleh karena itu,

komponen mengambil identitas yang berbeda dan merupakan alias

dari komponen yang benar. Jika aliasing terjadi dalam sinyal

kompleks seperti wicara, komponen frekuensi yang tidak diinginkan

dimasukkan yang mana mendistorsi sinyal.

Gambar 2.3. Ilustrasi teorema sampling Nyquist

Sumber: (Owens, 1993:18)

Untuk sinyal kompleks, termasuk wicara (speech), komponen

frekuensi tinggi tidak diketahui secara jelas dan oleh karena itu perlu

untuk membatasi sinyal dengan memfilternya sebelum digitasi

(Owens, 1993:18). Dalam wicara (speech), rentang frekuensi yang

relevan yaitu dari 50 Hz hingga 6 KHz (Eyben, 2016:18).

Page 30: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

13

UIN Syarif Hidayatullah Jakarta

2.5. Ekstraksi Ciri

Modul penting dalam desain sistem pengenalan suara emosi adalah

pemilihan fitur atau ciri yang paling baik untuk mengklasifikasikan emosi.

Ciri-ciri ini membedakan emosi dari berbagai kategori pada sampel suara.

2.5.1. Frekuensi

Frekuensi adalah banyaknya sesuatu yang terjadi setiap

detiknya. Dalam kajian getaran, frekuensi dapat diartikan sebagai

banyaknya getaran yang terjadi dalam satu detik. Sedangkan dalam

kajian gelombang, frekuensi dapat diartikan sebagai banyaknya

gelombang yang terjadi setiap satu sekon. Satuan yang digunakan

untuk mengukur frekuensi adalah 1/s yang disebut juga Hertz

disingkat Hz, yang diambil dari nama fisikawan Jerman Heinrich

Rudolf Hertz (1857-1894). Satuan frekuensi sering juga dituliskan

dengan cps (cycle per second) (Abhang et al., 2016: 50).

Salah satu cara untuk mentransformasi sinyal dari domain waktu

ke dalam domain frekuensi adalah dengan menggunakan Discrete

Fourier Transform (DFT).

𝑥(𝑘) = ∑ 𝑥(𝑛). 𝑒−𝑗2𝜋(𝑘

𝑁)𝑛𝑁−1

𝑛=0

Persamaan di atas menyatakan bahwa sinyal akan periodik pada

setiap nilai. Untuk mengoptimalkan proses kompurasi, DFT bias

dimodifikasi dengan satu algoritma yang sering dikenal sebagai Fast

Fourier Transform (FFT). Dengan FFT proses komputasi bias

direduksi dari N2 menjadi N log2 N. Misalnya dengan menggunakan

DFT kita akan melakukan transformasi sebanyak N=1024 titik, maka

kita memerlukan perkalian sebanyak N2 = 1.048.576. Sedangkan

dengan menggunakan FFT perkalian yang diperlukan sebanyak N log2

N = 5120 perkalian. Pada gambar 2.4 ditunjukkan sebuah hasil proses

FFT untuk kalimat “a-i-u-e-o” (Fadlisyah et al., 2013:10-11).

Page 31: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

14

UIN Syarif Hidayatullah Jakarta

Gambar 2.4. Spektral Frekuensi kalimat “a-i-u-e-o”

Sumber: (Fadlisyah et al., 2013:12)

2.5.2. Energi

Energi adalah ciri dasar dan paling penting dalam sinyal suara.

Energi memiliki peran penting dalam kinerja pengenalan emosi

berbasis model akustik. Energi pada sinyal suara berasal dari udara

yang ditimbulkan pada paru-paru diteruskan melewati kerongkongan.

Aliran udara ini akan terdorong masuk ke suatu bagian dari saluran

vokal yang disebut pita suara.

Kecepatan aliran udara dan perlakuan pita suara akan

menentukan jenis suara yang dihasilkan, bila kecepatan aliran udara

dari kerongkongan tidak terlalu besar dan tegangan pita suara diatur

sedemikian rupa sehingga bergetar bebas, maka yang tercipta adalah

suara yang voiced. Suara yang unvoiced terjadi bila kecepatan aliran

udara yang terjadi dari kerongkongan cukup besar sehingga terjadi

turbulensi aliran udara, pita suara tidak bergetar secara periodik

(Abhang et al., 2016:53–55).

Page 32: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

15

UIN Syarif Hidayatullah Jakarta

Kepadatan spektral energi menggambarkan distribusi kekuatan

sinyal bicara dengan frekuensi dan juga menunjukkan kekuatan

(energi sinyal kuat atau lemah pada frekuensi berbeda) dari sinyal

sebagai fungsi frekuensi. Energi dalam sinyal ucapan x(n) dihitung

sebagai (Konar & Chakraborty, 2015:7):

𝐸𝑥 = ∑ 𝑥(𝑛)2𝑁−1𝑛=0

di mana N merupakan jumlah sampel dalam satu frame.

2.5.3. Pitch

Pitch adalah frekuensi fundamental dari sinyal audio (Anne et

al., 2015:12). Nilai pitch berisi informasi khusus pembicaranya.

Variasi pitch membawa sinyal intonasi yang terkait dengan ritme

bicara, cara bicara, emosi, dan aksen. Gender adalah salah satu faktor

yang menyampaikan bagian dari karakterisasi saluran vokal: nada

rata-rata untuk wanita adalah sekitar 200 Hz, dan untuk pria adalah

sekitar 110 Hz. Dalam variasai pitch, sinyal emosi dalam suara adalah

salah satu indikator, misalnya, suara seperti kegembiraan, stres dapat

dengan mudah dibenarkan. Variasi pitch seringkali berkorelasi

dengan kenyaringan dalam berbicara; bahagia, ketakutan, dan banyak

emosi lainnya ditandai oleh fluktuasi nada suara (Abhang et al.,

2016:57). Menurut (Anne et al., 2015:12-13), pitch dapat

didefinisikan sebagai laju pengulangan dari sinyal yang kompleks,

yaitu laju di mana puncak dalam fungsi autokorelasi terjadi. Fungsi

autokorelasi untuk ukuran durasi tertentu pada sinyal wicara

menunjukkan bagaimana sinyal itu berkolerasi dengan dirinya sendiri

pada suatu rentang waktu delay berbeda. Fungsi autokorelasi

digunakan untuk memperkirakan pitch, langsung dari bentuk

gelombang. Fungsi xcorr digunakan untuk memperkirakan urutan

korelasi silang statistik dari proses acak dengan rumus sebagai

berikut:

Page 33: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

16

UIN Syarif Hidayatullah Jakarta

𝑅(𝑚) = 𝐸(𝑥(𝑛 + 𝑚). 𝑥(𝑛)) = 𝐸(𝑥(𝑛). 𝑥(𝑛 − 𝑚))

Gambar 2.5. Bentuk gelombang dan fungsi autokorelasi pada estimasi

pitch

Sumber: (Anne et al., 2015:14)

2.5.4. Formant

Pada saat aliran udara masuk pada saluran vokal, aliran udara

mengalami suatu penapisan. Dalam hal ini seolah-olah terjadi

resonansi seperti pada pipa organa. Frekuensi resonansi yang terjadi

ditentukan oleh bentuk dan panjang saluran vokal. Frekuensi

resonansi ini yang biasa disebut dengan frekuensi formant.

Seperti resonansi pada pipa organa, di mana frekuensi resonansi

yang terjadi merupakan kelipatan dari panjang pipa organa tersebut,

maka formant-formant yang terjadi akibat penapisan pada saluran

vokal juga mendekati kelipatan panjang saluran vokal, selain

dipengaruhi oleh bentuknya. Dengan kata lain, frekuensi-frekuensi

Page 34: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

17

UIN Syarif Hidayatullah Jakarta

formant yang timbul merupakan fungsi dari bentuk dan panjang

saluran vokal formant pertama (F1) yang merupakan frekuensi dasar.

F2 merupakan frekuensi resonansi kedua dan seterusnya.

Estimasi pada nilai frekuensi formant secara umum lebih sulit

dibanding estimasi frekuensi fundamental. Masalahnya adalah bahwa

frekuensi formant merupakan sifat dari sistem saluran vokal dan harus

diperoleh dari ekstraksi sinyal suara. bentuk spektral pada saluran

vokal secara kuat berkaitan dengan pengamatan spektral envelope

(selubung spektral), yang mana kita tidak akan mampu menjamin

bahwa semua saluran suara yang beresonansi akan ditemukan

puncakpuncak di dalam selubung spektral yang kita amati, tetapi bisa

juga terjadi sebaliknya di mana semua puncak-puncak yang muncul

pada selubung spektral disebabkan oleh resonansi saluran vokal

resonances.

Salah satu cara untuk mendapatkan frekuensi formant adalah

dengan menghitung akar polinomial urutan ke-p. Akar kompleks

polinomial dengan koefisien nyata dihitung dengan menggunakan

beberapa algoritma standar. Salah satunya adalah dengan menemukan

puncak spektrum yang dihaluskan yang diperoleh melalui analisis

LPC. Keuntungan metode ini adalah kita selalu dapat menghitung

puncak dan lebih efisien daripada mengekstraksi akar kompleks dari

polinomial. Prinsip dasar dari pemodelan sinyal dengan menggunakan

LPC adalah bahwa contoh sinyal ucapan s(n) pada waktu ke-n dapat

diperkirakan sebagai kombinasi linier dari p sampel sinyal ucapan

sebelumnya yaitu (Anne et al., 2015:24-25):

𝑠(𝑛) ≈ 𝑎1𝑠(𝑛 − 1) + 𝑎2𝑠(𝑛 − 2) + ⋯ + 𝑎𝑝𝑠(𝑛 − 𝑝)

Dengan koefisien a1, a2, ...., ap diasumsikan bernilai konstan selama

frame analisis ucapan .

Page 35: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

18

UIN Syarif Hidayatullah Jakarta

2.6. Jaringan Syaraf Tiruan

Jaringan syaraf tiruan (JST) adalah salah satu representasi buatan dari

otak manusia yang selalu mencoba untuk mensimulasikan proses

pembelajaran pada otak manusia tersebut. Istilah buatan ini digunakan karena

jaringan syaraf diimplementasikan dengan menggunakan komputer yang

mampu menyelesaikan sejumlah proses perhitungan selama proses

pembelajaran(Kusumadewi, 2003: 207). Menurut Siang (2009:2-3), JST

dibentuk sebagai generalisasi model matematika dari jaringan syaraf biologi,

dengan asumsi bahwa:

• Pemrosesan informasi terjadi pada banyak elemen sederhana (neuron).

• Sinyal dikirimkan diantara neuron-neuron melalui

penghubungpenghubung.

• Penghubung antar neuron memiliki bobot yang akan memperkuat atau

memperlemah sinyal.

• Untuk menentukan output, setiap neuron menggunakan fungsi aktivasi

(biasanya bukan fungsi linier) yang dikenakan pada jumlah input yang

diterima. Besarnya output ini selanjutnya dibandingkan dengan suatu

batas ambang.

Sedangkan JST ditentukan oleh 3 hal:

• Pola hubungan antar neuron (disebut arsitektur jaringan).

• Metode untuk menentukan bobot penghubung (disebut metode

training/learning/algoritma).

• Fungi aktivasi.

2.6.1. Komponen Jaringan Syaraf Tiruan

Ada beberapa tipe jaringan syaraf tiruan, namun demikian,

hampir semuanya memiliki komponen-komponen yang sama. Seperti

halnya otak manusia, jaringan syaraf tiruan juga terdiri dari beberapa

neuron dan terdapat hubungan antar neuron tersebut. Neuron-neuron

Page 36: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

19

UIN Syarif Hidayatullah Jakarta

tersebut akan mentransformasikan informasi yang diterima melalui

sambungan keluarnya menuju ke neuron-neuron yang lain. Pada

jaringan syaraf tiruan, hubungan ini dikenal dengan bobot. Informasi

tersebut disimpan pada suatu nilai tertentu pada bobot tersebut.

Gambar 2.5 menunjukkan struktur neuron pada jaringan syaraf.

Gambar 2.6. Susunan Neuron Jaringan Syaraf Tiruan

Sumber: (Kusumadewi, 2003:210)

Jika dilihat, neuron buatan ini sebenarnya mirip dengan sel

neuron biologis. Neuron-neuron buatan tersebut bekerja dengan cara

yang sama pula dengan neuron-neuron biologis. Informasi (disebut

dengan: input) akan dikirim ke neuron dengan bobot kedatangan

tertentu. Input ini akan diproses oleh suatu fungsi perambatan yang

akan menjumlahkan nilai-nilai semua bobot yang datang. Hasil

penjumlahan ini kemudian akan dibandingkan dengan suatu nilai

ambang (threshold) tertentu melalui fungsi aktivasi setiap neuron.

Apabila input tersebut melewati suatu nilai ambang tertentu, maka

neuron tersebut akan diaktifkan, tapi kalau tidak, maka neuron

tersebut tidak akan diaktifkan. Apabila neuron tersebut diaktifkan,

maka neuron tersebut akan mengirimkan output melalui bobot-bobot

outputnya ke semua neuron yang berhubungan. Demikian seterusnya.

Pada jaringan syaraf, neuron-neuron akan dikumpulkan dalam

lapisan-lapisan (layer) yang disebut dengan lapisan neuron (neuron

layers). Biasanya neuron-neuron pada satu lapisan akan dihubungkan

dengan lapisan-lapisan, mulai dari lapisan input sampai ke lapisan

Page 37: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

20

UIN Syarif Hidayatullah Jakarta

tersembunyi (hidden layer). Tergantung pada algoritma

pembelajarannya, bisa jadi informasi tersebut akan dirambatkan

mundur pada jaringan. Gambar 2.6 menunjukkan jaringan syaraf

dengan 3 lapisan.

Gambar 2.7. Jaringan Syaraf dengan 3 lapisan

Sumber: (Kusumadewi, 2003:211)

Gambar 2.7 bukanlah struktur umum jaringan syaraf. Beberapa

jaringan syaraf ada juga yang tidak memiliki lapisan tersembunyi, dan

ada juga jaringan dimana neuron-neuronnya disusun dalam bentuk

matriks (Kusumadewi, 2003:210-211).

Menurut Siang (2009:29-30), hingga kini terdapat lebih dari 20

model jaringan syaraf tiruan. Masing-masing model menggunakan

arsitektur, fungsi aktivasi, dan perhitungan yang berbeda-beda dalam

prosesnya. Berdasarkan strategi pelatihan, model jaringan dibagi

menjadi:

Page 38: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

21

UIN Syarif Hidayatullah Jakarta

1. Pelatihan dengan supervisi

Contoh model yang masuk kategori ini antara lain model

Hebbian, Perceptron, ADALINE, Boltzman, Hopfield,

Backpropagation, dll.

2. Pelatihan tanpa supervisi

Contoh model yang masuk dalam kategori ini antara lain model

Competitive, Hebbian, Kohonen, LVQ (Learning Vector

Quantization), Neocognitron, dll.

2.6.2. Fungsi Aktivasi

Dalam jaringan syaraf tiruan, fungsi aktivasi dipakai untuk

menentukan keluaran suatu neuron. Argumen fungsi aktivasi adalah

net masukan (kombinasi linier masukan dan bobotnya). Jika

𝑛et = ∑𝑥𝑖𝑤𝑖, maka fungsi aktivasinya 𝑓(𝑛et) = 𝑓( ∑𝑥𝑖𝑤𝑖) (Siang,

2009: 26).

Beberapa fungsi aktivasi yang sering dipakai adalah sebagai

berikut:

1. Fungsi threshold (batas ambang)

𝑓(𝑥) = {1 𝑗𝑖𝑘𝑎 𝑥 ≥ 𝑎0 𝑗𝑖𝑘𝑎 𝑥 < 𝑎

Untuk beberapa kasus, fungsi threshold yang dibawa, tidak

berharga 0 atau 1, tapi berharga -1 atau 1 (sering disebut threshold

bipolar). Jadi,

𝑓(𝑥) = {1 𝑗𝑖𝑘𝑎 𝑥 ≥ 𝑎−1 𝑗𝑖𝑘𝑎 𝑥 < 𝑎

2. Fungsi sigmoid

𝑓(𝑥) =1

1+𝑒−𝑥

Fungsi sigmoid sering dipakai karena nilai fungsinya yang

terletak antara 0 dan 1 dapat diturunkan dengan mudah.

𝑓′(𝑥) = 𝑓(𝑥)(1 − 𝑓(𝑥))

3. Fugsi identitas

𝑓(𝑥) = 𝑥

Page 39: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

22

UIN Syarif Hidayatullah Jakarta

Fungsi identitas sering dipakai apabila kita menginginkan

keluaran jaringan berupa sembarang bilangan riil (bukan hanya

pada range [0,1] atau [-1,1].

(Siang, 2009:26)

2.7. Algoritma Backpropagation

Backpropagation merupakan metode pembelajaran yang terawasi dan

biasanya digunakan oleh perceptron dengan banyak lapisan untuk mengubah

bobot-bobot yang terhubung dengan neuron-neuron yang ada pada lapisan

tersembunyinya. Metode backpropagation menggunakan error output untuk

mengubah nilai bobot-bobotnya dalam arah mundur (backward). Untuk

mendapatkan eror ini, tahap perambatan maju (forward propagation) harus

dikerjakan terlebih dahulu (Kusumadewi, 2003:236).

2.7.1. Arsitektur Backpropagation

Menurut (Siang, 2009:98), backpropagation memiliki beberapa

unit yang ada dalam satu atau lebih hidden layer. Gambar 2.8 adalah

arsitektur backpropagation dengan n buah masukan (ditambah sebuah

bias), sebuah hidden layer yang terdiri p unit (ditambah sebuah bias),

serta m buah keluaran.

vij merupakan bobot garis dari unit masukan xi ke unit hidden

layer zj (vj0 merupakan bobot garis yang menghubungkan bias di unit

masukan ke unit hidden layer zj). wk j merupakan bobot dari unit

hidden layer zj ke unit keluaran yk (wk0 merupakan bobot dari bias di

hidden layer ke unit keluaran zk).

Page 40: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

23

UIN Syarif Hidayatullah Jakarta

Gambar 2.8. Arsitektur Backpropagation dengan n buah masukan

Sumber: (Siang, 2009:98)

2.7.2. Fungsi Aktivasi

Dalam backpropagation, fungsi aktivasi yang dipakai harus

memenuhi beberapa syarat yaitu: kontinu, terdiferensial dengan

mudah dan merupakan fungsi yang tidak turun. Salah satu fungsi yang

memenuhi ketiga syarat tersebut sehingga sering dipakai adalah

fungsi sigmoid biner yang memiliki range (0,1) (Siang, 2009: 99-100).

𝑓(𝑥) =1

1+𝑒−𝑥 dengan turunan 𝑓′(𝑥) = 𝑓(𝑥)(1 − 𝑓(𝑥))

Grafik fungsinya tampak pada gambar 2.8.

Page 41: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

24

UIN Syarif Hidayatullah Jakarta

Gambar 2.9. Grafik fungsi sigmoid biner

Sumber: (Siang, 2009:99)

Fungsi lain yang sering dipakai adalah fungsi sigmoid bipolar

yang bentuk fungsinya miri dengan fungsi sigmoid biner, tapi dengan

range (-1,1).

𝑓(𝑥) =1

1+𝑒−𝑥 − 1 dengan turunan 𝑓′(𝑥) =(1+𝑓(𝑥))(1−𝑓(𝑥))

2

Grafik fungsinya tampak pada gambar 2.9.

Gambar 2.10. Grafik fungsi sigmoid bipolar

Sumber: (Siang, 2009:100)

Fungsi sigmoid memiliki nilai maksimum = 1. Maka untuk pola

yang targetnya > 1, pola masukan dan keluaran harus terlebih dahulu

ditransformasi sehingga semua polanya memiliki range yang sama

seperti fungsi sigmoid yang dipakai. Alternatif lain adalah

Page 42: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

25

UIN Syarif Hidayatullah Jakarta

menggunakan fungsi aktivasi sigmoid hanya pada layar yang bukan

layar keluaran. Pada layar keluaran, fungsi aktivasi yang dipakai

adalah fungsi identitas: f(x) = x.

2.7.3. Pelatihan Backpropagation

Pelatihan backpropagation meliputi 3 fase. Fase pertama adalah

fase maju. Pola masukan dihitung maju mulai dari layar masukan

hingga layar keluaran menggunakan fungsi aktivasi yang ditentukan.

Fase kedua adala fase mundur. Selisih antara keluaran jaringan dengan

target yang diinginkan merupakan kesalahan yang terjadi. Kesalahan

tersebut dipropagasikan mundur, dimulai dari garis yang berhubungan

langsung dengan unit-unit di layar keluaran. Fase ketiga adalah

modifikasi bobot untuk menurunkan kesalahan yang terjadi (Siang,

2009:100).

Algoritma pelatihan untuk jaringan dengan satu layar

tersembunyi (dengan fungsi aktivasi sigmoid biner) adalah sebagai

berikut:

Langkah 0: Inisialisasi semua bobot dengan bilangan acak kecil

Langkah 1: Jika kondisi penghentian belum terpenuhi, lakukan

langkah 2-9

Langkah 2: Untuk setiap pasang data pelatihan, lakukan langkah 3-8.

Fase I : Propagasi Maju

Langkah 3: Tiap unit masukan menerima sinyal dan meneruskannya

ke unit tersembunyi di atasnya.

Langkah 4: Hitung semua keluaran di unit tersembunyi zj (j = 1,

2,..,p).

𝑧_𝑛𝑒𝑡𝑗 = 𝑣𝑗0 + ∑ 𝑥𝑖𝑣𝑗𝑖𝑛𝑖=1

𝑧𝑗 = 𝑓(𝑧_𝑛𝑒𝑡𝑗) =1

1+𝑒−𝑦_𝑛𝑒𝑡𝑗

Page 43: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

26

UIN Syarif Hidayatullah Jakarta

Langkah 5: Hitung semua keluaran jaringan di unit yk (k = 1, 2,...,m).

𝑧_𝑛𝑒𝑡𝑘 = 𝑤𝑘0 + ∑ 𝑧𝑗𝑤𝑘𝑗𝑝𝑗=1

𝑧𝑗 = 𝑓(𝑧_𝑛𝑒𝑡𝑗) =1

1+𝑒−𝑦_𝑛𝑒𝑡𝑘

Fase II : Propagasi Mundur

Langkah 6: Hitung faktor δ unit keluaran berdasarkan kesalahan

setiap unit keluaran yk (k = 1,2,...,m).

𝛿𝑘 = (𝑡𝑘 − 𝑦𝑘)𝑓′(𝑦_𝑛𝑒𝑡𝑘) = (𝑡𝑘 − 𝑦𝑘)𝑦𝑘(1 − 𝑦𝑘)

δk merupakan unit kesalahan yang akan dipakai dalam perubahan

bobot layar di bawahnya (langkah 7).

Hitung suku perubahan bobot wkj (yang akan dipakai nanti untuk

merubah bobot wkj) dengan laju percepatan α.

∆𝑤𝑗𝑘 = 𝛼𝛿𝑘𝑧𝑗; 𝑘 = 1,2, … . , 𝑚; 𝑗 = 0,1, … , 𝑝

Langkah 7: Hitung faktor δ unit tersembunyi berdasarkan kesalahan

di setiap unit tersembunyi zj (j = 1, 2,...,p).

𝛿_𝑛𝑒𝑡𝑗 = ∑ 𝛿𝑘𝑤𝑘𝑗𝑚𝑘=1

Faktor δ unit tersembunyi :

𝛿𝑗 = 𝛿_𝑛𝑒𝑡𝑗𝑓′(𝑧_𝑛𝑒𝑡𝑗) = 𝛿_𝑛𝑒𝑡𝑗𝑧𝑗(1 − 𝑧𝑗)

Hitung suku perubahan bobot vji (yang akan dipakai nanti untuk

merubah bobot vji ).

∆𝑣𝑗𝑖 = 𝛼𝛿𝑗𝑥𝑖; 𝑗 = 1,2, … . , 𝑝; 𝑖 = 0,1, … , 𝑛

Fase III : Perubahan Bobot

Langkah 8: Hitung semua perubahan bobot

Perubahan bobot garis yang menuju ke unit keluaran:

𝑤𝑘𝑗 = 𝑤𝑘𝑗(𝑙𝑎𝑚𝑎) + ∆𝑤𝑘𝑗 (𝑘 = 1,2, … . , 𝑚; 𝑗 = 0,1, … , 𝑝)

Perubahan bobot garis yang menuju ke unit tersembunyi:

𝑣𝑗𝑖 = 𝑣𝑗𝑖(𝑙𝑎𝑚𝑎) + ∆𝑣𝑗𝑖 (𝑗 = 1,2, … . , 𝑝; 𝑖 = 0,1, … , 𝑛)

Setelah pelatihan selesai dilakukan, jaringan dapat dipakai

untuk pengenalan pola. Dalam hal ini, hanya propagasi maju (langkah

Page 44: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

27

UIN Syarif Hidayatullah Jakarta

4 dan 5) saja yang dipakai untuk menentukan keluaran jaringan.

Apabila fungsi aktivasi yang dipakai bukan sigmoid biner, maka

langkah 4 dan 5 harus disesuaikan. Demikian juga dengan turunannya

pada langkah 6 dan 7 (Siang, 2009:102-104).

2.8. Metode Prototipe

Prototipe adalah bagian dari produk yang mengekspresikan logika

maupun fisik antarmuka eksternal yang ditampilkan. Konsumen potensial

menggunakan prototipe dan menyediakan masukan untuk tim pengembang

sebelum pengembang skala besar dimulai. Melihat dan mempercayai menjadi

hal diharapkan untuk dicapai dalam prototipe. Dengan menggunakan

pendekatan ini, konsumen dan tim pengembang dapat mengklarifikasi

kebutuhan dan interpretasi mereka (Simarmata, 2010:62).

Gambar 2.11. Pendekatan Prototipe

Sumber: (Pressman & Maxim, 2015: 46)

Gambar di atas menunjukkan pendekatan prototipe pada umumnya

melibatkan beberapa langkah berikut:

1. Mengumpulkan dan menganalisis kebutuhan,

2. melakukan perancangan cepat,

Page 45: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

28

UIN Syarif Hidayatullah Jakarta

3. membangun sebuah prototipe,

4. evaluasi dilakukan oleh konsumen atas prototipe,

5. perubahan rancangan dan prototipe,

6. apabila pelanggan kecewa dengan prototipe yang telah dibangun, ulangi

langkah ke-5,

7. apabila pelanggan puas terhadap prototipe yang telah dibangun,

pengembangan produk berskala besar dapat dimulai (Simarmata,

2010:62).

Prototipe cocok digunakan untuk menjabarkan kebutuhan konsumen

secara lebih detail karena konsumen sering kali kesulitan menyampaikan

kebutuhannya secara detail tanpa melihat gambaran yang jelas (S. &

Shalahuddin, 2011:31)

2.9. Matlab

Matlab merupakan perangkat lunak yang cocok dipakai sebagai alat

komputasi yang melibatkan penggunaan matriks dan vektor. Fungsi-fungsi

dalam toolbox Matlab dibuat untuk memudahkan perhitungan tersebut.

Sebagai contoh, matlab dapat dengan mudah dipakai untuk menyelesaikan

permasalahan linier, program linier yang simpleks, hingga sistem yang

kompleks seperti peramalan runtun waktu (time series), pengolahan citra, dll

(Siang, 2009:151).

2.10. Teknik Sampling

Dalam penelitian, populasi digunakan untuk menyebutkan seluruh

elemen atau anggota dari suatu wilayah yang menjadi sasaran penelitian atau

merupakan keseluruhan (universum) dari objek penelitian ((Noor, 2016:147).

Menurut Noor (2016:148), pengambilan sampel (sampling) adalah

proses memilih sejumlah elemen secukupnya dari populasi, sehingga

penelitian terhadap sampel dan pemahaman tentang sifat atau

karakteristiknya merupakan ideal yang akan digeneralisasi oleh peneliti.

Page 46: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

29

UIN Syarif Hidayatullah Jakarta

Jumlah sampel data yang diambil pada penelitian ini menggunakan rumus

Slovin, yaitu sebagai berikut:

𝑛 =𝑁

1+𝑁𝑒2

Keterangan:

n = ukuran sampel

N = ukuran populasi

e = kelonggaran ketelitian karena kesalaan pengambilan yang ditolerir,

misalnya 1%, 2%, 5%, 10%, ... (catatan: batas kesalahan ditentukan

oleh peneliti)

Dalam teknik sampling untuk menentukan jumlah sampel di tiap kelas

atau strata digunakan rumus dari Proportionate Stratified Random Sampling,

yaitu sebagai berikut (Noor, 2016:152):

𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑎𝑚𝑝𝑒𝑙 𝑡𝑖𝑎𝑝 𝑘𝑒𝑙𝑎𝑠 =𝑝𝑜𝑝𝑢𝑙𝑎𝑠𝑖 𝑘𝑒𝑙𝑎𝑠

𝑝𝑜𝑝𝑢𝑙𝑎𝑠𝑖 𝑡𝑜𝑡𝑎𝑙× 𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑎𝑚𝑝𝑒𝑙

Page 47: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

30

UIN Syarif Hidayatullah Jakarta

2.11. Studi Literatur Sejenis

Tabel 2.1. Studi Literatur Sejenis

No Judul Variabel Metode Hasil

1 Pengenalan Emosi Berdasarkan

Suara Menggunakan Algoritma

HMM (Prasetio et al., 2017)

Data yang dilatih merupakan data

suara emosi marah, bahagia, dan

netral.

Ciri yang diekstraksi:

- Pitch

- Energi

- Formant

Hidden Markov Model Sistem yang dibuat memiliki

tingkat keberhasilan sebesar

86,66%

2 Pengenalan Pola Sinyal Suara

Manusia Menggunakan Metode

Back Propagation Neural Network

(Faradiba, 2017)

Data yang dilatih merupakan data

untuk mengenali ‘siapa’ yang

berbicara

Ciri yang diekstraksi: LPC

Backpropagation Sistem yang dibuat

memiliki tingkat

keberhasilan 74%.

3 Human Emotion Recognition

Based On Speech Using Back

Propagation Algorithm (Putra et al.,

2019)

Data yang dilatih merupakan data

suara emosi marah, sedih, netral,

tenang, jijik, takut, senang, dan

terkejut

Ciri yang diekstraksi: MFCC

Backpropagation Sistem yang dibuat

memiliki tingkat

keberhasilan rata-rata 89%.

30

UIN

Syarif H

ida

yatu

llah J

akarta

Page 48: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

31

UIN Syarif Hidayatullah Jakarta

No Judul Variabel Metode Hasil

4 Speech Emotion Recognition Based

On HMM and SVM (Lin

& Wei, 2005)

Data suara yang dilatih merupakan

data suara emosi marah, sedih,

senang, dan netral.

Ciri yang diekstraksi: MFCC

HMM, SVM Sistem yang dibuat

memiliki tingkat

keberhasilan rata-rata 99%

menggunakan klasifikasi

HMM, dan 90%

menggunakan klasifikasi

SVM

5 Simulasi dan Analisis Deteksi

Emosi Manusia Dari Suara

Percakapan Berbasis Discrete

Wavelet Transform dan Linear

Predictive Coding (Magdalena &

Novamizanti, 2014)

Data suara yang dilatih merupakan

data suara emosi marah, sedih,

senang, dan netral.

Ciri yang diekstraksi: LPC

KNN Sistem memiliki akurasi

tertinggi sebesar 95%.

31

UIN

Syarif H

ida

yatu

llah J

akarta

Page 49: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

32

BAB III

METODOLOGI PENELITIAN

Pada bab ini, peneliti akan menjelaskan mengenai metodologi penelitian

yang digunakan beserta tahap-tahap yang akan dilakukan dalam penelitian.

3.1. Metode Pengumpulan Data

Pengumpulan data merupakan langkah yang penting dalam sebuah

penelitian ilmiah, karena pada umumnya data yang dikumpulkan digunakan

untuk menguji hipotesis yang telah dirumuskan. Teknik pengumpulan data

yang sering digunakan antara lain:

3.1.1. Studi Pustaka

Studi pustaka yang dilakukan oleh penulis adalah dengan

mencari dan mempelajari teori-teori yang memiliki keterkaitan

dengan penelitian ini, serta dapat dijadikan sebagai landasan atau

kerangka berpikir bagi penelitian yang akan dilakukan sehingga

dalam proses penyusunannya lebih terarah.

Sumber-sumber data dan informasi yang penulis gunakan

sebagai studi pustaka dalam penelitian ini ialah sebanyak 21 sumber,

yang merupakan 15 buku dan e-book, 5 jurnal, dan 1 website. Daftar

lengkap untuk studi pustaka yang digunakan dalam penelitian ini

dapat dilihat pada daftar pustaka.

3.1.2. Studi Literatur

Selain studi pustaka, penulis juga mencari penelitian-penilitian

yang berkaitan dengan pengenalan emosi berdasarkan suara yang

sebelumnya telah dilakukan oleh peneliti lain. Studi literatur yang

penulis gunakan telah dijelaskan pada bab sebelumnya.

UIN Syarif Hidayatullah Jakarta

Page 50: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

33

UIN Syarif Hidayatullah Jakarta

3.2. Metode Pengembangan Sistem

Pada metode pengembagan sistem ini, penulis menggunakan metode

prototipe. Adapun alasan penulis menggunakan metode pengembangan

prototipe ini, yaitu sebagai berikut:

a. Sistem yang dibuat bukan berupa aplikasi, namun masih berupa prototipe

sistem untuk menganalisis penggunaan metode backpropagation dalam

pengenalan emosi berdasarkan suara manusia.

b. Adanya tekanan untuk mengimplementasikan secepatnya, karena penulis

menginginkan sistem ini dapat dijalankan secepatnya sehingga tidak

menghabiskan banyak waktu dan dana.

Adapun langkah-langkah yang digunakan dalam pengembangan prototipe,

yaitu sebagai berikut:

3.2.1. Komunikasi

Pengembangan prototipe diawali dengan tahap komunikasi.

Pada tahap ini, penulis melakukan analisis kebutuhan yang

menghasilkan tujuan perancangan dan usulan solusi yang dapat

diterima. Tahapannya adalah sebagai berikut:

3.2.1.1. Analisa Masalah

Pada tahap ini, penulis akan membahas mengenai

analisa masalah pada pengenalan emosi berdasarkan suara

manusia.

3.2.1.2. Identifikasi Masalah

Pada tahap identifikasi masalah, penulis menjelaskan

masalah yang terjadi pada sistem.

3.2.1.3. Usulan Penyelesaian Masalah

Pada tahapan ini, penulis menjelaskan mengenai

usulan penggunaan metode backpropagation untuk

mengidentifikasi atau mengenali emosi berdasarkan suara

manusia.

Page 51: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

34

UIN Syarif Hidayatullah Jakarta

3.2.1.4. Kebutuhan Perangkat Keras dan Perangkat Lunak

Pada tahap ini, penulis membuat spesifikasi

penggunaan aplikasi baik perangkat keras maupun perangkat

lunak. Pembuatan spesifikasi ini bertujuan untuk

memudahkan penulis dalam menganalisa kemampuan yang

sesuai dengan kebutuhan.

3.2.2. Perancangan Cepat

Pada tahap ini, dilakukan perancangan sementara yang berupa

format masukan dan keluaran. Penulis akan menjelaskan proses

pengenalan suara (speech recognition) yang diterapkan dalam

pengenalan emosi berdasarkan suara manusia dengan menggunakan

algoritma backpropagation. Berikut tahap yang akan penulis lakukan:

3.2.2.1. Preprocessing

Pada proses preprocessing ini, penulis akan

menjelaskan pengolahan sinyal suara sehingga memperoleh

data dalam bentuk sinyal yang dibutuhkan dalam proses

pengenalan emosi berdasarkan suara manusia.

3.2.2.2. Ekstraksi Ciri

Pada proses ekstraksi ciri, penulis akan menjelaskan

proses dalam mendapatkan ciri-ciri khusus pada sinyal suara

yang nantinya akan diolah dalam tahap identifikasi.

3.2.2.3. Identifikasi

Dalam proses identifikasi ini terbagi menjadi dua

proses, yaitu proses pelatihan dan proses pengujian. Penulis

akan menjelaskan proses-proses tersebut menggunakan

algoritma backpropagation.

Page 52: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

35

UIN Syarif Hidayatullah Jakarta

3.2.3. Pemodelan Desain Cepat

Pada tahap ini, dilakukan pemodelan desain antar muka

menggunakan tools Matlab GUI.

3.2.4. Konstruksi Prototipe

Pada tahap ini, semua rancangan yang telah penulis rancang di

atas akan dikodekan kedalam program menggunakan tools dari

Matlab 2013.

3.2.5. Deployment Delivery and Feedback

Pada tahapan ini, dilakukan tiga proses yaitu proses pengujian

sistem, dokumentasi, dan analisis hasil pengujian. Pengujian sistem

bertujuan untuk melihat hasil dari sistem yang telah dibuat apakah

berjalan dengan baik atau tidak.

3.3. Data yang Digunakan

Dalam melakukan pengujian terhadap sistem ini, dibutuhkan data yang

berupa rekaman suara yang dapat mewakilkan beberapa jenis emosi. Data

suara ini didapatkan dari Berlin Database of Emotional Speech yang

dikembangkan oleh Burkhardt et al. (2005). Menurut Anne et al. (2015: 34),

database ini telah menjadi salah satu database paling populer yang digunakan

oleh para peneliti tentang pengenalan emosi suara, sehingga memfasilitasi

perbandingan kinerja dengan penelitian lain. Database ini terdiri dari 5 aktor

pria dan 5 aktor wanita yang mengucapkan 10 kalimat yang direkam dengan

7 jenis emosi, yaitu marah, bosan, jijik, takut, senang, sedih, dan netral. Data

tersebut disimpan dalam bentuk waveform (.wav) dengan frekuensi sampling

16 KHz.

Dari database ini, penulis hanya menggunakan data dari rekaman suara

aktor pria dengan jenis emosi marah, netral, sedih, dan senang yang berjumlah

141 data rekaman suara. Data suara tersebut dibagi menjadi dua, yaitu data

latih dan data uji.

Page 53: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

36

UIN Syarif Hidayatullah Jakarta

Jumlah data latih yang akan digunakan pada penelitian ini diambil

dengan menggunakan teknik sampling, yaitu Proportionate Stratified

Random Sampling dikarenakan populasi yang ada memiliki strata (tingkatan),

juga agar penulis mendapat sampe yang proporsional tiap tingkatan.

Sedangkan perhitungan sampel data latih menggunakan rumus slovin.

Populasi dalam penelitian ini adalah jumlah seluruh data yang

digunakan yang dibagi menjadi empat jenis emosi (empat strata), yaitu marah,

netral, sedih, dan senang. Tiap jenis emosi memiliki jumlah yang berbeda-

beda.

Penulis menentukan nilai tingkat kesalahan e = 10%, jumlah populasi

N = 141 data suara, maka didapatkan jumlah sampel data latih adalah

sebanyak:

𝑛 =𝑁

1 + 𝑁𝑒2=

141

1 + 141 × 0,12=

141

2,41= 58,506 ≅ 59

Dari perhitungan di atas didapat jumlah sampel dari populasi yang

diperlukan adalah sebanyak 59 data suara. Setelah didapat jumlah sampel,

kemudian dihitung jumlah data latih tiap strata (jenis emosi) menggunakan

Proportionate Stratified Random Sampling.

Tabel 3.1. Perhitungan Jumlah Data Latih Tiap Jenis Emosi

No Jenis Emosi Perhitungan Hasil

1. Marah 50

141× 59 21

2. Netral 39

141× 59 16

3. Sedih 25

141× 59 11

4. Senang 27

141× 59 11

Total Jumlah Sampel Data Latih 59

Page 54: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

37

UIN Syarif Hidayatullah Jakarta

Sedangkan data uji yang digunakan dalam penelitian ini merupakan

data yang tidak digunakan sebagai data latih, yaitu 82 data yang masing-

masing terdiri dari 38 data emosi marah, 23 data emosi netral, 14 data emosi

sedih, dan 16 data emosi senang.

Page 55: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

38

UIN Syarif Hidayatullah Jakarta

3.4. Alur Penelitian

Gambar 3.1. Alur Penelitian

Page 56: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

39

BAB IV

PERANCANGAN SISTEM DAN IMPLEMENTASI

Pada perancangan sistem ini, penulis melakukan perancangan dengan

menggunakan metode pengembangan prototipe. Metode prototipe merupakan

metode pembuatan model sederhana dari sebuah sistem yang mengijinkan

pengembangnya memiliki gambaran dasar mengenai sistem serta melakukan

pengujian. Berikut tahap – tahap yang penulis lakukan dalam perancangan sistem

menggunakan metode prototipe:

4.1. Komunikasi

Pada tahap komunikasi ini, dilakukan pengumpulan kebutuhan-

kebutuhan sistem dan analisa permasalahan. Proses-proses yang penulis

lakukan pada tahap ini, yaitu:

4.1.1. Analisa Masalah

Pengenalan suara manusia merupakan salah satu komponen

terpenting dalam perkembangan teknologi interaksi manusia dan

komputer. Salah satu yang dapat dikenali dalam suara manusia adalah

kondisi emosionalnya. Berdasarkan studi literatur pada tabel 2.1 dapat

dilihat bahwa untuk melakukan penelitian terkait pengenalan emosi

berdasarkan suara manusia bisa dilakukan dengan beberapa metode.

Metode-metode tersebut digunakan untuk mengambil informasi atau

ciri-ciri penting yang terkandung dalam suara manusia, seperti

frekuensi, energi, pitch, dan formant. Selain itu juga ada beberapa

metode yang digunakan untuk mengidentifikasikan berbagai macam

emosi berdasarkan informasi-informasi yang diambil, salah satunya

adalah dengan menggunakan metode Jaringan Syaraf Tiruan dengan

algoritma Backpropagation.

UIN Syarif Hidayatullah Jakarta

Page 57: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

40

UIN Syarif Hidayatullah Jakarta

4.1.2. Identifikasi Masalah

Setelah melakukan analisa masalah, penulis dapat

mengidentifikasi masalah yaitu bagaimana implementasi algoritma

backpropagation pada pengenalan emosi berdasarkan suara manusia?.

4.1.3. Usulan Penyelesaian Masalah

Penyelesaian masalah yang penulis usulkan dalam penelitian ini

adalah dengan mengembangkan sebuah sistem dengan

mengimplementasikan algoritma backpropagation untuk mengenali

emosi manusia berdasarkan suara dengan cara mengekstraksi

beberapa informasi atau ciri penting yang terkandung dalam suara

tersebut. Ciri-ciri yang diekstraksi tersebut adalah frekuensi, energi,

pitch, dan formant.

4.1.4. Kebutuhan Perangkat Keras dan Perangkat Lunak

Perangkat keras yang digunakan untuk membangun prototipe

sistem ini adalah sebagai berikut:

1. Laptop Acer Aspire E5-473G

2. Intel Core i7 – 4510U 2.0 GHz

3. RAM 8 GB

4. NVIDIA GeForce 920M

5. Mouse dan Keyboard sebagai alat input

Kebutuhan untuk perangkat lunak yang penulis gunakan adalah

sebagai berikut:

Tabel 4.1. Perangkat Lunak Yang Digunakan

Perangkat Lunak Fungsi

Sistem Operasi

Windows 10 Pro 64 bit

Sebagai antar muka antara pengguna

dengan komputer

Page 58: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

41

UIN Syarif Hidayatullah Jakarta

Matlab R2013b Sebagai tools untuk membuat serta

menjalankan prototipe sistem yang

dibuat

Cool Edit Pro 2.1 Sebagai tools untuk mengubah

frekuensi sampling data suara yang

digunakan

4.2. Perancangan Cepat

Pada tahap ini, dilakukan perancangan cepat untuk proses speech

recognition yang dibutuhkan untuk mengenali emosi manusia berdasarkan

suara. Berikut ini langkah – langkah yang penulis lakukan beserta penjelasan

untuk mempermudah dalam membangun prototipe sistem yang akan dibuat:

Gambar 4.1. Blok Diagram Sistem Pengenalan Emosi

4.2.1. Sinyal Suara

Pada proses ini dilakukan pemilihan data yang akan digunakan

sebagai data masukan yang berupa file berekstensi waveform (.wav).

Data tersebut didapatkan dari Berlin Database of Emotional Speech

(Burkhardt et al., 2005). Data diambil berdasarkan teknik sampling

data, yaitu teknik slovin untuk menentukan jumlah data sampel dan

propotionate stratified random sampling untuk menentukan jumlah

data sampel tiap strata. Dari hasil perhitungan pada sub bab 3.3,

dihasilkan sampel berjumlah 141 data yang terdiri dari 59 data latih

dan 82 data uji. Dari jumlah data latih tersebut, masing-masing terdiri

dari 21 data emosi marah, 16 data emosi netral, 11 data emosi sedih,

dan 11 data emosi senang.

Berikut adalah contoh gambar sinyal dari data suara yang telah

diambil yang merepresentasikan masing-masing emosi manusia:

Page 59: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

42

UIN Syarif Hidayatullah Jakarta

Gambar 4.2. Contoh Sinyal Suara Manusia dalam Emosi Marah

Gambar 4.3. Contoh Sinyal Suara Manusia dalam Emosi Netral

Page 60: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

43

UIN Syarif Hidayatullah Jakarta

Gambar 4.4. Contoh Sinyal Suara Manusia dalam Emosi Sedih

Gambar 4.5. Contoh Sinyal Suara Manusia dalam Emosi Senang

4.2.2. Preprocessing

Preprocessing merupakan proses awal pengolahan sinyal suara.

Tahap ini bertujuan untuk memperbaiki kualitas data masukan

sebelum dilakukan proses ekstraksi ciri. Dalam preprocessing ini

terdapat 2 proses yang akan dilakukan, yaitu:

4.2.2.1. Sampling

Setelah mendapatkan data masukan, lalu dilakukan

proses sampling untuk mengubah jumlah frekuensi sampling

Page 61: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

44

UIN Syarif Hidayatullah Jakarta

dari 16 KHz menjadi 8 KHz menggunakan aplikasi Cool Edit

Pro 2.1. Proses ini bertujuan agar sinyal suara tidak terlalu

besar yang dapat memakan waktu yang lama dalam

pemrosesan selanjutnya dan juga tidak terlalu kecil yang

dapat mengakibatkan hilangnya informasi yang terkandung

dalam suara tersebut. Hal ini juga sesuai dengan teori

sampling Nyquist dimana frekuensi sampling ini paling

sedikit adalah dua kali frekuensi sinyal yang akan di

sampling. Selain itu menurut Eyben (2016:18), dalam speech

rentang frekuensi yang relevan yaitu dari 50 Hz hingga 6

KHz. Dengan demikian, frekuensi sampling 8 KHz cukup

untuk analisis sebagian besar sinyal suara.

4.2.2.2. Normalisasi

Sinyal suara manusia merupakan sinyal analog yang

tidak terbatas oleh waktu. Sinyal suara tersebut juga memiliki

amplitudo yang berbeda-beda untuk masing-masing karakter

suara manusia. Oleh karena itu, sebelum diproses lebih jauh,

sinyal tersebut dinormalisasi terlebih dahulu. Dalam

normalisasi, nilai masing-masing amplitudo dibagi dengan

nilai amplitudo maksimumnya. Hal ini dilakukan agar

rentang dari semua amplitudonya menjadi sama, yaitu antara

-1 sampai dengan 1, sehingga dalam proses selanjutnya tidak

dipengaruhi oleh nilai amplitudo yang sangat besar atau

sangat kecil.

Secara perhitungan, misalkan diambil 5 nilai pertama

dari amplitudo sinyal pada file “Sedih (1).wav” yang

digunakan:

y = [0,00055; 0,00080;0;00149;0,00209;0,00184]

Page 62: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

45

UIN Syarif Hidayatullah Jakarta

Dari 5 sampel tersebut lalu dibagi dengan nilai

amplitudo maksimumnya. Pada file “Sedih (1).wav”,

memiliki nilai maksimal amplitudo = 0,6136. Sehingga

mendapatkan nilai amplitudo baru, yaitu:

y = [0,00034; 0,00049;0;0092;0,00128;0,0031]

Berikut adalah contoh hasil dari tahap preprocessing:

Gambar 4.6. Contoh Hasil Preprocessing

4.2.3. Ekstraksi Ciri

Setelah tahap preprocessing selesai dilakukan, maka proses

selanjutnya dilakukan ekstraksi ciri. Pada proses ekstraksi ciri,

terdapat beberapa langkah yang harus dilakukan. Adapun langkah-

langkahnya dapat dilihat dari blok diagram berikut (gambar 4.7):

Page 63: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

46

UIN Syarif Hidayatullah Jakarta

Gambar 4.7. Proses Ekstraksi Ciri

Ciri yang diekstraksi pada penelitian ini ada empat, antara lain

frekuensi, energi, pitch, dan formant. Setelah diekstraksi, ciri-ciri

tersebut disatukan dalam satu matriks yang nantinya akan dijadikan

sebagai masukan pada proses klasifikasi.

4.2.3.1. Frekuensi

Frekuensi merupakan ekstraksi ciri pertama yang akan

menjadi masukan dari tahap klasifikasi. Pada sistem ini,

amplitudo dari suatu sinyal diolah menggunakan metode

Fast Fourier Transform (FFT) sehingga mendapatkan nilai-

nilai frekuensinya. Frekuensi untuk satu sample sinyal suara

menghasilkan matriks berukuran 1 x 47961. Dari data

frekuensi tersebut kemudian diambil nilai frekuensi atas (fu),

frekuensi bawah (f1), dan frekuensi tengah (f0) dan dijadikan

data masukan dari tahap klasifikasi. Berikut adalah contoh

nilai frekuensi yang akan dijadikan sebagai masukan tahap

klasifikasi berdasarkan hasil perhitungan FFT:

Page 64: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

47

UIN Syarif Hidayatullah Jakarta

Tabel 4.2. Nilai-nilai frekuensi tiap label emosi

Nilai

(dB) Marah (1).wav Netral (1).wav Sedih (1).wav Senang(1).wav

fu 42,02072 110,2093 379,7561 65,9933

f1 0,000297 0,001553 0,006018 0,001793

f0 0,174705 0,413754 1,511735 0,343974

Gambar 4.8. Contoh Representasi Sinyal pada Domain

Frekuensi

4.2.3.2. Energi

Ciri yang menjadi masukan dari tahap klasifikasi

selanjutnya adalah energi. Pada sistem ini, energi yang

dihasilkan oleh suatu sinyal suara dalam suatu frame

merupakan hasil logaritmik dari proses autokorelasi

amplitudo suatu sampel suara. Energi untuk satu sampel

sinyal suara pada sistem ini menghasilkan matriks berukuran

1x47961. Karena ukuran matriks energi yang terlalu besar,

dilakukan proses downsampling untuk mengurangi ukuran

Page 65: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

48

UIN Syarif Hidayatullah Jakarta

data. Faktor downsampling (biasanya dinotasikan dengan M)

biasanya berupa sebuah integer atau pecahan rasional lebih

besar dari satu. Faktor ini mengalikan waktu sampling atau

bersama-bersama membagi sampling rate.

Untuk menentukan besarnya nilai downsampling

diperlukan nilai perkiraan yang tepat agar proses

downsampling diperoleh data yang akurat dan tidak

mengakibatkan nilai-nilai penting dari suatu ciri hilang

akibat proses downsampling ini. Pada sistem ini, data energi

sinyal dilakukan downsampling dengan faktor M = 1000.

Dari hasil perhitungannya, dihasilkan energi dengan matriks

1 x 96.

Sebagai contoh diambil 5 nilai pertama yang telah

dilakukan proses FFT pada file “Sedih (1).wav”:

y = [0.38155; 0.37538; 0.35542; 0.38026; 2.60161]

Didapatkan hasil autokorelasi sebagai berikut:

AK = [0.99263; 1.12168; 1.20303; 1.40109; 7.32580;

1.40109; 1.20303; 1.12168; 0.99263]

Dari hasil penjumlahan matriks di atas, maka didapatkan

nilai total energi = 16,76265 dan nilai rata-rata energi =

1.86252.

Berikut adalah contoh representasi energi terhadap

sinyal asli:

Page 66: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

49

UIN Syarif Hidayatullah Jakarta

Gambar 4.9. Contoh Representasi Energi Terhadap

Sinyal Asli

4.2.3.3. Pitch

Ekstraksi ciri selanjutnya adalah frekuensi

fundamental atau lebih dikenal dengan pitch. Ciri ini

merepresentasikan frekuensi dari sinyal suara yang

digunakan. Pitch dihasilkan dari pengaruh tekanan udara

yang melewati pita suara setiap mengekspresikan atau

mengucapkan sebuah kata. Untuk mencari nilai pitch dapat

menggunakan beberapa metode, salah satunya adalah

autokorelasi. Autokorelasi merupakan proses mencari

korelasi dari sinyal kepada sinyal itu sendiri. Untuk

mendeteksi pitch pada sinyal suara, diperlukan suatu nilai

autokorelasi. Nilai autokorelasi suatu sinyal suara akan

menunjukkan bagaimana bentuk gelombang itu membentuk

korelasi dengan diri sendiri sebagai fungsi perubahan waktu.

Setelah sinyal telah terkolerasi satu sama lain, lalu dilakukan

pencarian nilai puncak menggunakan fungsi findpeaks.

Page 67: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

50

UIN Syarif Hidayatullah Jakarta

Fungsi ini dapat menampung nilai puncak dan juga

lokasinya. Nilai puncak inilah yang merupakan nilai dari

pitch. Sebagai contoh diambil 5 nilai pertama yang telah

dilakukan proses FFT pada file “Sedih (1).wav”:

y = [0.38155; 0.37538; 0.35542; 0.38026; 2.60161]

Didapatkan hasil autokorelasi sebagai berikut:

AK = [0.99263; 1.12168; 1.20303; 1.40109; 7.32580;

1.40109; 1.20303; 1.12168; 0.99263]

Dari matriks tersebut di atas dicari nilai puncaknya

yaitu dengan membandingkan nilai tersebut ke masing-

masing tetangganya, maka didapatkan nilai puncak =

7.32580. Nilai inilah yang nantinya akan dijadikan nilai dari

pitch.

Berikut adalah hasil persebaran pitch pada data yang

akan dilatih:

Gambar 4.10. Persebaran Nilai Pitch pada Data Latih

0

200

400

600

800

1000

1200

1400

1600

1800

0 20 40 60 80

Frek

uen

si

Data

Marah

Netral

Sedih

Senang

Page 68: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

51

UIN Syarif Hidayatullah Jakarta

4.2.3.4. Formant

Ekstraksi ciri terakhir yang menjadi masukan dari

proses klasifikasi adalah frekuensi formant. Frekuensi

formant merupakan frekuensi resonansi pada saluran suara

(vocal tract) yang terjadi ketika seseorang mengucapkan

suara vokal. Untuk mencari nilai frekuensi formant dari suara

vokal dilakukan dengan menggunakan metode Linear

Predictive Coding (LPC). LPC melakukan analisis dengan

cara memperkirakan formant, memisahkan formant dari

sinyal, lalu mengestimasi intensitas dan frekuensi dari sinyal

suara yang tersisa, yang disebut residu. Dari hasil

perhitungan polinomial menggunakan metode LPC,

didapatkan 5 formant. Berikut contoh nilai formant pada file

“Sedih (1).wav”:

Formant 1 = 110.338

Formant 2 = 618.710

Formant 3 = 1459.020

Formant 4 = 2595.652

Formant 5 = 3062.789

4.2.4. Klasifikasi Backpropagation

Tahap klasifikasi pada penelitian ini penulis menggunakan

algoritma Jaringan Syaraf Tiruan Backpropagation. Algoritma

backpropagation ini digunakan untuk mempelajari dan mengenali ciri

dari suatu suara masukan dan mengklasifikasikan ciri tersebut

berdasarkan target yang telah ditentukan sebelumnya. Dalam tahap ini

terjadi dua proses yang berbeda, yaitu proses pelatihan dan proses

pengujian. Pada proses pelatihan, digunakan 59 data suara pria.

Page 69: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

52

UIN Syarif Hidayatullah Jakarta

Sedangkan pada proses uji, data suara disediakan 141 data suara yang

terdiri 59 data suara yang sama dengan data dalam proses pelatihan

dan 82 data suara yang berbeda. Kedua proses ini menerapkan

supervised training, yaitu menentukan pola target setiap data

masukan.

Adapun beberapa parameter yang harus diperhatikan dalam

merancang arsitektur klasifikasi menggunakan algoritma

backpropagation, antara lain:

1. Jumlah hidden layer

Jumlah hidden layer dapat mempengaruhi nilai error pada

backpropagation. Pada umumnya, dengan menggunakan lebih

dari satu hidden layer dapat menurunkan nilai error pada

program. Tetapi dengan satu hidden layer saja sudah cukup

untuk melakukan proses klasifikasi. Pada proses ini, hidden

layer yang digunakan sebanyak satu hidden layer.

2. Mean Square Error (MSE)

Pemilihan nilai MSE dapat mempengaruhi jumlah iterasi waktu

pelatihan. Semakin kecil MSE, maka waktu pelatihan yang

dibutuhkan semakin lama. Pada proses ini, MSE yang

digunakan sebesar 10-5.

3. Learning Rate

Learning rate merupakan parameter yang dapat mempengarui

kecepatan dan efektivitas proses pembelajaranlearning sistem.

Pada proses ini, nilai learning rate adalah 0.05.

4. Epoch

Penentuan nilai epoch bertujuan untuk menentukan jumlah

iterasi maksimal untuk perubahan bobot pada jaringan. Semakin

kecil nilai MSE, maka semakin banyak pula nilai iterasi yang

Page 70: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

53

UIN Syarif Hidayatullah Jakarta

dibutuhkan untuk mencapai nilai MSE tersebut. Pada proses ini,

nilai epoch yang digunakan sebanyak 1500 iterasi.

4.2.4.1. Pelatihan Backpropagation

Proses pelatihan backpropagation digunakan untuk

mencari bobot tiap sinapsis dengan nilai error terkecil. Yang

menjadi data masukan dalam proses ini adalah ciri data yang

telah diekstraksi pada tahap sebelumnya. Dalam proses

pelatihannya dilakukan inisialisasi jumlah target, hidden

layer, fungsi aktivasi, algoritma pelatihan, dan jumlah epoch.

Untuk algoritma pelatihan backpropagation dilakukan

proses feedforward dan backward. Berikut diagram alur

proses pelatihan menggunakan backpropagation.

Gambar 4.11. Diagram Alir Proses Pelatihan Backpropagation

Page 71: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

54

UIN Syarif Hidayatullah Jakarta

Langkah-langkah yang pada proses pelatihan

backpropagation adalah sebagai berikut:

1. Inisialisasi masukan, target, dan bobot

Nilai masukan didapatkan dari matriks ekstraksi ciri

terhadap data latih. Nilai target didapatkan dari kelas-

kelas tiap jenis emosi. Sedangkan nilai bobot didapatkan

secara acak.

2. Inisialisasi jumlah hidden layer, hidden neuron, dan

fungsi aktivasi sigmoid.

3. Inisialisasi jumlah maksimal iterasi, learning rate, dan

MSE.

4. Menentukan nilai MSE atau nilai eror terkecil, learning

rate, dan epoch maksimal.

5. Lakukan pelatihan feedforward, backpropagation, dan

perubahan bobot.

Tiap unit keluaran menjumlahkan nilai keluaran dari unit

hidden layer yang dikali dengan bobot, dijumlah bias

bagian hidden layer, dan dihitung menggunakan fungsi

aktivasi. Tiap nilai keluaran yang telah dihasilkan

kemudian dibandingkan dengan target yang diinginkan

6. Tiap unit keluaran menerima pola target sesuai dengan

masukan saat pelatihan, lalu dihitung nilai erornya dan

diperbaiki bobotnya.

7. Proses pelatihan akan berhenti apabila nilai MSE telah

terpenuhi atau telah mencapai jumlah maksimum

iterasinya.

8. Hasil pelatihan disimpan untuk proses pengujian.

Page 72: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

55

UIN Syarif Hidayatullah Jakarta

4.2.4.2. Pengujian Backpropagation

Untuk proses pengujian, proses backpropagation

dilakukan dengan menggunakan bobot yang telah dilatih

sebelumnya. Proses yang dilakukan hanyalah proses

feedforward. Proses pengujian dapat dijelaskan dengan

diagram alur dibawah ini:

Gambar 4.12. Diagram Alir Proses Pengujian

Backpropagation

Langkah-langkah yang pada proses pengujian

backpropagation adalah sebagai berikut:

1. Inisialisasi masukan yang berupa matriks ekstraksi ciri

dari data uji.

2. Inisialisasi bobot hasil pelatihan.

3. Lakukan pengujian feed forward.

Page 73: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

56

UIN Syarif Hidayatullah Jakarta

Tiap unit masukan menerima sinyal masukan, lalu

sinyal tersebut dikirimkan ke seluruh unit hidden layer.

Tiap unit hidden layer ditambah dengan masukan yang

dikali dengan bobot yang diperoleh dari proses

pelatihan, lalu dijumlahkan dengan bias bagian

masukan.

Tiap unit keluaran ditambah dengan nilai keluaran

hidden layer yang dikali bobot yang diperoleh dari

proses pelatihan dan dijumlahkan dengan bias bagian

hidden layer. Hitung menggunakan fungsi aktivasi

sigmoid biner.

4. Bobot hasil pelatihan dibandingkan dengan bobot

keluaran yang diperoleh ketika pengujian.

4.3. Pemodelan Desain Cepat

Pada tahap ini, dilakukan pemodelan desain yang telah dirancang

sebelumnya menggunakan tools Matlab GUI. Berikut hasil desain antar

muka yang telah penulis buat:

Page 74: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

57

UIN Syarif Hidayatullah Jakarta

Gambar 4.13. Desain antar muka pengguna

Desain prototipe sistem ini memiliki tiga fungsi utama, yaitu fungsi

ekstraksi ciri, fungsi pelatihan, dan fungsi pengujian. Selain itu, terdapat

empat keluaran yang akan menampilkan jumlah total suara pelatihan,

direktori dari data pelatihan, direktori dari data pengujian, dan juga

keterangan dari hasil fungsi-fungsi utama prototipe ini.

4.4. Konstruksi Prototipe

Pada tahap konstruksi prototipe, penulis melakukan pengkodean

terhadap fungsi-fungsi yang telah penulis desain sebelumnya. Penulis

menggunakan tools dari Matlab dalam proses pengkodeannya. Berikut proses

pengkodean fungsi utama prototipe sistem ini:

4.3.1. Ekstraksi Ciri

Fungsi ini dilakukan tahap preprocessing dan ekstraksi ciri pada

data pelatihan. Pada tahap preprocessing dilakukan resampling, zero

padding, dan normalisasi. Berikut ini adalah kode Matlab untuk tahap

preprocessing:

Page 75: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

58

UIN Syarif Hidayatullah Jakarta

Gambar 4.14. Screenshot pengkodean tahap preprocessing

Setelah tahap preprocessing selesai, dilakukan tahap ekstraksi

ciri. Terdapat lima ciri yang akan diekstraksi pada sistem ini, yaitu

amplitudo, frekuensi, energi, pitch, dan formant. Setelah mendapatkan

nilai masing-masing ciri, lalu disimpan dalam satu file berekstensi .xls

(excel). File inilah yang nantinya menjadi masukan pada tahap

pelatihan. Berikut kode Matlab pada tahap ekstraksi ciri:

Page 76: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

59

UIN Syarif Hidayatullah Jakarta

Gambar 4.15. Screeshot pengkodean tahap ekstraksi ciri

Setelah itu, nilai-nilai ekstraksi ciri data pelatihan disimpan

dalam satu file berekstensi .xls (excel) yang nantinya akan dijadikan

masukan pada tahap pelatihan.

Page 77: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

60

UIN Syarif Hidayatullah Jakarta

4.3.2. Pelatihan Backpropagation

Fungsi ini dilakukan tahap pelatihan JST Backpropagation

terhadap data yang telah diekstraksi cirinya. Tahap ini berfungsi untuk

mengidentifikasikan masing-masing data berdasarkan jenis emosinya.

Berikut kode Matlab pada tahap pelatihan JST Backpropagation:

Gambar 4.16. Screeshot pengkodean tahap pelatihan backpropagation

4.3.3. Pengujian Backpropagation

Fungsi ini dilakukan proses preprocessing dan ekstraksi

ciri terhadap data uji. Nilai ekstraksi ciri data uji ini kemudian

akan menjadi masukan pada proses pengujian JST

Backpropagation. Dalam proses pengujian JST

Backpropagation dilakukan pengujian nilai ekstraksi cirinya

terhadap jaringan yang telah dibentuk pada proses pelatihan

JST Backpropagation. Berikut kode Matlab pada tahap

pelatihan JST Backpropagation:

Page 78: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

61

UIN Syarif Hidayatullah Jakarta

Gambar 4.17. Screeshot pengkodean tahap pengujian backpropagation

Page 79: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

62

BAB V

ANALISIS DAN PENGUJIAN SISTEM

Setelah dilakukan perancangan dan implementasi sistem pengenalan emosi

berdasarkan suara manusia, maka selanjutnya dilakukan tahap deployment delivery

and feedback. Pada tahap ini dilakukan proses pengujian terhadap fungsi-fungsi

yang ada pada sistem yang telah dibuat.

5.1. Analisis Masukan dan Keluaran

Masukan pada sistem ini berjumlah 141 data suara yang terdiri dari 59

data latih dan 82 data uji yang didapatkan dari Berlin Database of Emotional

Speech. Data tersebut dilakukan sampling dengan mereduksi jumlah

frekuensi sampling dari 16 KHz menjadi 8 KHz. Sedangkan keluaran dari

sistem ini berupa klasifikasi jenis emosi, baik dari data latih maupun data uji.

5.2. Tujuan Pengujian Sistem

Pengujian sistem ini dilakukan untuk mengetahui bagaimana kinerja

dari sistem yang dibangun. Tujuan pengujian sistem ini adalah sebagai

berikut:

1. Menganalisa akurasi dari sistem dengan menganalisa hasil keluaran dari

sinyal masukan

2. Menganalisa akurasi dari sistem dengan terhadap data suara.

3. Menganalisa kesalahan pengenalan pada sistem yang disebabkan oleh

nilai ekstraksi ciri.

5.3. Skenario Pengujian

Adapun skenario pengujian yang dilakukan untuk mengukur

performansi dari sistem berdasarkan pengaruhnya terhadap parameter-

parameter yang ada sebagai berikut:

UIN Syarif Hidayatullah Jakarta

Page 80: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

63

UIN Syarif Hidayatullah Jakarta

1. Pengujian terhadap pengaruh jumlah hidden layer dan hidden neuron

dari algoritma backpropagation.

2. Pengujian terhadap data latih dan data uji.

3. Pengujian terhadap pengaruh nilai masing-masing ciri dari sinyal

masukan.

5.3.1. Skenario Pertama

Pada skenario pertama ini, pengujian dan analisis dilakukan

dengan mengamati pengaruh jumlah hidden layer dan hidden neuron

terhadap akurasi sistem. Spesifikasi dalam pengujian ini adalah

sebagai berikut:

1. Data latih berjumlah 59 data yang terdiri dari 21 data marah, 16

data netral, 11 data sedih, dan 11 data senang.

2. Data uji berjumlah 82 data yang terdiri dari 29 data marah, 23

data netral, 14 data sedih, dan 16 data senang.

3. Parameter klasifikasi yang digunakan adalah

Learning rate = 0.05.

Hidden layer yang diuji yaitu 1, 2, 3.

Hidden neuron yang diuji yaitu 10, 15, 20, 25, 50.

Batas toleransi eror (MSE) = 10-5.

Jumlah iterasi maksimal = 1500 (Faradiba, 2017:10).

4. Total data yang uji adalah 141 data yang terdiri dari 59 data latih

dan 82 data uji.

Dari hasil pengujian skenario pertama dengan spesifikasi di atas

diperoleh hasil seperti pada tabel 5.1. di bawah ini.

Page 81: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

64

UIN Syarif Hidayatullah Jakarta

Tabel 5.1. Pengaruh jumlah Hidden Layer dan Hidden Neuron

terhadap parameter lainnya

Hidden

Layer

Hidden

Neuron

Akurasi (%)

MSE Iterasi

ke- Data

Latih Data Uji

1 10 88,83 54,90 1,00 x 10-5 7

15 88,14 48,80 1,9 x 10-6 8

20 86,44 57,31 8,82 x 10-6 6

25 88,14 59,76 1,57 x 10-6 9

50 86,44 54,89 7,09 x 10-6 8

2 10,10 76,27 63,63 1,94 x 10-6 8

10,20 86,27 43,2 8,25 x 10-6 12

10,25 64,41 46,34 0,7 x 10-6 9

10,50 68,98 17,1 9,53 x 10-6 50

15,10 88,1 35,4 0,115 1500

15,20 96,6 22 0,0295 1500

15,50 94,9 22 0,082 1500

20,10 100 36,8 7,45 x 10-6 61

20,20 94,92 58,54 8,34 x 10-6 10

3 20,10,10 100 19,5 2,7 x 10-7 79

25,10,10 57,8 10,2 1,98 1500

Jumlah hidden layer dan hidden neuron sangat berpengaruh

terhadap hasil pelatihan backpropagation. Pengujian yang telah

dilakukan mendapatkan hasil paling optimal dengan menggunakan 2

hidden layer yang masing-masing hidden neuron berjumlah 20 dan

20. Akurasi yang didapatkan dengan menggunakan parameter tersebut

yaitu 94,922% untuk data latih, 58,54% untuk data uji, dan 73,05%

untuk keseluruhan data.

Page 82: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

65

UIN Syarif Hidayatullah Jakarta

5.3.2. Skenario Kedua

Pada pengujian skenario kedua ini, akan dilakukan pengujian

terhadap data latih dan data uji. Spesifikasi dalam pengujian ini adalah

sebagai berikut::

1. Jumlah data latih sebanyak 59 data yang terdiri dari 21 data

marah, 16 data netral, 11 data sedih, dan 11 data senang.

2. Data uji berjumlah 82 data yang terdiri dari 29 data marah, 23

data netral, 14 data sedih, dan 16 data senang.

3. Parameter klasifikasi yang digunakan adalah

Learning rate = 0.05

Jumlah Hidden Layer = 2

Jumlah Hidden Neuron = 20,10

Batas toleransi eror (MSE) = 10-5

Jumlah iterasi maksimal = 1500

4. Total data yang uji adalah 141 data yang terdiri dari 59 data latih

dan 82 data uji.

Dari hasil pengujian skenario kedua dengan spesifikasi di atas

diperoleh hasil seperti pada tabel 5.2. di bawah ini:

Tabel 5.2. Akurasi Rata-rata Hasil Pengujian

Label Akurasi (%)

Data Latih Data Uji

Marah 100 86,21

Netral 93,75 43,48

Sedih 90,91 85,71

Senang 90,91 6,25

Page 83: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

66

UIN Syarif Hidayatullah Jakarta

Gambar 5.1. Akurasi Rata-Rata Hasil Pengujian

5.3.3. Skenario Ketiga

Pada skenario ketiga ini, dilakukan analisa data yang tidak dapat

dikenali dengan benar berdasarkan nilai dari ekstraksi cirinya. Berikut

adalah rentang nilai ekstraksi ciri dari data latih:

Tabel 5.3. Rentang nilai ekstraksi ciri dari masing-masing label emosi

0

20

40

60

80

100

120

Marah Netral Sedih Senang

Aku

rasi

(%

)

Akurasi Hasil Pengujian

Data Latih

Data Uji

Ciri Marah Netral Sedih Senang

Min Max Min Max Min Max Min Max

Frek. atas 42,02072 168,4643 94,28428 462,6743 278,6125 1225,745 65,9933 163,5348

Frek. bawah 0,000297 0,010459 0,00018 0,005203 0,000188 0,009545 0,000248 0,007956

Frek. tengah 0,174705 1,052486 0,195283 1,551544 0,281861 3,191642 0,173222 0,850041

Energi mean -103,406 3338,178 569,3397 6741,598 -6,33572 4021,138 -65,1856 2683,585

Pitch 500 1600 320 888,8889 105,2632 727,2727 533,3333 1333,333

Formant 1 147,3832 664,0584 0 398,8524 0 242,8658 0 548,094

Formant 2 900,8974 1253,152 352,4466 967,8303 215,448 721,6007 401,9858 1120,335

Formant 3 1298,916 1707,475 1188,851 1611,3 1174,121 1583,417 971,8684 1569,756

Formant 4 2220,807 2561,129 2346,612 2737,354 2388,866 2595,652 1620,763 2481,498

Formant 5 2816,234 3128,919 2893,395 3151,268 2897,73 3277,186 2629,011 3107,775

Page 84: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

67

UIN Syarif Hidayatullah Jakarta

Dari nilai ekstraksi ciri pada tabel 5.3 di atas, dapat dilakukan

analisa kesalahan yang terjadi pada proses pengenalan data uji.

Berikut beberapa contoh kesalahan dalam pengenalan data uji:

1. Data uji marah

Nama file: “Marah (37).wav”

Dikenali sebagai: Netral

Tabel 5.4. Pengenalan data uji “Marah (37).wav”

Ciri Nilai Terdapat pada rentang

Frek. atas 177,5267 2

Frek. bawah 0,001857 1,2,3,4

Frek. tengah 0,467149 1,2,3,4

Energi mean 1933,889 1,2,3,4

Pitch 888,8889 1,2,4

Formant 1 515,6369 1,4

Formant 2 1026,181 1,4

Formant 3 1540,937 1,2,3,4

Formant 4 2594,007 2,3

Formant 5 3135,786 2,3

Keterangan:

1 = Marah

2 = Netral

3 = Sedih

4 = Senang

Dari hasil pengenalan pada tabel 5.4, dapat dilihat bahwa ciri-ciri

paling banyak dikenali sebagai emosi Netral (rentang no. 2)

dengan jumlah 8 ciri yang berada diantara rentang data netral.

Sedangkan pada label emosi marah hanya dikenali 7 ciri saja.

Page 85: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

68

UIN Syarif Hidayatullah Jakarta

2. Data uji netral

Nama file: “Netral (30).wav”

Dikenali sebagai: Senang

Tabel 5.5. Pengenalan data uji “Netral (30).wav”

Ciri Nilai Terdapat pada rentang

Frek. atas 100,853227 1,2,4

Frek. bawah 0,001139391 1,2,3,4

Frek. tengah 0,338985626 1,2,3,4

Energi mean 2656,315185 1,2,3,4

Pitch 1333,333333 1,4

Formant 1 431,8095223 1,4

Formant 2 764,0821669 2,4

Formant 3 1371,619885 1,2,3,4

Formant 4 2517,149112 1,2,3,4

Formant 5 2906,246624 1,2,3,4

Keterangan:

1 = Marah

2 = Netral

3 = Sedih

4 = Senang

Dari hasil pengenalan pada tabel 5.4, dapat dilihat bahwa ciri-ciri

paling banyak dikenali sebagai emosi senang (rentang no. 4)

dengan jumlah 10 ciri yang berada diantara rentang data senang.

Sedangkan pada label emosi netral hanya dikenali 8 ciri saja.

Page 86: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

69

UIN Syarif Hidayatullah Jakarta

3. Data uji sedih

Nama file: “Sedih (24).wav”

Dikenali sebagai: Marah

Tabel 5.6. Pengenalan data uji “Sedih (24).wav”

Ciri Nilai Terdapat pada rentang

Frek. atas 100,853227 1,2,4

Frek. bawah 0,001139391 1,2,3,4

Frek. tengah 0,338985626 1,2,3,4

Energi mean 2656,315185 1,2,3,4

Pitch 1333,333333 1,4

Formant 1 431,8095223 1,4

Formant 2 764,0821669 1,2,4

Formant 3 1371,619885 1,2,3,4

Formant 4 2517,149112 1,2,3

Formant 5 2906,246624 1,2,3,4

Keterangan:

1 = Marah

2 = Netral

3 = Sedih

4 = Senang

Dari hasil pengenalan pada tabel 5.4, dapat dilihat bahwa ciri-ciri

paling banyak dikenali sebagai emosi marah (rentang no. 1)

dengan jumlah 10 ciri yang berada diantara rentang data senang.

Sedangkan pada label emosi sedih hanya dikenali 6 ciri saja.

Page 87: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

70

UIN Syarif Hidayatullah Jakarta

4. Data uji senang

Nama file: “Senang (27).wav”

Dikenali sebagai: Marah

Tabel 5.7. Pengenalan data uji “Senang (27).wav”

Ciri Nilai Terdapat pada rentang

Frek. atas 156,4176 1,2,4

Frek. bawah 0,001318 1,2,3,4

Frek. tengah 0,454102 1,2,3,4

Energi mean 1271,732 1,2,3,4

Pitch 363,6364 2,3

Formant 1 394,0296 1,2,4

Formant 2 863,7867 2,4

Formant 3 1434,844 1,2,3,4

Formant 4 2538,294 1,2,3

Formant 5 2931,961 1,2,3,4

Keterangan:

1 = Marah

2 = Netral

3 = Sedih

4 = Senang

Dari hasil pengenalan pada tabel 5.4, dapat dilihat bahwa ciri-ciri

paling banyak dikenali sebagai emosi netral (rentang no. 2)

dengan jumlah 10 ciri yang berada diantara rentang data senang.

Sedangkan pada label emosi senang hanya dikenali 8 ciri saja.

Page 88: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

71

BAB VI

PENUTUP

6.1. Kesimpulan

Dari penelitian yang sudah dilakukan penulis tentang implementasi

algoritma backpropagation pada pengenalan emosi berdasarkan suara

manusia, dapat ditarik beberapa kesimpulan sebagai berikut:

1. Sistem dapat mengenali emosi marah, netral, sedih, dan bahagia.

2. Ciri yang digunakan dalam sistem ini adalah frekuensi, energi, pitch,

dan formant.

3. Sistem memiliki tingkat keberhasilan rata-rata sebesar 73,05 %

6.2. Saran

Setelah melakukan penelitian, penulis memiliki saran untuk pembaca

dan pengembang berikutnya guna membantu dalam pengembangan

selanjutnya. Adapun saran penulis antara lain:

1. Mengembangkan penelitian ini dengan kasus real time, dimana data

suaranya didapatkan langsung dari proses perekaman.

2. Penggunaan ekstraksi ciri yang lebih optimal dan dapat digunakan

dalam kasus real time.

UIN Syarif Hidayatullah Jakarta

Page 89: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

72

DAFTAR PUSTAKA

Abhang, P. A., Gawali, B. W., & Mehrotra, S. C. (2016). INTRODUCTION TO

EEG- AND EMOTION RECOGNITION. Cambridge: Academic Press.

Anne, K. R., Kuchibhotla, S., & Vankayalapati, H. D. (2015). Acoustic Modeling

of Emotion Recognition. New Jersey: Springer International Publishing.

Burkhardt, F., Paeschke, A., Rolfes, M., Sendlmeier, W., & Weiss, B. (2005).

Berlin Database of Emotional Speech. Retrieved January 14, 2019, from

http://www.emodb.bilderbar.info/

Chakraborty, R., Pandharipande, M., & Kopparapu, S. K. (2017). Analyzing

Emotion in Spontaneous Speech. Singapore: Springer Nature Singapore.

Eyben, F. (2016). Real-time Speech and Music Classification by Large Audio

Feature Space Extraction. Switzerland: Springer International Publishing.

Fadlisyah, Bustami, & Ikhwanus, M. (2013). Pengolahan Suara. Yogyakarta:

Graha Ilmu.

Faradiba. (2017). Pengenalan Pola Sinyal Suara Manusia Menggunakan Metode

Back Propagation Neural Network. EduMatSains, 2.

Konar, A., & Chakraborty, A. (2015). Emotion Recognition: A Pattern Analysis

Approach. New Jersey: Wiley.

Krothapalli, S. R., & Koolagudi, S. G. (2013). Emotion Recognition using Speech

Features. New York: Springer International Publishing.

Kusumadewi, S. (2003). Artificial Intelligence (Teknik dan Aplikasinya).

Yogyakarta: Graha Ilmu.

Mary, L. (2019). Extraction of Prosody for Automatic Speaker , Language ,

Emotion and Speech Recognition. Switzerland: Springer International

Publishing.

Noor, J. (2016). Metodologi Penelitian: Skripsi, Tesis, Disertasi & Karya Ilmiah.

UIN Syarif Hidayatullah Jakarta

Page 90: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

73

UIN Syarif Hidayatullah Jakarta

Jakarta: Prenada Media.

Owens, F. J. (1993). Signal Processing of Speech. London: The Macmillan Press.

Pan, Y., Shen, P., & Shen, L. (2012). Speech Emotion Recognition Using Support

Vector Machine. International Journal of Smart Home, 6(2), 101–108.

Prasetio, B. H., Kurniawan, W., & Ichsan, M. H. H. (2017). Pengenalan Emosi

Berdasarkan Suara Menggunakan Algoritma HMM. Jurnal Teknologi

Informasi Dan Ilmu Komputer, 4(3), 168–172.

https://doi.org/10.25126/jtiik.201743339

Pressman, R. S. ., & Maxim, B. R. (2015). Software Engineering. New York:

McGraw-Hill Education.

Putra, M. I. G., Osmond, A. B., & Setianingsih, C. (2019). Human Emotion

Recognition Based On Speech Using Back Propagation Algorithm. TELKOM.

Rabiner, L., & Juang, B.-H. (1993). Fundamentals Of Speech Recognition. New

Jersey: PTR Prentice-Hall, Inc.

S., R. A., & Shalahuddin, M. (2011). Modul Pembelajaran Rekayasa Perangkat

Lunak (Terstruktur dan Berorientasi Objek). Bandung: Modula.

Siang, J. J. (2009). Jaringan Syaraf Tiruan Menggunakan MATLAB. Yogyakarta:

Penerbit ANDI.

Simarmata, J. (2010). Rekayasa Perangkat Lunak. Yogyakarta: Penerbit ANDI.

Page 91: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

74

LAMPIRAN

Lampiran 1: Hasil Ekstraksi Ciri

1. Data Latih Marah

frek atas frek

bawah

frek

tengah

energi

sum

energi

mean pitch f1 f2 f3 f4 f5

1 42,02072 0,000297 0,174705 -9926,99 582,0201 1333,333 519,6482 1081,358 1568,705 2509,206 2932,794

2 42,38629 0,000477 0,207463 -9074,08 3319,477 1600 478,1018 916,4687 1532,966 2500,617 3081,06

3 56,98783 0,000656 0,218075 -8921,66 -92,9339 1600 553,533 924,406 1511,954 2453,902 2957,17

4 58,34131 0,000738 0,224138 -4217,93 -103,406 1333,333 337,0196 1114,524 1607,56 2374,8 3128,919

5 67,38091 0,000758 0,329825 55873,93 2633,249 1142,857 372,6102 1102,142 1597,304 2418,766 3123,342

6 69,21029 0,001023 0,340137 56632,66 2652,03 1333,333 341,2594 1192,533 1596,818 2463,533 3039,738

7 72,50865 0,001891 0,404155 57322,36 2627,436 1333,333 664,0584 1081,079 1453,958 2401,5 2967,418

8 76,67519 0,00236 0,40609 59151,66 617,4106 1333,333 446,3944 1253,152 1438,519 2438,988 2980,979

9 88,7955 0,002392 0,412138 59271,42 1940,309 1333,333 147,3832 981,1058 1546,51 2220,807 2867,912

10 89,26791 0,002739 0,428252 120787,5 597,1079 1142,857 516,634 1033,495 1446,908 2467,684 3059,331

11 95,50703 0,002892 0,449892 121015,7 -43,9378 1333,333 449,5768 1157,693 1645,464 2477,805 2816,234

12 102,8672 0,003147 0,493169 185535,5 616,1631 500 469,3128 900,8974 1547,001 2561,129 3012,349

13 105,303 0,003924 0,533945 186269,7 1975,644 1333,333 466,0223 1119,252 1673,759 2482,901 2913,542

14 105,9158 0,004007 0,559472 188780,4 589,9235 1333,333 485,0926 1163,398 1298,916 2509,433 2922,317

15 106,3355 0,00438 0,625273 189661,8 3319,714 1333,333 386,0443 1081,586 1600,829 2520,495 2904,372

16 107,0087 0,005003 0,660642 252233,8 1932,662 1333,333 516,1411 1128,496 1652,323 2468,247 3106,263

17 108,2269 0,005386 0,768326 252791,9 1260,58 1333,333 514,3257 1214,856 1517,025 2478,836 2926,766

UIN

Syarif H

ida

yatu

llah J

akarta

74

Page 92: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

75

18 108,8932 0,005954 0,805175 254594,9 3338,178 888,8889 458,5734 962,8507 1601,561 2450,047 2962,606

19 138,6873 0,006181 0,835218 318669,8 1258,203 800 552,0433 1003,913 1707,475 2383,568 3005,392

20 152,6625 0,010353 0,952583 318692,6 -94,5216 888,8889 596,547 953,549 1519,735 2470,592 2921,93

21 168,4643 0,010459 1,052486 320465,1 1966,463 1142,857 577,5797 1173,408 1608,055 2257,822 2848,689

2. Data Latih Netral

frek atas frek

bawah

frek

tengah

energi

sum

energi

mean pitch f1 f2 f3 f4 f5

1 110,2093 0,001553 0,413754 54656,61 569,3397 615,3846 398,8524 620,7619 1387,606 2497,219 3016,376

2 462,6743 0,005203 1,551544 647193,4 6741,598 888,8889 0 491,9554 1499,513 2518,893 3055,166

3 212,368 0,00018 0,195283 251848,1 2623,418 444,4444 0 428,7446 1514,159 2620,406 3000,137

4 280,8298 0,003816 1,035172 319143,8 3324,415 615,3846 0 583,4001 1439,392 2737,354 2893,395

5 388,2683 0,004064 1,256142 123820,4 1289,796 444,4444 0 414,5055 1259,897 2497,484 3100,154

6 204,1701 0,001533 0,559431 383102 3990,646 444,4444 392,9569 555,6757 1601,414 2447,789 3095,878

7 100,787 0,000858 0,294123 383046,1 3990,063 666,6667 256,8377 599,3386 1530,266 2488,922 3054,512

8 110,4729 0,001205 0,364816 120416 1254,333 666,6667 197,3566 647,3347 1462,196 2520,588 3151,268

9 94,28428 0,001503 0,376481 448373,6 4670,558 571,4286 0 411,6552 1188,851 2507,532 3055,982

10 207,9965 0,001195 0,498572 252164,4 2626,713 727,2727 186,2738 696,4549 1358,826 2571,136 3133,237

11 316,1108 0,002826 0,945098 256580,2 2672,711 444,4444 201,7243 434,3436 1377,799 2470,407 3070,132

12 172,5914 0,003354 0,760788 387297,4 4034,348 320 377,9017 552,5492 1452,238 2526,838 3031,638

13 331,5392 0,002979 0,993856 516827 5383,614 400 267,5209 352,4466 1611,3 2451,77 3119,936

14 156,0037 0,000962 0,387424 320177,5 3335,182 666,6667 0 467,2135 1264,828 2413,584 3014,882

15 213,6212 0,003338 0,844462 125412,3 1306,378 533,3333 268,7963 967,8303 1221,705 2346,612 3066,227

16 271,1816 0,001213 0,57345 254335,9 2649,333 470,5882 0 376,6987 1397,541 2365,81 3040,821

UIN

Syarif H

ida

yatu

llah J

akarta

75

Page 93: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

76

3. Data Latih Sedih

frek atas frek

bawah

frek

tengah

energi

sum

energi

mean pitch f1 f2 f3 f4 f5

1 379,7561 0,006018 1,511735 253617,9 2641,853 727,2727 110,3383 618,7101 1459,02 2595,652 3062,79

2 278,6125 0,002326 0,805063 186751,9 1945,332 363,6364 242,8658 586,1227 1583,417 2533,752 3130,283

3 1067,257 0,009545 3,191642 324539,4 3380,618 105,2632 0 272,6341 1474,841 2494,778 3187,749

4 524,5336 0,00309 1,273136 122455 1275,573 106,6667 0 215,448 1174,121 2388,866 3228,537

5 301,6003 0,00372 1,059182 -608,229 -6,33572 615,3846 0 405,9053 1215,725 2450,056 3142,926

6 1225,745 0,004565 2,365371 386029,2 4021,138 105,2632 0 237,8955 1403,388 2444,618 3109,04

7 422,271 0,000188 0,281861 191652,8 1996,383 210,5263 164,4811 646,9008 1358,787 2563,787 3277,186

8 397,0322 0,007717 1,750372 240,7672 2,507992 216,2162 139,9706 278,6171 1406,826 2445,709 2897,73

9 706,7384 0,005604 1,990113 63781,43 664,3899 108,1081 0 349,4728 1507,427 2517,208 3044,434

10 544,7174 0,004109 1,496065 127326,1 1326,314 235,2941 203,2752 526,775 1408,739 2457,479 3099,566

11 666,3047 0,004178 1,668433 188948 1968,208 108,1081 172,8082 721,6007 1546,244 2493,194 3116,343

4. Data Latih Senang

frek atas frek

bawah

frek

tengah

energi

sum

energi

mean pitch f1 f2 f3 f4 f5

1 90,82149 0,007956 0,850041 54716,64 569,965 1333,333 519,1117 952,8971 1442,347 2390,311 3017,943

2 151,3123 0,000414 0,250138 252863,3 2633,992 571,4286 0 401,9858 971,8684 1620,763 2629,011

3 65,9933 0,001793 0,343974 186587,8 1943,623 727,2727 370,916 783,9582 1564,77 2447,875 2998,741

4 129,1395 0,000248 0,179093 255360,1 2660,001 666,6667 376,971 745,5615 1529,815 2356,944 2861,925

5 106,0052 0,000771 0,285963 186414,1 1941,813 666,6667 424,5933 780,4339 1512,542 2481,498 2879,138

6 0,000395 0,173222 252204,4 2627,129 1333,333 548,094 1120,335 1431,473 2466,648 2816,012

76

UIN

Syarif H

ida

yatu

llah J

akarta

Page 94: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

77

7 121,359 0,000778 0,307276 -6257,82 -65,1856 615,3846 434,096 825,7249 1421,465 2438,953 3040,109

8 137,094 0,002299 0,561362 257624,1 2683,585 666,6667 511,4306 791,4471 1481,714 2456,314 2851,501

9 107,8192 0,001812 0,442031 57024,08 594,0008 533,3333 378,9966 790,6747 1523,441 2402,553 3107,775

10 163,5348 0,002087 0,584241 58590,64 610,3192 800 380,4651 928,9974 1569,756 2414,478 2837,678

11 154,0707 0,000762 0,342701 60221,76 627,3099 800 0 790,6709 1474,022 2319,446 2843,431

UIN

Syarif H

ida

yatu

llah J

akarta

77

Page 95: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

78

UIN Syarif Hidayatullah Jakarta

LAMPIRAN 2: DAFTAR PENGUJIAN DATA LATIH

No Data Pengujian Dikenali sebagai

Marah Netral Sedih Senang

1 Marah 1 √

2 Marah 2 √

3 Marah 3 √

4 Marah 4 √

5 Marah 5 √

6 Marah 6 √

7 Marah 7 √

8 Marah 8 √

9 Marah 9 √

10 Marah 10 √

11 Marah 11 √

12 Marah 12 √

13 Marah 13 √

14 Marah 14 √

15 Marah 15 √

16 Marah 16 √

17 Marah 17 √

18 Marah 18 √

19 Marah 19 √

20 Marah 20 √

21 Marah 21 √

22 Netral 1 √

23 Netral 2 √

24 Netral 3 √

25 Netral 4 √

26 Netral 5 √

27 Netral 6 √

28 Netral 7 √

29 Netral 8 √

30 Netral 9 √

31 Netral 10 √

32 Netral 11 √

33 Netral 12 √

34 Netral 13 √

35 Netral 14 √

36 Netral 15 √

37 Netral 16 √

38 Sedih 1 √

Page 96: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

79

UIN Syarif Hidayatullah Jakarta

39 Sedih 2 √

40 Sedih 3 √

41 Sedih 4 √

42 Sedih 5 √

43 Sedih 6 √

44 Sedih 7 √

45 Sedih 8 √

46 Sedih 9 √

47 Sedih 10 √

48 Sedih 11 √

49 Senang 1 √

50 Senang 2 √

51 Senang 3 √

52 Senang 4 √

53 Senang 5 √

54 Senang 6 √

55 Senang 7 √

56 Senang 8 √

57 Senang 9 √

58 Senang 10 √

59 Senang 11 √

Page 97: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

80

UIN Syarif Hidayatullah Jakarta

LAMPIRAN 3: DAFTAR PENGUJIAN DATA UJI

No Data Pengujian Dikenali sebagai

Marah Netral Sedih Senang

1 Marah 22 √

2 Marah 23 √

3 Marah 24 √

4 Marah 25 √

5 Marah 26 √

6 Marah 27 √

7 Marah 28 √

8 Marah 29 √

9 Marah 30 √

10 Marah 31 √

11 Marah 32 √

12 Marah 33 √

13 Marah 34 √

14 Marah 35 √

15 Marah 36 √

16 Marah 37 √

17 Marah 38 √

18 Marah 39 √

19 Marah 40 √

20 Marah 41 √

21 Marah 42 √

22 Marah 43 √

23 Marah 44 √

24 Marah 45 √

25 Marah 46 √

26 Marah 47 √

27 Marah 48 √

28 Marah 49 √

29 Marah 50 √

30 Netral 17 √

31 Netral 18 √

32 Netral 19 √

33 Netral 20 √

34 Netral 21 √

35 Netral 22 √

36 Netral 23 √

Page 98: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

81

UIN Syarif Hidayatullah Jakarta

37 Netral 24 √

38 Netral 25 √

39 Netral 26 √

40 Netral 27 √

41 Netral 28 √

42 Netral 29 √

43 Netral 30 √

44 Netral 31 √

45 Netral 32 √

46 Netral 33 √

47 Netral 34 √

48 Netral 35 √

49 Netral 36 √

50 Netral 37 √

51 Netral 38 √

52 Netral 39 √

53 Sedih 12 √

54 Sedih 13 √

55 Sedih 14 √

56 Sedih 15 √

57 Sedih 16 √

58 Sedih 17 √

59 Sedih 18 √

60 Sedih 19 √

61 Sedih 20 √

62 Sedih 21 √

63 Sedih 22 √

64 Sedih 23 √

65 Sedih 24 √

66 Sedih 25 √

67 Senang 12 √

68 Senang 13 √

69 Senang 14 √

70 Senang 15 √

71 Senang 16 √

72 Senang 17 √

73 Senang 18 √

74 Senang 19 √

75 Senang 20 √

Page 99: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

82

UIN Syarif Hidayatullah Jakarta

76 Senang 21 √

77 Senang 22 √

78 Senang 23 √

79 Senang 24 √

80 Senang 25 √

81 Senang 26 √

82 Senang 27 √

Page 100: IMPLEMENTASI ALGORITMA BACKPROPAGATION PADA …

83

UIN Syarif Hidayatullah Jakarta

Lampiran 4: Surat Bimbingan Skripsi