Seminar Hasil

Embed Size (px)

Citation preview

Seminar Hasil

Perancangan Aplikasi Kamus Bahasa Indonesia-Jepang dan Bahasa Jepang-Indonesia dengan Kemampuan Textto-Speech Recognition SkripsiTRI HUTAMI 101421001

PROGRAM STUDI EKSTENSI S1 ILMU KOMPUTER FAKULTAS ILMU KOMPUTER DANTEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2012

BAB 1 LATAR BELAKANG

Manusia saling menyampaikan informasi dengan menggunakan bahasa sebagai perantaranya. Bahasa adalah simbol bunyi yang dihasilkan oleh alat ucap manusia yang mengandung arti tertentu sebagai alat komunikasi antar anggota masyarakat untuk menyampaikan ide, pikiran atau perasaan. Bahasa merupakan bunyi yang dihasilkan oleh alat ucap manusia yang merupakan simbol atau perlambangan. Di Jepang hanya ada satu bahasa yang dipergunakan sebagai bahasa pengantar di negara tersebut, yakni bahasa Jepang. Kamus sebagai salah satu media belajar bahasa asing termasuk bahasa Jepang. Penggunaan kamus digital atau aplikasi kamus dapat mempermudah orang-orang yang ingin mempelajari suatu bahasa. Sebuah kamus yang memiliki fasilitas bunyi atau suara dari bahasa yang diinginkan tentu menjadi sesuatu yang lebih untuk membantu pengguna. Sistem yang dapat diaplikasikan untuk hal tersebut yakni sistem text-to-speech. Text-to-speech merupakan suatu sistem yang mampu memproduksi sinyal ucapan secara otomatis melalui transkripsi grafem ke fonem untuk kalimat yang diucapkan.

Rumusan Masalah

Bagaimana merancang suatu aplikasi yang mengimplementasikan sistem aplikasi kamus bahasa Indonesia-Jepang dan bahasa Jepang-Indonesia yang dilengkapi dengan sistem text-to-speech.

Batasan Masalah 1. 2. 3. 4. 5. 6. Aplikasi dapat mengeluarkan suara dari kata yang diinginkan dalam bahasa Jepang. Aplikasi yang dirancang merupakan aplikasi kamus dengan menggunakan Microsoft Visual Basic 6.0. Aplikasi kamus bahasa Indonesia-Jepang dan bahasa Jepang-Indonesia ini hanya dapat mengartikan kata bukan kalimat. Perancangan sistem text-to-speech mempergunakan engine Lernout & Hauspie TTS3000 Text-to-Speech Japanese. Input sistem ini hanya meliputi kata benda, jumlah kata benda yang ada di database sebanyak 1.000 kata. Perancangan database menggunakan perangkat lunak MySQL 5.

Metode PenelitianPenelitian kepustakaan (library researh), meliputi studi literatur dan pengumpulan informasi yang dilakukan melalui wawancara kepada orang atau pakar yang dianggap memiliki pengetahuan bahasa Jepang.

Analisis masalah, meliputi analisis masalah yang dikaji, mendefinisikan batasan-batasan terhadap masalah tersebut, serta melakukan analisis terhadap kebutuhan perangkat aplikasi yang akan dibangun.

Perancangan sistem, meliputi perancangan aplikasi ini yang dilengkapi dengan sistem text-to-speech sesuai dengan analisis yang ada.

Implementasi sistem (coding), meliputi pengodean program untuk aplikasi kamus dengan menggunakan Microsoft Visual Basic 6.0.

Pengujian sistem, meliputi serangkaian uji coba terhadap hasil dari implementasi aplikasi dan memperbaikinya jika masih terdapat kesalahan dan menarik kesimpulan dari analisis yang dilakukan.

Dokumentasi sistem, meliputi pembuatan laporan tugas akhir secara lengkap.

Tujuan Penelitian

Menghasilkan sebuah aplikasi kamus bahasa Indonesia-Jepang dan bahasa JepangIndonesia yang disertai dengan kemampuan text-to-speech dari engine Lernout & Hauspie TTS3000 Text-to-Speech Japanese. Sehingga memudahkan pengguna untuk mempelajari cara pengucapan sebuah kata benda yang benar dalam bahasa Jepang.

Manfaat PenelitianManfaat bagi penulis: Sebagai media penerapan ilmu yang telah didapat selama kuliah. Manfaat bagi bidang ilmu: Memberikan kontribusi bagi pengetahuan ilmu komputer terutama dalam teknologi text-tospeech serta memberikan referensi literatur yang dapat bermanfaat bagi penelitianpenelitian di bidang tersebut ke depannya. Manfaat bagi masyarakat: Memudahkan para pengguna sistem dalam menerjemahkan bahasa Indonesia ke bahasa Jepang dan sebaliknya. Memudahkan para pengguna untuk mempelajari cara pengucapan bahasa Jepang yang benar.

BAB 2 LANDASAN TEORI Teknologi Text-to-Speech

Gambar Diagram Text-to-Speech Sistem Bagian pengolahan bahasa alami (NLP) merupakan modul konversi teks ke fonem yang menghasilkan transkripsi fonetik beserta informasi intonasi dan ritme (dikenal dengan prosodi) Pada subsistem DSP merupakan modul konversi fonem ke ucapan, yang mengubah informasi fonetis yang diterima menjadi sinyal ucapan.

Salah satu perusahaan yang telah menghasilkan text-to-speech berkualitas baik adalah perusahaan Lernout and Hauspie di Belgia. Perusahaan tersebut sudah memproduksi sistem text-to-speech berkualitas tinggi untuk bahasa Inggris, Jerman, Perancis, Belanda, Spanyol, Portugis, Jepang, dan beberapa bahasa lain untuk digunakan dengan Microsoft Agent Active-X control pada Microsoft Visual Studio. Mesin L&H TTS3000 merupakan produk text-to-speech yang diproduksi perusahaan ini.

Gambar di samping kanan merupakan gambar urutan proses konversi teks menjadi ucapan (text to speech) dalam speech engine secara umum (dimodifikasi dari Pelton, 1992) Blok normalisasi teks atau text normalization merupakan bagian yang berfungsi untuk memperluas setiap bentuk singkatan serta format non-teks menjadi bentuk rangkai huruf yang dapat dibaca.

Dalam suatu bahasa dapat terjadi kondisi dimana tidak dapat ditemukan keteraturannya. Misalnya simbol huruf e yang diucapkan pada kata empati dan telur, pada kondisi seperti ini harus dikonversi menjadi fonem yang berbeda untuk kondisi yang berbeda. Pada gambar 2.2, kondisi yang masih dapat ditangani oleh aturan diimplementasikan dalam blok Letter to Phoneme Conversion sedangkan untuk kondisi yang tidak dapat ditangani oleh aturan diimplementasikan dengan blok Exception Dictionary Lookup. Hasil dari tahapan ini merupakan rangkaian fonem yang merepresentasikan kalimat yang ingin diucapkan.

Pada bagian Prosody Generation melengkapi setiap unit fonem yang dihasilkan dengan data berupa durasi dan pitch. Tahap selanjutnya, Phonetic Analysis dapat dikatakan merupakan tahapan penyempurnaan yang melakukan perbaikan di tingkat bunyi.

Bagian konverter fonem ke ucapan (phoneme to speech conversion) pada gambar di halaman sebelumnya akan menerima masukan kode-kode fonem serta pitch dan durasi yang telah dihasilkan oleh bagian sebelumnya.

Karakteristik Bahasa JepangHuruf Jepang : 1. huruf hiragana, digunakan untuk menulis kosakata bahasa Jepang asli, apakah secara utuh atau digabungkan dengan huruf kanji. 2. huruf katakana, digunakan untuk menulis kata serapan dari bahasa asing (selain bahasa Cina), dalam telegram, atau ketika ingin menegaskan suatu kata dalam kalimat. 3. huruf kanji, Huruf kanji yaitu huruf yang merupakan lambang, ada yang berdiri sendiri, ada juga yang harus digabungkan dengan huruf kanji yang lainnya atau diikuti dengan huruf hiragana ketika digunakan untuk menunjukkan suatu kata, dan 4. huruf roomaji, memang huruf yang utama untuk penulisan bahasa Jepang adalah kanji, hiragana, dan katakana, tetapi ada saja saatnya diperlukan pemakaian roomaji. Sebagai bukti dalam tulisan yang berbahasa Jepang baik dalam surat-surat kabar, majalah-majalah, buku-buku pelajaran, dan sebagainya yang ditulis dengan huruf Jepang, di sana-sini selalu tampak penggunaan roomaji.

BAB 3 ANALISIS DAN PERANCANGAN SISTEM Kebutuhan Fungsional Sistem 1. Mampu menerjemahkan sesuai dengan kata yang telah di-input-kan oleh user serta yang terdapat dalam database. 2. Dapat menampilkan pesan apabila kata yang di-input-kan user tidak ditemukan dalam database. 3. Dapat menampilkan menu bantuan tentang cara penggunaan aplikasi, hal ini dapat membantu para user yang tidak mengetahui cara kerja aplikasi. Perancangan Sistem Gambar di samping kanan merupakan global Use Case aplikasi kamus bahasa Indonesia-Jepang dan bahasa JepangIndonesia.

Gambar di atas merupakan detail diagram Use Case aplikasi kamus bahasa Indonesia-Jepang dan bahasa Jepang-Indonesia

Aliran Normal (Primer) 1. User mengetikkan kata yang ingin dicari artinya pada label Kata. 2. Setelah memasukkan kata, user menekan tombol Terjemahkan untuk memulai proses pencarian kata. 3. Aplikasi kamus ini akan mencari kata di database. 4. Hasil pencarian aplikasi akan menampilkan huruf roomaji, katakana, hiragana, kanji pada kamus bahasa Indonesia-Jepang dari database. 5. Hasil pencarian aplikasi akan menampilkan arti kata, huruf katakana, hiragana, kanji pada kamus bahasa Jepang-Indonesia dari database. 6. Mesin text to speech pada aplikasi akan mengkonversi huruf kanji, hiragana, atau katakana dari kata hasil pencarian ke suara. 7. Aplikasi akan mengucapkan kata hasil pencarian dari database. 8. Aplikasi akan menampilkan keterangan tentang aplikasi kamus bahasa IndonesiaJepang dan bahasa Jepang-Indonesia. 9. Aplikasi akan menampilkan bantuan tentang penggunaan aplikasi kamus bahasa Indonesia-Jepang dan bahasa Jepang-Indonesia.

Aliran Alternatif Berikut ini merupakan aliran alternatif dari aplikasi kamus bahasa IndonesiaJepang dan bahasa Jepang-Indonesia ini: K1: Kata yang dicari tidak ditemukan dalam database. Aplikasi akan menampilkan pesan bahwa kata tidak ada dalam database.Mesin Text-to-Speech Gambar di samping kanan ini adalah contoh urutan proses konversi teks dalam bahasa Jepang menjadi ucapan (text-tospeech) dalam speech engine. Pada gambar, pengkonversian dari kata tersebut yakni: Penulisan kalimat dalam huruf Jepang. arufabetto Penulisan dalam huruf roomaji. a-r-u-f-a-b-e-t-t-o Kata tersebut diuraikan menjadi fonemfonem Arti kalimat tersebut dalam bahasa Indonesia

BAB 4 IMPLEMENTASI DAN PENGUJIAN Persiapan Teknis Adapun beberapa komponen untuk pengujian sistem adalah sebagai berikut. - Sebuah PC dengan sistem operasi Windows - Kartu suara - Pengeras suara - Microsoft SAPI 4.0 - Microsoft Agent 2.0 - L&H TTS3000 Textto-Speech Japanese Hasil Pengujian Penerjemah Kata Bahasa Indonesia ke Bahasa Jepang. Tampilan hasil pencarian kata 'minyak' Tampilan awal form penerjemah bahasa Indonesia ke bahasa Jepang

Hasil Pengujian Penerjemah Kata Bahasa Jepang ke Bahasa Indonesia Tampilan awal form penerjemah kata dari bahasa Jepang ke bahasa Indonesia Tampilan hasil pencarian kata 'ago'

Tampilan Halaman Jika Kata yang Dicari Tidak Ditemukan

Hasil Pengujian Sistem Text-to-Speech Pengujian suara yang keluar dari sistem text-to-speech dilakukan untuk mengetahui apakah kata-kata yang diucapkan oleh sistem sudah sesuai dengan pengucapan aslinya atau belum. Pada tahap ini sistem L&H TTS3000 Text-to-Speech Japanese juga dibandingkan dengan sistem serupa yakni Google Translate (translate.google.com). Pengujian Kualitatif 1. Bentuk gelombang suara kata abura () yang berarti minyak dalam bahasa Indonesia dari Google Translate

Bentuk gelombang ucapan kata abura dari L&H TTS3000 Text-to-Speech Japanese

2. Bentuk gelombang suara kata ago () yang berarti dagu dalam bahasa Indonesia dari Google Translate

Bentuk gelombang ucapan kata ago () dari L&H TTS3000 Text-to-Speech Japanese

3. Bentuk gelombang suara kata bara () yang berarti bunga mawar dalam bahasa Indonesia dari Google Translate

Bentuk gelombang ucapan kata bara () dari L&H TTS3000 Text-to-Speech Japanese

4. Bentuk gelombang suara kata fooku (), berasal dari kata fork yang memiliki arti garpu dalam bahasa Indonesia dari Google Translate

Bentuk gelombang ucapan kata fooku () dari L&H TTS3000 Text-to-Speech Japanese

Dari data-data yang ditampilkan pada gambar gambar gelombang tersebut, bentuk gelombang pada pada kata abura, bara dan fooku terlihat memiliki bentuk yang sedikit mirip. Sedangkan pada ago memiliki perbedaan bentuk yang lebih kentara dari kata-kata yang lain. Berdasarkan bentuk gelombang suara pada kata ago pada gambar, penekanan pengucapan kata tersebut terlihat seperti . Pengujian Subjektif

Tabel letak penekanan kata

Pengujian yang terakhir dari sinyal ucapan hasil sintesis sistem text-to-speech adalah pengujian MOS (Mean Opinion Score), dimana sejumlah pendengar langsung diperdengarkan sinyal ucapan dari Google Translate dan sistem L&H TTS3000 Text-toSpeech Japanese kemudian memberikan penilaian dengan bobot/kriteria yang dijelaskan pada tabel. Pengujian dilakukan kepada 10 orang pendengar, masing-masing pendengar menilai 4 ucapan kata yang sama dari dua sumber, yakni Google Translate dan sistem L&H TTS3000 Text-to-Speech Japanese.

Kriteria penilaian Intelligibility (tingkat pemahaman pendengar terhadap kejelasan pengucapan/kejelasan pengucapan kata)

Kriteria penilaian Fluidity (kesesuaian kata dengan pengucapan)

Kriteria penilaian Naturalness (kesesuaian dengan dialek bahasa Jepang)

Dari data quisioner dengan sumber suara Google Translate diperoleh hasil sebagai berikut: MOS intelligibility = 2,6 MOS fluidity = 2,575 MOS naturalness = 2,575 Dari data quisioner dengan sumber suara sistem L&H TTS3000 Text-to-Speech Japanese diperoleh hasil sebagai berikut: MOS intelligibility = 3,05 MOS fluidity = 3.025 MOS naturalness = 2,95 Berdasarkan hasil realisasi dan pengamatan dalam penelitian ini, sistem L&H TTS3000 Text-to-Speech Japanese dapat menghasilkan suara pengucapan yang cenderung lebih jelas di dengar oleh responden dan sesuai dari pada sistem eSpeak pada Google Translate. Hasil ini kemungkinan berdasarkan metode yang berbeda dari kedua mesin text-to-speech ini.

Hal ini membuktikan bahwa metode concatenation yang dipergunakan pada sistem L&H TTS3000 Text-to-Speech Japanese menghasilkan pengucapan yang lebih baik dari pada sistem formant synthesizer yang digunakan sistem text-to-speech eSpeak pada Google Translate.

Bab 5 Kesimpulan dan Saran Kesimpulan 1. Metode concatenation terbukti menghasilkan suara yang lebih baik dari pada metode formant synthesizer. 2. Sistem text to speech L&H TTS3000 Japanese yang dipergunakan pada aplikasi inilah yang berperan untuk mengkonversi text menjadi suara dalam ucapan bahasa Jepang. 3. Aplikasi sistem ini dibuat sebagai alat bantu untuk menerjemahkan bahasa Jepang. 4. Output dari sistem ini bukan hanya berupa arti dari kata yang diinginkan tetapi juga pengucapannya dalam bahasa Jepang. 5. Aplikasi ini dibuat untuk orang Indonesia yang masih tahap awal pembelajaran bahasa Jepang 6. Sistem dapat mengeluarkan suara dalam bahasa Jepang sesuai dengan kata yang diinput oleh user.

Saran1. Database sistem dapat ditambah lagi sehingga kosa kata yang tersimpan menjadi lebih lengkap. 2. Jenis kata yang ada pada database menjadi lebih beragam lagi. 3. Sistem ini dapat dikembangkan menjadi sebuah aplikasi yang multiplatform sehingga dapat digunakan secara meluas. 4. Menu-menu yang ada dilengkapi sehingga sistem menjadi lebih kompleks. 5. Nantinya sistem dapat dikembangkan lagi sehingga sistem dapat dipergunakan bukan hanya untuk orang Indonesia saja tetapi juga untuk orang Jepang yang mempelajari bahasa Indonesia. 6. Tampilan aplikasi yang dibuat lebih userfriendly.

TERIMA KASIH