Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
Jumal Teknik Energi, Vol 3 No. 2 Okrober 2013 ISSN:2089 2527
DEPENDENT DAN INDEPENDENT SPEAKERUNTUK KONTROL PBRALATAN RUMAH TANGGA
MELALUI PENGENALAN WICARA
Sri Utami
Jurusan Teknik Konversi Energi Politeknik Negeri Bandung
Email : [email protected]
Abstnft
Abstract
Konsumsi energi dqpal dikurangi solqh satunyo dengan pengonrrolan dan monitoring peralatanrumah tangga setiap waktu. Pengontrolan akon lebih efe*tif bila bisa dilakukan set;p sdat (lanmelalui pengenalan teicqra- Pengenalon wicara diimprementasik(tn untuk mengintror danmemonitoring perak)tan rumoh tangga jarak jouh. proses konrrol dilqkukan dari pc client ke pCserver. Sistem ini menpunyai inpul berupa dependent dan independent speaker. lntlependentspeakr digunakan untuk mengetahui sistem bisa bekerja untuk speoke, yaig bukan ne)upokanspeaker standql. Proses yang digunakondalampenelitianini.tdalqhpengombiiansinyal, sampling,frame, windowing LPC (Linear Prediction Cotle). proses-proies telsebutdin;mqluns;bo;;iproses eksrraksi. setelohirudilakukan proses f)ynamic Time l{arping (DTly) untuk mentadanionsinyol _mosukan dengan sinyal standor. proses el-straksidai Dynamic Time Warpingdilakukanpada PC client, hasilnya dikirim ke server untuk mengontrti olat yang diinli;ko;.setelqh alat terkontrol, perangkat kerrs akan memberikan feediack ke pC-seier ke"nudianmengirimkanrry ake PC clienr. Di PC client dapat diketahui kondisi peralqtan yang dikontro!. Alaty-ang dikontrol adalah empat buah lampu. Sistem yang dibingun mempunyai prosenlasekeberhasilqn rato-rotq l00 dependent speaker (penguiop yor[ ,uororyo iipoioi sebagaistatdar) dan prosentqse keberhasilan rata-roto 7l,ggo% ,niui iniep"ndeni ,p"ik", (p"rgriopyang suarqnyo tidak dipakai sebagqi standar).
Katq Kunci: dependent dan independent speaker, DTll
l
Enetg) consumption can be reduced by controlling and monitoring household appliances ctt alltimes. speech-recognition was ittrpremented to contror qnd monitor iome appriancii remotery. Thesystem based on dependenr .tnd independent speoker moders. tncrependiit speaker was tised todetermine the system works for speakers rhat ire not srqndard. The'process teere toking signars .sampling , frames , windowing , LpC ( Linear prediction Code ) arul called the ex,artiin piu,r"r,Then D|tnauic Time llarping (DTfi match the input signar with o stan(rard signqr. Extractionand Dlmamic Time llarping process \rere on the client pC , the resulr wqs senr-to the server tocontrol the desired device . The hardware wil provide feedback n rhe server pc ond then sends irto the dient Pc.The condition ofthe equipment being con*ofied cdn be seen on the crient pC. Theconlrolled device are four lamps.
.The system hos an qverqge success percentage 100 %o fordependent speaker and 71.88 %for independent speqker.
Key lltords: dependent dan independent speqker, DW
260
\
Jurnal Teknik Energi, Vol 3 No. 2 Okrober 201 l
PENDAHULUAN
Penghematan energi dapat dicapaidengan mengurangi konsumsi dankegiatan ;ang menggunakan energi.Manlaat lang diperoleh sama lapidengan tingkat efisiensi yang jauh lebihtinggi, bisa dilakukan salah satunyadengan mengontrol peralatan rumahtangga. Peralatan rumah tangga yangmerupakan kebutuhan sehari-hari biladigunakan secara bijaksana akanmenyebabkan berkurangnya biaya.
Penggunaan energi dikendalikanberdasarkan perintah yang dilakukansccara manual, wireles.s, timPr,pengendalian jarak jauh, darpengendalian jarak jauh denganpengenalan wicara. htelligent personalassistant dan knowledge navigator yangmerupakan salah satu aplikasi yang adapada iPhone 45 telah memanfaatkanefek suara untuk pengendalian.Dewantaratrl membuat aplikasipengenalan wicara untuk perintahnirkabel robot mikro rzoase. Anggraenidan Astutiklrl menggunakan pengenalanwicara untuk mengakses suatu jaringansebagai password.
Di samping itu, dalam beberapa tahunterakhir ini perkembangan duniatelekomunikasi mengalami kemajuanyang sangat pesat, sehinggapengendalian berbasis suara telahdimanfaatkan dalam berbagaikebutuhan, khususnya dalampengoperasian energi pada smarlbuilding.
Indikasi sumber suara dibedakanberdasarkan pemilik system (dependent)dan fainnya (independent). Signifikasisuara berbasis dependent dan
independent perlu diterjemahkan secara
akurat sehingga dapat dikenali olehperangkat kendalinya.
ISSN: 2089 - 2527
METODOLOGI
Speaker yang selama ini diterapkandalam sebuah sistem kendali adalahdependent speaker. Dalam beberapakeadaan, dibutuhkan independentspeaker :untr;,k mengendalikan peralatandalam sistem kendali. Salah satunyaadalah peralatan rumah tanggamengingat semakin majunya aspekteknologi yang diterapkan. Sistemdengan dependent speaker diperlukansalah satunya untuk sistem yangdigunakan untuk kepet inganumum-/bersama. Dengan adanyaperbandingan dependent danindependent speaker maka dapatdiketahui kehandalan sistem yang bisamengendalikan dan memonitoringperalatan tertentu.
Sistem keseluruhan sepeni yang tersajipada Gambar l. Speaker pada blokdiagram Gambar I memberikansuaranya sebagai masukan lewatmikrofon- Masukan ini akan diolahdalam PC client mulai dari proses
sampling, frame, windowing, FFT, LPC.Kemudian hasil dari LPC dicaripemadanan dengan LPC dari sinyalstandar yang telah tersimpan sebagaidatabase di dalam PC client. Hasil dariDTW tersebut akan dikirimkan ke PCserver melalui TCP,{IP untuk diprosesmenjadi suatu perintah ke perangkatkeras yang dikendalikan. Perintahtersebut merupakan bentukimplementasi dari perintah yangdiberikan dari PC client.
Sebaliknya dengan adanya perubahankondisi pada peralatan yang diinginkan,maka terjadisinyal balikan yang berupasinyal DTMF yang dikirimkan olehperangkat keras ke PC server. Oleh PCserver sinyal ini diolah untuk dikenalisebagai suatu kondisi tertentu yang akandikirimkan ke PC client sebagai laporantentang kondisi alat yang diinginkan.
26L
I
\
t
Jumal Teknik Energi, Vot 3 No. 2 Oktober 20 tj ISSN:2089 2527
Sampling
Sinyal wicara merupakan sinyal yangtidak terbatas dalam domain waktu(finite time interval). Untuk keperluanpemrosesan dalam transforma si Fourier,maka sinyal wicara harus dibentukdalam potongan-potongan rvaktu yanglerbatas (infnite time intervol)- Karenaitu sinyal yang ada dipotong-potongdalam slot-slot interval waktu teftentu.
Windowing
Lllindowing merupakan prosespengurangan efek diskontinyuitas padaawal dan akhir masing-masing sinyalyang telah di-framelol. Jenis windowyang digunakan adalah windowHamming-
.* * l --:l f*-B*-
Gambar l. Blok Diagram SistemPengendalian Lampu berbasis Wicara
Sinyal Suara Manusia
Manusia menggunakan suara sebagaisumber informasi untukmengkomunikasikan keinginan, ide danperasaannya kepada orang lain. Sinyalwicara adalah sinyal yang dihasilkanoleh suara manusia lang mempunyaifrekuensi kerja antara 0 sampai dengan5000 Hz. Pada program Snack yangakan digunakan, frekuensi samplfugdiset pada l2 kHz. Frekuensi .stttttplingini dipilih karena biasa digunakan untuIuoice, sedangkan untuk telephone biasadigunakan frekuensi santpling sebesar 8kHz.
Gambar 2 merupakan proses ekstraksisuara yang akan digunakan dalam prosespengenalan wicara yang digunakandalam sistem kendali. Proses ini dimulaidari masukan berupa santple suara yangakan digunakan dalam sistem.
Data yang digunakan sebagai datastandar merupakan data 8 kombinasikata, yaitu: satu nyala, satu mati, duanyala. dua mari. tiga n1ala. tiga mari.empat nyala, empat mati.
Gambar 3. Hasil Windowing Data SampelKata "empatmati" milidetik ke-13900
I
20000
10000
0
-10000
-20000
30000
I
.t600
?62
Gambar 2. Proses Ekstraksi SinyalWicara
lnrJ :
*" 'mpq -*,,0-t - ffT : 1ft - DIU - &.,or,tnldrd . .
Gambar 3 menunjukkan proseswindowing yang telah dilakukan. Darigambar tersebut bisa diamati bahwawindow Hamnting menyebabkan sinyalyang disampel menjadi lebih halus biladibandingkan dengan sinyal yang belummelalui proses windowing- Hal inimenunujukkan bahwa windowingberfungsi unluk mengurangi efekdiskontinyuitas pada $ung-rfiung frame.
Jumal l eknik Enerei, Vol i No. 2 Oktober 2013
Fourier Transform
Fast Fourier Transform (FFT) adalahsuatu metode yang sangat efisien untukmenyelesaikan Transformasi Fourierdiskrit (DFT) yang banyak dipakaiuntuk keperluan analisa sinyal. Sehinggadengan DFT sinyal yang di-samplingdalam domain waktu ditransformasikanke domain frekuensi.
ISSN: 2089 2527
Linear Prediction Code
Linear Prediction Code (LPC)merupakan proses pencarian ciri darisinyal wicara yang akan diolah. LinearPrediction Code (LPC) secara umumsebagai pemroses .front-end untukpengenalan wicara, perlu diketahuialasan mengapa LPC banyakdigunakant5l, yaitu:
. LPC menyuguhkan model yangbagus untuk sinyal wicara. Carayang digunakan LPC untuk analisasinyal wicara sangat beralasan untukpemisahan track dari sumber vokal.
o LPC adalah sebuah model traktabelsecara analitis.
. Model LPC bekerja dengan baikpada aplikasi pengenalan.
P..t Fouliei Trar3fom Parareter
- 'ti&9100
Rc 80
,: 60
:5 ao920
Fast Fourie! tlansro6 Sinyal
8000
Gambar ,1. Fasl Fourier Transform Siny^lMasukan dengan Menggunakan
Perargkat Lunak Tcl/Tk dan Snack
Setiap sinyal yang berasal dari alammerupakan sinyal analog yang biladiolah harus diubah ke dalam bentuksinyal digital. Pengolahan dalam bentukdigital merupakan pengolahan dalambentuk diskrit. Dalam penelitian ini.sinyal dalam domain waktu diubah kedalam domain frekuensi dengan 256titik. Karena hasil yang diperoleh berupahasil fungsi konvolusi, maka hanyadiambil 128 titik yang akan diolahdalam proses berikutnya. Sedangkan128 sisanya tidak dipergunakan karenaberupa penceminan.
Gambar 4 merupakan sinyal suara yangsebelumnya berada dalam domain waktutelah diubah dalarn domain frekuensi.Hasil -Fa.rl Fourier Transform, sinyalmasukan menunjukkan sebaranspektrum frekuensi dari sinyal suarayang telah dihasilkan oleh pengucapantara 0 sampai dengan 6000 Hz.
8000
Gambar 5. Fast Fourier Transform LPCdengan Menggunakan Perangkat Lunak
TCL/Tk dan Snack
Parameter LPC yang di-fouriertransform-kan seperti ditunjukkan pada
Garrbar 5 akan menjadi selubungspektrum dari spektrum sinyal masukan.Untuk menggambarkan ciri atau fiturwicara dalam domain waktu, maka LPCspectrum di- invers Jttst four ier-kan.
Dynamic Time llarping
Dynamic Tinte ll'arping (DTW)merupakan cara untuk memadankansinyal standar dengan sinyal input.Dengan menggunakan DTW, dua buahsinyal suara dibandingkan vektor-vektor
0 2000 4000 6000
Frekuensi lHz )
aI!g
I
0 2000 4000 6000
rreluensi lH2)
t
263
100
80
60
40
20
o
i
Jumal Teknik Energi, Vol 3 No. 2 Oktober 20lj
spektralnya seperti ditunjukkan padaGambar 6, dimana terdapat prosespembandingan panjang sinyal antara duabuah sinyal tersebut, sehingga rerjadiproses pemadanan panjang sinyaldengan cara memperpanjang danmenekuk vektor spektralnya.Memperpanjang dalam animemperpanjang sinyal yang lebihpendek dengan memperhatikanperbandingan vektor spektralnya.Demikian pula dengan menekuk, yaitumenekuk sinyal yang lebih panjangdengan memperhatikan vektorspektralnya. Dengan panjang yang samasebagai hasil DTW maka jarak euclidianantara sinyal dapat diperbandingkan ataudihitung.
ISSN: 2089 2527
untuk diproses menjadi suatu perintahke perangkat keras. Perintah tersebutmerupakan bentuk implementasi dariperintah yang diberikan dari PC client.
Sebalikrya, dengan adanya perubahankondisi pada peralatan yang diinginkan,maka terjadi sinyal balikan yang berupasinyal DTMF yang dikirimkan olehperangkat keras ke PC server. Oleh PCserver sinyal DTMF ini diolah untukdikenali sebagai suatu kondisi tertentuyang akan dikirimkan ke PC clientsebagai laporan tentang kondisi alatyang diinginkan
HASIL DAN PEMBAHASAN
Pada pengujian sistem, diambil sampeldata dari dua orang yang terdiri dari duaorang pria. Pria pertama merupakanstandar sekaligus pengisi suara untukperintah yang digunakan. Pria keduamerupakan pembanding untukmengetahui unjuk kerja sistem bilaperintah dilakukan oleh suara yangbukan merupakan pengisi suara standar(independent spe aker).
Identifikasi wicara sebagai perintahpengendalian lampu (Gambar l)disimulasikan melalui suara pria I(dependent speaker) dan pria 2 sebagaiindependent speaktr. Hasil pengujiandapat dilihat pada Tabel l. Speakermemberikan perintah "satu nyala, satumati, dua nyala, dua mati, tiga nyala,tiga mati, empat nyal4 empat mati"kepada sistem yang diuji.
Pada Tabel I terlihar bahwa pengujianpada pria I yang digunakan sebagaistandar (dependent speaker)memperoleh persentase keberhasilanrata-rata untuk semua perintah adalahsebesar l00o/0. Pengujian yang keduaadalah pengujian yang dilakukan olehpria 2 atau independent speaker (prialain yang suaranya tidak dipakai sebagaistandar). Persentase keberhasilan rata-rata yang didapat untuk semua perintah
-1+lEcl!g;oa'
50
00
50
0
0 50 100
Sinyal Input ienpat matin
150
Gambar 6. Pelekukan Jalur Suaradengan Dynamic Time Warping
Socket Programming
Socket programing adalah suatu aplikasiprogram )anB dapal membanlu sistemkomunikasi antar satu sistem komputerdengan sistem komputer lain denganmenggunakan protokol TCP/lP danprotokol lain yang terhubung.
Speaker memberikan suaranya sebagaimasukan lewat mikrofon. Masukan iniakan diolah dalam PC client m ai dariproses sumpling, frame, windowing,FFT, LPC. Kemudian hasil dari LPCdicari pemadanan (DTW) dengan LPCdari sinyal standar )ang telah rersimpansebagai basis data di dalam PC client.Hasil dari DTW tersebut akandikirimkan ke PC serter melalui TCP/IP
264
Pelekuke Jalu! su&a
Jumal Teknik Energi, Vol 3 No. 2 Oktober 2013
7l ,88%. Hal ini menunjukkan bahwauntuk suara yang dijadikan sebagaistandar, sistem berhasil mengenali danmemberi respon sebagaimana perintahyang diberikan. Untuk suara yang tidakdijadikan sebagai standar keberhasilansistem tidak setinggi jika dibandingkandengan suara yang dijadikan standar.Hal ini menuniukkan sinyal masukandan sinyal standar yang berbeda. Darihasil pengujian menunjukkan ciri sinyalsuara yang dihasilkan oleh speakerpertama sama dengan pemberi standar,sedangkan untuk speaker ke dua,
speaker dan pemberi standarmempunyai ciri sinyal suara yangmendekati sama.
Tabel l. Tingkat Keberhasilan SistemPerangkat Lunak
uoKEBEFHASILAN
l
2
?
ll
aDz
il
15
KESIMPULAN
Sistem yang diuji mempunyai tingkatakurasi yang tinggi untuk pengucapmasukan dan pengucap standar yangsama (dependent speaker)- Hal inidibuktikan dengan hasil pengujian yangdilakukan oleh pria pertama. Sedangkan
untuk pengujian yang dilakukan olehsuara lain (independent speaker) tingkat
ISSN: 2089 - 2527
keberhasilannya bervariasi dari 50%sampai dengan 100%. Hal inidisebabkan karena suara pria keduatidak pernah berinteraksi dengan sistem.Keberhasilan sistem ditunjukkan dengan
ketepatan penyalaan/pematian lampusesuai dengan yang diperintahkanmelalui perintah suara.
DAFTAR PUSTAKA
I . Anggraeni, Triana Dewi, Astutik,Debi Puji, Pengenalan Wicaradengan Penutur Tak Bebas,PENS ITS 2OO3
2. Dewantara. Bima Sena Bayu,Aplikasi Pengenalan Wicarauntuk Perintah Nirkabel RobotMikro Mouse
3. Dutono, Titon, PenataranKebahasaan Tahap I :FonetikDan Fonologi -PengolahanSinyal Wicara Digital, 2001
4. Gabel, Robert A, Richard A Robert,SinyaldanSistemLinier,Erlangga1996
5. Rabiner, Lawrence, Huang Juang,Biing, Fundamentals of SpeechRecognition, Prentice HallInternational Inc, I 993
6. Proakis, John G, Malonakis.Dimitris G, Digital SignalProcessing Principles,Algorithms. and Applications.Prentice Hall, Inc., New Jersey,1995
265
\
5
1?