DEPENDENT DAN INDEPENDENT SPEAKER UNTUK KONTROL …

Jumal Teknik Energi, Vol 3 No. 2 Okrober 2013 ISSN:2089 2527

DEPENDENT DAN INDEPENDENT SPEAKERUNTUK KONTROL PBRALATAN RUMAH TANGGA

MELALUI PENGENALAN WICARA

Sri Utami

Jurusan Teknik Konversi Energi Politeknik Negeri Bandung

Email : [email protected]

Abstnft

Abstract

Konsumsi energi dqpal dikurangi solqh satunyo dengan pengonrrolan dan monitoring peralatanrumah tangga setiap waktu. Pengontrolan akon lebih efe*tif bila bisa dilakukan set;p sdat (lanmelalui pengenalan teicqra- Pengenalon wicara diimprementasik(tn untuk mengintror danmemonitoring perak)tan rumoh tangga jarak jouh. proses konrrol dilqkukan dari pc client ke pCserver. Sistem ini menpunyai inpul berupa dependent dan independent speaker. lntlependentspeakr digunakan untuk mengetahui sistem bisa bekerja untuk speoke, yaig bukan ne)upokanspeaker standql. Proses yang digunakondalampenelitianini.tdalqhpengombiiansinyal, sampling,frame, windowing LPC (Linear Prediction Cotle). proses-proies telsebutdin;mqluns;bo;;iproses eksrraksi. setelohirudilakukan proses f)ynamic Time l{arping (DTly) untuk mentadanionsinyol _mosukan dengan sinyal standor. proses el-straksidai Dynamic Time Warpingdilakukanpada PC client, hasilnya dikirim ke server untuk mengontrti olat yang diinli;ko;.setelqh alat terkontrol, perangkat kerrs akan memberikan feediack ke pC-seier ke"nudianmengirimkanrry ake PC clienr. Di PC client dapat diketahui kondisi peralqtan yang dikontro!. Alaty-ang dikontrol adalah empat buah lampu. Sistem yang dibingun mempunyai prosenlasekeberhasilqn rato-rotq l00 dependent speaker (penguiop yor[ ,uororyo iipoioi sebagaistatdar) dan prosentqse keberhasilan rata-roto 7l,ggo% ,niui iniep"ndeni ,p"ik", (p"rgriopyang suarqnyo tidak dipakai sebagqi standar).

Katq Kunci: dependent dan independent speaker, DTll

l

Enetg) consumption can be reduced by controlling and monitoring household appliances ctt alltimes. speech-recognition was ittrpremented to contror qnd monitor iome appriancii remotery. Thesystem based on dependenr .tnd independent speoker moders. tncrependiit speaker was tised todetermine the system works for speakers rhat ire not srqndard. The'process teere toking signars .sampling , frames , windowing , LpC ( Linear prediction Code ) arul called the ex,artiin piu,r"r,Then D|tnauic Time llarping (DTfi match the input signar with o stan(rard signqr. Extractionand Dlmamic Time llarping process \rere on the client pC , the resulr wqs senr-to the server tocontrol the desired device . The hardware wil provide feedback n rhe server pc ond then sends irto the dient Pc.The condition ofthe equipment being con*ofied cdn be seen on the crient pC. Theconlrolled device are four lamps.

.The system hos an qverqge success percentage 100 %o fordependent speaker and 71.88 %for independent speqker.

Key lltords: dependent dan independent speqker, DW

260

\

Jurnal Teknik Energi, Vol 3 No. 2 Okrober 201 l

PENDAHULUAN

Penghematan energi dapat dicapaidengan mengurangi konsumsi dankegiatan ;ang menggunakan energi.Manlaat lang diperoleh sama lapidengan tingkat efisiensi yang jauh lebihtinggi, bisa dilakukan salah satunyadengan mengontrol peralatan rumahtangga. Peralatan rumah tangga yangmerupakan kebutuhan sehari-hari biladigunakan secara bijaksana akanmenyebabkan berkurangnya biaya.

Penggunaan energi dikendalikanberdasarkan perintah yang dilakukansccara manual, wireles.s, timPr,pengendalian jarak jauh, darpengendalian jarak jauh denganpengenalan wicara. htelligent personalassistant dan knowledge navigator yangmerupakan salah satu aplikasi yang adapada iPhone 45 telah memanfaatkanefek suara untuk pengendalian.Dewantaratrl membuat aplikasipengenalan wicara untuk perintahnirkabel robot mikro rzoase. Anggraenidan Astutiklrl menggunakan pengenalanwicara untuk mengakses suatu jaringansebagai password.

Di samping itu, dalam beberapa tahunterakhir ini perkembangan duniatelekomunikasi mengalami kemajuanyang sangat pesat, sehinggapengendalian berbasis suara telahdimanfaatkan dalam berbagaikebutuhan, khususnya dalampengoperasian energi pada smarlbuilding.

Indikasi sumber suara dibedakanberdasarkan pemilik system (dependent)dan fainnya (independent). Signifikasisuara berbasis dependent dan

independent perlu diterjemahkan secara

akurat sehingga dapat dikenali olehperangkat kendalinya.

ISSN: 2089 - 2527

METODOLOGI

Speaker yang selama ini diterapkandalam sebuah sistem kendali adalahdependent speaker. Dalam beberapakeadaan, dibutuhkan independentspeaker :untr;,k mengendalikan peralatandalam sistem kendali. Salah satunyaadalah peralatan rumah tanggamengingat semakin majunya aspekteknologi yang diterapkan. Sistemdengan dependent speaker diperlukansalah satunya untuk sistem yangdigunakan untuk kepet inganumum-/bersama. Dengan adanyaperbandingan dependent danindependent speaker maka dapatdiketahui kehandalan sistem yang bisamengendalikan dan memonitoringperalatan tertentu.

Sistem keseluruhan sepeni yang tersajipada Gambar l. Speaker pada blokdiagram Gambar I memberikansuaranya sebagai masukan lewatmikrofon- Masukan ini akan diolahdalam PC client mulai dari proses

sampling, frame, windowing, FFT, LPC.Kemudian hasil dari LPC dicaripemadanan dengan LPC dari sinyalstandar yang telah tersimpan sebagaidatabase di dalam PC client. Hasil dariDTW tersebut akan dikirimkan ke PCserver melalui TCP,{IP untuk diprosesmenjadi suatu perintah ke perangkatkeras yang dikendalikan. Perintahtersebut merupakan bentukimplementasi dari perintah yangdiberikan dari PC client.

Sebaliknya dengan adanya perubahankondisi pada peralatan yang diinginkan,maka terjadisinyal balikan yang berupasinyal DTMF yang dikirimkan olehperangkat keras ke PC server. Oleh PCserver sinyal ini diolah untuk dikenalisebagai suatu kondisi tertentu yang akandikirimkan ke PC client sebagai laporantentang kondisi alat yang diinginkan.

26L

I

\

t

Jumal Teknik Energi, Vot 3 No. 2 Oktober 20 tj ISSN:2089 2527

Sampling

Sinyal wicara merupakan sinyal yangtidak terbatas dalam domain waktu(finite time interval). Untuk keperluanpemrosesan dalam transforma si Fourier,maka sinyal wicara harus dibentukdalam potongan-potongan rvaktu yanglerbatas (infnite time intervol)- Karenaitu sinyal yang ada dipotong-potongdalam slot-slot interval waktu teftentu.

Windowing

Lllindowing merupakan prosespengurangan efek diskontinyuitas padaawal dan akhir masing-masing sinyalyang telah di-framelol. Jenis windowyang digunakan adalah windowHamming-

.* * l --:l f*-B*-

Gambar l. Blok Diagram SistemPengendalian Lampu berbasis Wicara

Sinyal Suara Manusia

Manusia menggunakan suara sebagaisumber informasi untukmengkomunikasikan keinginan, ide danperasaannya kepada orang lain. Sinyalwicara adalah sinyal yang dihasilkanoleh suara manusia lang mempunyaifrekuensi kerja antara 0 sampai dengan5000 Hz. Pada program Snack yangakan digunakan, frekuensi samplfugdiset pada l2 kHz. Frekuensi .stttttplingini dipilih karena biasa digunakan untuIuoice, sedangkan untuk telephone biasadigunakan frekuensi santpling sebesar 8kHz.

Gambar 2 merupakan proses ekstraksisuara yang akan digunakan dalam prosespengenalan wicara yang digunakandalam sistem kendali. Proses ini dimulaidari masukan berupa santple suara yangakan digunakan dalam sistem.

Data yang digunakan sebagai datastandar merupakan data 8 kombinasikata, yaitu: satu nyala, satu mati, duanyala. dua mari. tiga n1ala. tiga mari.empat nyala, empat mati.

Gambar 3. Hasil Windowing Data SampelKata "empatmati" milidetik ke-13900

I

20000

10000

0

-10000

-20000

30000

I

.t600

?62

Gambar 2. Proses Ekstraksi SinyalWicara

lnrJ :

*" 'mpq -*,,0-t - ffT : 1ft - DIU - &.,or,tnldrd . .

Gambar 3 menunjukkan proseswindowing yang telah dilakukan. Darigambar tersebut bisa diamati bahwawindow Hamnting menyebabkan sinyalyang disampel menjadi lebih halus biladibandingkan dengan sinyal yang belummelalui proses windowing- Hal inimenunujukkan bahwa windowingberfungsi unluk mengurangi efekdiskontinyuitas pada $ung-rfiung frame.

Jumal l eknik Enerei, Vol i No. 2 Oktober 2013

Fourier Transform

Fast Fourier Transform (FFT) adalahsuatu metode yang sangat efisien untukmenyelesaikan Transformasi Fourierdiskrit (DFT) yang banyak dipakaiuntuk keperluan analisa sinyal. Sehinggadengan DFT sinyal yang di-samplingdalam domain waktu ditransformasikanke domain frekuensi.

ISSN: 2089 2527

Linear Prediction Code

Linear Prediction Code (LPC)merupakan proses pencarian ciri darisinyal wicara yang akan diolah. LinearPrediction Code (LPC) secara umumsebagai pemroses .front-end untukpengenalan wicara, perlu diketahuialasan mengapa LPC banyakdigunakant5l, yaitu:

. LPC menyuguhkan model yangbagus untuk sinyal wicara. Carayang digunakan LPC untuk analisasinyal wicara sangat beralasan untukpemisahan track dari sumber vokal.

o LPC adalah sebuah model traktabelsecara analitis.

. Model LPC bekerja dengan baikpada aplikasi pengenalan.

P..t Fouliei Trar3fom Parareter

- 'ti&9100

Rc 80

,: 60

:5 ao920

Fast Fourie! tlansro6 Sinyal

8000

Gambar ,1. Fasl Fourier Transform Siny^lMasukan dengan Menggunakan

Perargkat Lunak Tcl/Tk dan Snack

Setiap sinyal yang berasal dari alammerupakan sinyal analog yang biladiolah harus diubah ke dalam bentuksinyal digital. Pengolahan dalam bentukdigital merupakan pengolahan dalambentuk diskrit. Dalam penelitian ini.sinyal dalam domain waktu diubah kedalam domain frekuensi dengan 256titik. Karena hasil yang diperoleh berupahasil fungsi konvolusi, maka hanyadiambil 128 titik yang akan diolahdalam proses berikutnya. Sedangkan128 sisanya tidak dipergunakan karenaberupa penceminan.

Gambar 4 merupakan sinyal suara yangsebelumnya berada dalam domain waktutelah diubah dalarn domain frekuensi.Hasil -Fa.rl Fourier Transform, sinyalmasukan menunjukkan sebaranspektrum frekuensi dari sinyal suarayang telah dihasilkan oleh pengucapantara 0 sampai dengan 6000 Hz.

8000

Gambar 5. Fast Fourier Transform LPCdengan Menggunakan Perangkat Lunak

TCL/Tk dan Snack

Parameter LPC yang di-fouriertransform-kan seperti ditunjukkan pada

Garrbar 5 akan menjadi selubungspektrum dari spektrum sinyal masukan.Untuk menggambarkan ciri atau fiturwicara dalam domain waktu, maka LPCspectrum di- invers Jttst four ier-kan.

Dynamic Time llarping

Dynamic Tinte ll'arping (DTW)merupakan cara untuk memadankansinyal standar dengan sinyal input.Dengan menggunakan DTW, dua buahsinyal suara dibandingkan vektor-vektor

0 2000 4000 6000

Frekuensi lHz )

aI!g

I

0 2000 4000 6000

rreluensi lH2)

t

263

100

80

60

40

20

o

i

Jumal Teknik Energi, Vol 3 No. 2 Oktober 20lj

spektralnya seperti ditunjukkan padaGambar 6, dimana terdapat prosespembandingan panjang sinyal antara duabuah sinyal tersebut, sehingga rerjadiproses pemadanan panjang sinyaldengan cara memperpanjang danmenekuk vektor spektralnya.Memperpanjang dalam animemperpanjang sinyal yang lebihpendek dengan memperhatikanperbandingan vektor spektralnya.Demikian pula dengan menekuk, yaitumenekuk sinyal yang lebih panjangdengan memperhatikan vektorspektralnya. Dengan panjang yang samasebagai hasil DTW maka jarak euclidianantara sinyal dapat diperbandingkan ataudihitung.

ISSN: 2089 2527

untuk diproses menjadi suatu perintahke perangkat keras. Perintah tersebutmerupakan bentuk implementasi dariperintah yang diberikan dari PC client.

Sebalikrya, dengan adanya perubahankondisi pada peralatan yang diinginkan,maka terjadi sinyal balikan yang berupasinyal DTMF yang dikirimkan olehperangkat keras ke PC server. Oleh PCserver sinyal DTMF ini diolah untukdikenali sebagai suatu kondisi tertentuyang akan dikirimkan ke PC clientsebagai laporan tentang kondisi alatyang diinginkan

HASIL DAN PEMBAHASAN

Pada pengujian sistem, diambil sampeldata dari dua orang yang terdiri dari duaorang pria. Pria pertama merupakanstandar sekaligus pengisi suara untukperintah yang digunakan. Pria keduamerupakan pembanding untukmengetahui unjuk kerja sistem bilaperintah dilakukan oleh suara yangbukan merupakan pengisi suara standar(independent spe aker).

Identifikasi wicara sebagai perintahpengendalian lampu (Gambar l)disimulasikan melalui suara pria I(dependent speaker) dan pria 2 sebagaiindependent speaktr. Hasil pengujiandapat dilihat pada Tabel l. Speakermemberikan perintah "satu nyala, satumati, dua nyala, dua mati, tiga nyala,tiga mati, empat nyal4 empat mati"kepada sistem yang diuji.

Pada Tabel I terlihar bahwa pengujianpada pria I yang digunakan sebagaistandar (dependent speaker)memperoleh persentase keberhasilanrata-rata untuk semua perintah adalahsebesar l00o/0. Pengujian yang keduaadalah pengujian yang dilakukan olehpria 2 atau independent speaker (prialain yang suaranya tidak dipakai sebagaistandar). Persentase keberhasilan rata-rata yang didapat untuk semua perintah

-1+lEcl!g;oa'

50

00

50

0

0 50 100

Sinyal Input ienpat matin

150

Gambar 6. Pelekukan Jalur Suaradengan Dynamic Time Warping

Socket Programming

Socket programing adalah suatu aplikasiprogram )anB dapal membanlu sistemkomunikasi antar satu sistem komputerdengan sistem komputer lain denganmenggunakan protokol TCP/lP danprotokol lain yang terhubung.

Speaker memberikan suaranya sebagaimasukan lewat mikrofon. Masukan iniakan diolah dalam PC client m ai dariproses sumpling, frame, windowing,FFT, LPC. Kemudian hasil dari LPCdicari pemadanan (DTW) dengan LPCdari sinyal standar )ang telah rersimpansebagai basis data di dalam PC client.Hasil dari DTW tersebut akandikirimkan ke PC serter melalui TCP/IP

264

Pelekuke Jalu! su&a

Jumal Teknik Energi, Vol 3 No. 2 Oktober 2013

7l ,88%. Hal ini menunjukkan bahwauntuk suara yang dijadikan sebagaistandar, sistem berhasil mengenali danmemberi respon sebagaimana perintahyang diberikan. Untuk suara yang tidakdijadikan sebagai standar keberhasilansistem tidak setinggi jika dibandingkandengan suara yang dijadikan standar.Hal ini menuniukkan sinyal masukandan sinyal standar yang berbeda. Darihasil pengujian menunjukkan ciri sinyalsuara yang dihasilkan oleh speakerpertama sama dengan pemberi standar,sedangkan untuk speaker ke dua,

speaker dan pemberi standarmempunyai ciri sinyal suara yangmendekati sama.

Tabel l. Tingkat Keberhasilan SistemPerangkat Lunak

uoKEBEFHASILAN

l

2

?

ll

aDz

il

15

KESIMPULAN

Sistem yang diuji mempunyai tingkatakurasi yang tinggi untuk pengucapmasukan dan pengucap standar yangsama (dependent speaker)- Hal inidibuktikan dengan hasil pengujian yangdilakukan oleh pria pertama. Sedangkan

untuk pengujian yang dilakukan olehsuara lain (independent speaker) tingkat

ISSN: 2089 - 2527

keberhasilannya bervariasi dari 50%sampai dengan 100%. Hal inidisebabkan karena suara pria keduatidak pernah berinteraksi dengan sistem.Keberhasilan sistem ditunjukkan dengan

ketepatan penyalaan/pematian lampusesuai dengan yang diperintahkanmelalui perintah suara.

DAFTAR PUSTAKA

I . Anggraeni, Triana Dewi, Astutik,Debi Puji, Pengenalan Wicaradengan Penutur Tak Bebas,PENS ITS 2OO3

2. Dewantara. Bima Sena Bayu,Aplikasi Pengenalan Wicarauntuk Perintah Nirkabel RobotMikro Mouse

3. Dutono, Titon, PenataranKebahasaan Tahap I :FonetikDan Fonologi -PengolahanSinyal Wicara Digital, 2001

4. Gabel, Robert A, Richard A Robert,SinyaldanSistemLinier,Erlangga1996

5. Rabiner, Lawrence, Huang Juang,Biing, Fundamentals of SpeechRecognition, Prentice HallInternational Inc, I 993

6. Proakis, John G, Malonakis.Dimitris G, Digital SignalProcessing Principles,Algorithms. and Applications.Prentice Hall, Inc., New Jersey,1995

265

\

5

1?

Documents

DEPENDENT DAN INDEPENDENT SPEAKER UNTUK KONTROL …