17
FAKULTETA ZA ELEKTROTEHNIKO, RAČUNALNIŠTVO IN INFORMATIKO 2000 Maribor, Smetanova ul. 17 Razpoznava govora z usmerjeno nevronsko mrežo Avtorja: Aleš Tetičkovič Simon Klančnik Mentor: izr. prof. dr. Riko Šafarič Somentor: Gregor Pačnik Interdisciplinarna študijska smer Mehatronika

Razpoznava govora z usmerjeno nevronsko mrežo

  • Upload
    erica

  • View
    41

  • Download
    0

Embed Size (px)

DESCRIPTION

FAKULTETA ZA ELEKTROTEHNIKO, RAČUNALNIŠTVO IN INFORMATIKO 2000 Maribor, Smetanova ul. 17. Razpoznava govora z usmerjeno nevronsko mrežo. Interdisciplinarna študijska smer Mehatronika. Avtorja: Aleš Tetičkovič Simon Klančnik Mentor: izr. prof. dr. Riko Šafarič Somentor: Gregor Pačnik. - PowerPoint PPT Presentation

Citation preview

Page 1: Razpoznava govora z usmerjeno nevronsko mrežo

FAKULTETA ZA ELEKTROTEHNIKO,RAČUNALNIŠTVO IN INFORMATIKO2000 Maribor, Smetanova ul. 17

Razpoznava govora z usmerjeno nevronsko mrežo

Avtorja:Aleš TetičkovičSimon Klančnik

Mentor:izr. prof. dr. Riko ŠafaričSomentor:Gregor Pačnik

Interdisciplinarna študijska smer Mehatronika

Page 2: Razpoznava govora z usmerjeno nevronsko mrežo

2

Uvod

Na področju prepoznave govora so se v preteklosti oblikovale številne metode.

Prepoznava govora z usmerjeno nevronsko mrežo. Primarni cilj prepoznave govora je vodenje invalidskega

vozička primernega za invalide, ki so hromi od vratu navzdol (tetraplegiki).

Bistven problem pri prepoznavi povzročajo motnje iz okolice.

Page 3: Razpoznava govora z usmerjeno nevronsko mrežo

3

Invalidski voziček

Page 4: Razpoznava govora z usmerjeno nevronsko mrežo

4

Blokovna shema prepoznave govora

Page 5: Razpoznava govora z usmerjeno nevronsko mrežo

5

Izolacija besede

Izolacija besede po metodi izračuna tekočega povprečja in primerjavi z pragovno vrednostjo.

Izolacija besede po metodi izračuna števila prehodov čez nič signala (“zero crossing” metoda).

Page 6: Razpoznava govora z usmerjeno nevronsko mrežo

6

Primerjava rezultatov obeh metod

Metoda izračuna tekočega povprečja

“Zero crossing” metoda

Page 7: Razpoznava govora z usmerjeno nevronsko mrežo

7

LPC kepstralna analiza

Količina podatkov je za prepoznavo z usmerjeno nevronsko mrežo preobsežna.

Metoda temelji na aproksimaciji zvočnega signala kot linearne kombinacije predhodnih zvočnih vzorcev.

Rezultat analize je pretvorba besede v zaporedje točk, kjer vsaka točka pripada 12 dimenzionalnemu LPC kepstralnemu prostoru.

Page 8: Razpoznava govora z usmerjeno nevronsko mrežo

8

Samoorganizirajoča nevronska mreža (SOM)

Primerna za reduciranje dimenzij vhodnega signala. Spada med nevronske mreže s tekmovalnim

načinom učenja. Izhode iz SOM mreže predstavljajo pozicije

zmagovalnih nevronov. Na kakovost reduciranja dimenzij vpliva konfiguracija

SOM mreže. Dosežemo dodatno zmanjševanje količine podatkov

za prepoznavalnik govora.

Page 9: Razpoznava govora z usmerjeno nevronsko mrežo

9

Postopek učenja SOM mreže

1. Iskanje zmagovalnega nevrona:

2. Korekcija uteži nevronov se izvede z naslednjo enačbo:

Page 10: Razpoznava govora z usmerjeno nevronsko mrežo

10

Prikaz rezultatov učenja SOM mreže

Besedi LEVO Besedi DESNO Besedi STOP

Page 11: Razpoznava govora z usmerjeno nevronsko mrežo

11

Usmerjena nevronska mreža

Predstavlja naš prepoznavalnik govora. Spadajo med nevronske mreže z nadzorovanim

postopkom učenja. Osnovni element usmerjene nevronske mreže predstavlja

umetni nevron. Sestavljena iz vhodnega nivoja, enega ali več skritih

nivojev, ter izhodnega nivoja, ki predstavlja rezultate prepoznave.

Za učenje usmerjene nevronske mreže je uporabljeno posplošeno delta pravilo.

Page 12: Razpoznava govora z usmerjeno nevronsko mrežo

12

Umetni nevron

Izračun izhoda iz umetnega nevrona:

o = σ(∑iiwi + b)

Page 13: Razpoznava govora z usmerjeno nevronsko mrežo

13

Zgradba usmerjene nevronske mreže

Page 14: Razpoznava govora z usmerjeno nevronsko mrežo

14

Postopek učenja usmerjene nevronske mreže

Normalizacija dobljenih SOM izhodov na fiksno dolžino (200 koeficientov).

Izračun izhodov posameznega nivoja usmerjene nevronske mreže.

Primerjava izhodov izhodnega nivoja nevronske mreže z vektorjem tarče za posamezni ukaz.

Spreminjanje uteži posameznih nevronov v usmerjeni nevronski mreži.

Postopek ponavljamo dokler ne dobimo želenih rezultatov.

Page 15: Razpoznava govora z usmerjeno nevronsko mrežo

15

Rezultati učenja usmerjene nevronske mreže

Učenje nevronske mreže na ukaze LEVO, DESNO, NAPREJ in STOP

Trenutno izbrano 15 nevronov v skritem nivoju.

Ukaz Število vzorcev

Število napak

Kvaliteta prepoznave

Levo 6 0 100 %

Desno 6 0 100 %

Naprej 6 0 100 %

Stop 6 0 100 %

Rezultati razpoznave ukazov

Page 16: Razpoznava govora z usmerjeno nevronsko mrežo

16

Zaključek

Prepoznava z usmerjeno nevronsko mrežo primerna za vodenje sistemov z majhnim naborom ukazov.

V okolju brez motenj je prepoznava zanesljiva. Problemi pri prepoznavi govora v okolju z

naključnimi motnjami. Implementacija obeh nevronskih mrež na DSP

kartici.

Page 17: Razpoznava govora z usmerjeno nevronsko mrežo

17

Vprašanja ?