17
Dolování informací z řeči – BUT Speech@FIT group Honza Černocký BUT Speech@FIT, Brno University of Technology, Czech Republic 10.04.2013

Dolov ání informací z řeči – BUT Speech @FIT group

  • Upload
    stew

  • View
    36

  • Download
    0

Embed Size (px)

DESCRIPTION

Dolov ání informací z řeči – BUT Speech @FIT group. Honza Černocký BUT S peech@FIT, Brno University of Technology, Czech Republic 10.04.2013. Co d ěláme ?. „Co bylo řečeno“ – rozpoznávání řeči (speech recognition) - PowerPoint PPT Presentation

Citation preview

Page 1: Dolov ání informací z řeči  – BUT Speech @FIT group

Dolování informací z řeči – BUT Speech@FIT group

Honza Černocký

BUT Speech@FIT, Brno University of Technology, Czech Republic

10.04.2013

Page 2: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

2/17

Co děláme ?• „Co bylo řečeno“ – rozpoznávání řeči (speech

recognition)• Celkový přepis – rozpoznávání plynulé řeči s

velkým slovníkem (large vocabulary continuous speech recognition LVCSR)

• Detekce klíčových slov nebo frází – keyword/keyphrase spotting

• „Jakou řečí“ – rozpoznávání jazyka (language identification LID)

• „Kdo to řekl“– rozpoznávání mluvčího • Výběr jednoho mluvčího z množiny –

identifikace mluvčího – speaker identification• Ověření předpokládané identity – verifikace

mluvčího – speaker verification.

Page 3: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

3/17

K čemu je to dobré I: Obrana/bezpečnost

Page 4: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

4/17

K čemu je to dobré II – Call Centra, přednášky

Page 5: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

5/17

Jak to dělámeKlasifikace, rozpoznávání,

machine learning

Page 6: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

6/17

Potřebujeme data • Kupujeme• Nahráváme

matylda1:/mnt/data 24T 22T 2.5T 90% /mnt/matylda1matylda2:/speech 22T 13T 9.3T 57% /mnt/matylda2matylda3:/speech 26T 24T 1.5T 95% /mnt/matylda3matylda4:/speech 26T 18T 7.9T 70% /mnt/matylda4matylda5:/speech 26T 15T 11T 57% /mnt/matylda5matylda6:/speech 26T 16T 9.3T 64% /mnt/matylda6scratch01:/mnt/data 3.0T 2.2T 829G 73% /mnt/scratch01scratch02:/mnt/data 3.0T 2.0T 1.1T 66% /mnt/scratch02scratch03:/mnt/data 1.9T 1.4T 487G 74% /mnt/scratch03scratch04:/mnt/data 3.0T 2.5T 442G 86% /mnt/scratch04scratch05:/mnt/data 3.0T 1.8T 1.2T 61% /mnt/scratch05scratch06:/mnt/data 4.6T 3.5T 1.1T 77% /mnt/scratch06

• Stahujeme• Anotujeme

Page 7: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

7/17

… a šrot

Page 8: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

8/17

… a potřebujeme vědět, jak nám to jde• „Já jsem lepší než ti druzí“ – jen kecy, pokud nejsou stejná

data a evaluační metriky• NIST – agentura vlády USA, http://www.nist.gov/speech• Její řečová skupina organizuje pravidelné evaluace

řečových technologií (rozpoznávání řeči, řečníka, jazyka, …).

• Všechny participující laboratoři obdrží stejná data a mají omezený čas na jejich analýzu a odeslání výsledků NISTu – objektivní srovnání výsledků.

• Výsledky a detaily jednotlivých systémů se diskutují na následném workshopu.

• Speech@FIT se evaluací účastní: Meeting recognition 2005, 2006, 2007, 2009, Language ID 2003, 2005, 2007, 2009, 2011, SpkVer 1998, 1999, 2006, 2008, 2010, 2012 Spoken term detection 2006, IARPA BEST 2011, DARPA RATS 2012, …

Page 9: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

9/17

Lidi• Founded in 1997 (1 person)• grew to ~20 people in now

• faculty• researchers • grad and

pre-grad students

• support staffBosses:Research

director:Lukas Burget

Managing director:

Honza Cernocky

Guru:Hynek

Hermansky

Page 10: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

10/17

• Faculty (faculty members, research intent) research funds)

• EU projects (FP[4567])• Past: SpeechDat, SpeeCon, M4, AMI,

CareTaker, AMIDA, MOBIO, weKnowIt, DIRAC• Running: FP7 GLOCAL

• US funding – Air Force EOARD, IARPA, DARPA

• Local funding agencies - Grant Agency of CR, Ministries of Education, and Trade and Commerce

• Czech “force” ministries – Defense, Interior

Kdo to platí (~ 17 MCZK / rok) ?

Page 11: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

11/17

Aplikace výsledkůSpin-offs

International

Local

Page 12: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

12/17

Internacionalisace a komunita• NIST evaluations, US-funded projects, EU

projects, …• SW „tisíce děkovných dopisů“ – phnrec, RNNLM toolkit, TNet, …

• Lidi odjinud (Indie, Irán, Německo, Rusko, Itálie)• Long term, • short term

• Workshopy a komunity okolo nich• BOSARIS 2010, asi 2012• KALDI 2010, 2011, asi 2012

=> Working language is English => Cross-Atlantic teams

Page 13: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

13/17

Čeho si nejvíce vážím ?

• U.S. IARPA program „BABEL“:

Page 14: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

14/17

Hot topics

• Strašná data (DARPA RATS)• Multi-lingualita, málo a/nebo žádná a/nebo

špatně popsaná trénovací data.• IARPA BABEL• MPO

Page 15: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

15/17

PhD ?• Požadujeme

• Positivní vztah k matematice (ISS a ZRE jsou jen slabý odvar) a teoretické informatice

• Slušné programování• Čtenou a mluvenou angličtinu

• >100% úvazek• Dlouhou učící křivku („proč si na meetingu pořád

připadám jako debil ?“)• SitzFleisch a samo-motivace !

Page 16: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

16/17

PhD !

• Top research group • Okamžitá aplikace vybádaného v praxi. • Mezinárodní konference, projekty a evaluace –

zajímaví lidé, zajímavá místa (i na déle) a skutečné srovnání se světem.

• $ navíc ke stipendiu• Sociální aspekt

• Pěkné vztahy• Kompetence v různých praktických oblastech

života• RC modely• Lezení po kameni i ledu• Fun-carving• Kite-boarding• Stavba elektronkových kytarových zesilovačů

Page 17: Dolov ání informací z řeči  – BUT Speech @FIT group

BUT Speech@FIT group Honza Cernocky 7.4.2011

17/17

Není to zas tak složitý…

Zdroj: S. Young et al.: The HTK Book (for HTK Version 3.4), Cambridge University Engineering Department, 2006

Zdroj: T. Černocký: poznámky z předmětu Matematika pro 1. ročník, ZŠ Krásného Brno, školní rok 2006/2007.