20
Prosjekt Talegjenkjenning på Norsk Et Inkluderende arbeidsliv med talegjenkjenning Et Inkluderende arbeidsliv med talegjenkjenning

Prosjekt Talegjenkjenning på Norsk

Embed Size (px)

DESCRIPTION

Prosjekt Talegjenkjenning på Norsk. Et Inkluderende arbeidsliv med talegjenkjenning. Prosjekt i regi av NAV. Deltakere : Bengt Kjellså, InfoShare Solutions AS Daniel Scheidegger, NAV Kompetansesenter for tilrettelegging og deltakelse (NAV Tilde) Britt Ormaasen, Brukerrepresentant. Formål :. - PowerPoint PPT Presentation

Citation preview

Page 1: Prosjekt Talegjenkjenning på Norsk

ProsjektTalegjenkjenning på Norsk

Et Inkluderende arbeidsliv med talegjenkjenningEt Inkluderende arbeidsliv med talegjenkjenning

Page 2: Prosjekt Talegjenkjenning på Norsk

Prosjekt i regi av NAV

Deltakere :

Bengt Kjellså, InfoShare Solutions AS

Daniel Scheidegger, NAV Kompetansesenter for tilrettelegging og deltakelse (NAV Tilde)

Britt Ormaasen, Brukerrepresentant

Page 3: Prosjekt Talegjenkjenning på Norsk

Formål :

Kartlegge behovSamfunnsmessig – Samfunnsøkonomisk

Hva skal til for å få talegjenkjenning på Norsk

Page 4: Prosjekt Talegjenkjenning på Norsk

Målgruppen

78 000 funksjonshemmede står uten arbeid på tross av at de er arbeidssøkere

NAV mål: flere med funksjonsnedsettelser i arbeid

Personer med omfattende bevegelses- og synsvansker som ikke kan betjene PC med tastatur og mus

I 2009 finner vi 46 550 personer med uføretrygd innen aktuelle diagnosegruppene. (se vår rapport)

Muskel og skjelettlidelser er den hyppigste årsaken til en rekke trygdeytelser. De utgjorde 36 % av sykefraværstilfellene.

Disse utgjorde til sammen 13 927 tapte årsverk i 2010.

Page 5: Prosjekt Talegjenkjenning på Norsk

Målgruppen fortsettelse

• Ut fra dette beregningsgrunnlaget vil 13 927 tapte årsverk utgjøre 9,4 milliarder kroner. Om talegjenkjenning på norsk kunne ha hindret bare 10 % av disse årsverkene, ville besparelsen på ett år utgjøre 941 millioner NOK.

• Lese- og skrivevansker

• Forum for lese og skrivevansker: Vi vet ikke hvor mange, men dersom en av fire som leser dårlig har nytte av talestøtte, utgjør det ca. 220 000 personer. Selv om bare en av 10 har nytte av talestøtte, utgjør det likevel om lag 90 000 personer i Norge.

Kildene til ovennevnte tall finnes i rapporten til forprosjektet ”Norsk talegjenkjenning”. http://sikte.no/tg

Page 6: Prosjekt Talegjenkjenning på Norsk

Målgruppen fortsettelse

Personer som ikke kan bruke tastatur og/eller mus

Dysleksi

Synshemninger

Personer for eksempel fremmedspråklige med manglende skriveferdigheter

Personer som trenger å skrive raskere enn de kan på tastaturet

Forebygging mot belastningsskader

Bruken av datamaskin i bil og andre steder hvor et tastatur er uhensiktsmessig

mm.

Page 7: Prosjekt Talegjenkjenning på Norsk

Nuance

Teknologifirma, programvare

Mer enn 8.000 ansatte på verdensbasis

Produkter

Innovativ

Kjøper opp mange selskaper

Page 8: Prosjekt Talegjenkjenning på Norsk

Nuance

Stor satsning på taleteknologi

Standard programvare

Automatisk telefontjeneste

TV teksting

Interaktiv tale

Page 9: Prosjekt Talegjenkjenning på Norsk

Nuance viser at de kan

Dragon Naturally Speaking (På mange språk)

Dragon Dictate

Dragon Search

Page 10: Prosjekt Talegjenkjenning på Norsk

Språkbanken

Frigivelse av materiale fra NST (konkurs i 2003) :

Datafiler

Dokumentasjon

Page 11: Prosjekt Talegjenkjenning på Norsk

Vi ville

Ikke finne opp hjulet på nytt

Prøve å nyttiggjøre materialet fra NST

Page 12: Prosjekt Talegjenkjenning på Norsk

Språkmaterialet fra NST

Pakket ut og systematisert

Dokumentasjon oversatt til Engelsk

Harddisk med data sendt til Nuance i USA

Page 13: Prosjekt Talegjenkjenning på Norsk

Tilgjengelig materiale for talegjenkjenning fra NST

Norsk/Svensk/Dansk

Leksikalske databaser

Akustiske databaser

Page 14: Prosjekt Talegjenkjenning på Norsk

Materialet fra NST

Opptak ligger som én lydfil pr. manuskriptlinje

Forskjellige formater

Mange forskjellige personer ble benyttet (18-70 år)

Opptak for :

Talegjenkjenning (ASR/diktering)

Diktering

Telefoni

Med «nølelyder»

Page 15: Prosjekt Talegjenkjenning på Norsk

Materialet fra NST

Dokumentasjonen viser at en stor del av innsamlingen av data er basert på direksjon fra L&H, som senere ble kjøpt opp av Nuance

HVA BETYR DETTE ?

Page 16: Prosjekt Talegjenkjenning på Norsk

Nuance konklusjon

Nuance i USA har undersøkt talekorpuser for de 3 skandinaviske språkene (norsk, svensk, dansk). Deres funn og anbefalinger er :

Treningsdata : Audio data er av høy kvalitet, den oppleste talen kan brukes til å trene akustiske modeller for talegjenkjenning. Mengden av data er lik den datamangden som ble brukt for bygging av Dragon Naturally Speaking v10 for spansk, italiensk og nederlandsk.

Testdata : Nuance har ikke de nødvendige data for å teste sine akustiske/språkmodeller. Det må innhentes ekstra korpuser som er aktuelle.

Page 17: Prosjekt Talegjenkjenning på Norsk

Kriterium

Lydkvaliteten : Nuance undersøkte signal-til-støy forhold og fant at talekvaliteten var ganske god og egnet til våre formål.

Fonetisk variasjon : Vårt mål er å bygge akustiske modeller for dikterings oppgaver. Det er viktig at den akustiske variasjonen i dataene er realistisk for dikterings bruk og ikke domineres av ord/uttrykk som er mindre vanlig i diktering. Eksempler på sistnevnte inneholder bokstaver, tall eller gjentakelser av samme ord/setning av flere personer. Basert på tidligere erfaring har vi lært at man trenger å luke ut slike ytringer for å kunne bygge opp realistiske trenings korpuser.

Test utvalg : Et vanlig tema i den medfølgende korpus er bruken av «fonetisk balanserte setninger». Dette er et kunstig krav i bygging av dikterings systemer. Selv om vi kan filtrere vår trenings korpus til å bygge et sett med akustiske modeller, er det mye vanskeligere å bygge et test sett fra et slikt korpus. Derfor konkluderer vi med at det foreliggende materialet ikke er egnet for dette formålet.

Page 18: Prosjekt Talegjenkjenning på Norsk

Veien videreVeien videre

Skaffe pengerSkaffe penger

Page 19: Prosjekt Talegjenkjenning på Norsk

Samfunnsnytten

Kostnaden for å videreutvikle dagens ledende programvare på markedet, er estimert til ca 13 millioner NOK. Dette utgjør omtrent det samme som uføretrygdkostnadene til 50 personer i ett år.

Page 20: Prosjekt Talegjenkjenning på Norsk

Rapport

www.infoshare.no(under nyhets seksjonen).