Upload
lyhuong
View
218
Download
1
Embed Size (px)
Citation preview
14
Aktuell spracheingabe beim ipad iPadWelt 04/2012
iPad, zum Diktat!Nur dem aktuellen iPad hat Apple mit der Diktatfunktion einen Teil der
Siri-Spracherkennung verpasst. Wir zeigen, wie Sie weitere Siri-Funktionen
nachrüsten und Spracherkennung mit allen iPads nutzen
Fans der Serie und Spielfilme zu den Abenteuern des Raumschiffs Enterprise kennen
die Filmszene aus „Star Trek IV: Zurück in die Gegenwart“ von 1986. Bei einer Zeitreise landet die Mannschaft im San Francisco des Jahres 1986. Dort versucht Lt. Commander Montgomery „Scotty“ Scott mithilfe eines Macintosh Plus, einen Werkstoff für eine Transportkiste für Buckelwale zu konstruieren. Der Mann aus dem 23. Jahrhundert hält die Maus an seinen Mund und sagt: „Hallo Computer.“ Natürlich ließ sich der Mac im Film so nicht zur Arbeit bewegen.
Was bei Erscheinen des Spielfilms als pure ScienceFiction abgetan werden konnte, ist längst Realität. Spracherkennung und Sprachsteuerung auf Computern gibt es seit
geraumer Zeit. Dank immer leistungsfähigerer Prozessoren in Smartphones und TabletPCs ist das auch bei mobilen Geräten keine Zukunftsmusik mehr. Mit dem iPhone 4S hat Apple im vergangenen Herbst Siri vorgestellt, seine Version eines intelligenten Sprachassistenten. Siri befindet sich noch immer in der Beta/Ausbauphase, ist aber laut AppleChef Tim Cook eine der wichtigsten Kerntechnologien – hier wird kräftig weiterentwickelt.
Siri light beim neuen iPad
Beim iPhone 4S versteht Siri nicht nur einfache Anweisungen, sondern stellt auch Zusammenhänge zwischen den Anweisungen her. Die meisten der von Apple mitgelieferten Apps lassen sich bereits per Siri am iPhone 4S
inhalt
Dragon Dictation: Diktat für alle 16
Voice Actions: Siri beim iPad 18
Voice Texter: Übersetzer und mehr 18
Voice Answer: Wissensdatenbank 19
Google-Suche: Suchen per Sprache 19
Sayhi: Mulitifunktionsübersetzer 20
© o
lly
15
iPadWelt 04/2012 spracheingabe beim ipad Aktuell
direkt ansprechen. Dabei gibt hierzulande allerdings einige Einschränkungen. An der Unterstützung für Google Maps arbeitet Apple noch, und auch die Datenbank von Wolfram Alpha lässt sich noch nicht auf Deutsch befragen.
Im neuen iPad ist von der genannten Funktionalität zum Leidwesen vieler Anwender lediglich ein Teil implementiert. Apps, die Text eingabe per Displaytastatur erlauben, zeigen eine zusätzliche Mikrofontaste. Das neue iPad bietet Anwendern eine Diktatfunktion. Die ist recht ausgereift, die Erkennungsquote ist hoch. Wie bei anderen Sprecherkennungslösungen kann das iPad allein die komplette Rechenleistung nicht bieten. Beim iPad wird der gesprochene Text aufbereitet und dann als Audiofile an Apples Server gesendet. Dort wird die Audiodatei interpretiert und der erkannte Text zurück an das iPad beziehungsweise die App geschickt. Dabei ist eine InternetVerbindung Pflicht. Außerdem sollten sich Nutzer bewusst sein, dass Daten „in fremde Hände“ gelangen.
Nicht nur für Apples Implementation der Spracherkennung gilt, dass die Lösungen nur die Laute eines einzelnen „Auftraggebers“ akzeptieren. Wer etwa denkt, eine Spracherkennung würde sich eigenen, um eine Konferenz mit mehrerem Personen mitzuschneiden, liegt falsch. Beim Versuch gelangen nur zusammenhanglose Bruchstücke von Sätzen auf das Display des iPad.
Des Weiteren hilft es, die Sprachbefehle für Interpunktion und Formatierung zu kennen. Ansonsten muss der erkannte Text später erheblich nachbearbeitet werden. Ab Seite 88 finden Sie ein TippSpecial mit den wichtigsten Befehlen. Die meisten Befehle gelten nicht nur für Apples Siribasierte Lösungen, sondern zum Beispiel auch für die SpracherkennungsApps für das iPad, die auf der Technologie von Nuance basieren.
Siri-Funktionen nachrüsten
Wer neben der reinen Diktatfunktion auch mit Apps kommunizieren will, um eine Nachricht oder Mail zu versenden, muss zu Apps anderer Anbieter greifen. Diese erweitern nicht nur die Funktionalität des neuen iPad, in der Regel sind sie der einzige Weg, Spracherkennung und befehle auch auf die beiden älteren iPadModelle zu bekommen. So kann etwa Voice Actions (2,99 Euro), wie von Siri am iPhone 4S bekannt, eine Nachricht senden, eine Mail erzeugen und versenden, eine Erinnerung anlegen, den Wecker stellen und mehr.
Voice Answer (2,99 Euro) ermöglicht mit allen iPadModellen die Abfrage der Wissensdatenbank von Wolfram Alpha (www.wolframalpha.com) – allerdings in englischer Sprache. Brandneu und ebenfalls geeignet für
sämtliche iPadModelle ist Voice Texter (Einführungspreis 0,79 Euro). Die App verspricht unter anderem Spracherkennung in mehr als 20 Sprachen, den direkten Zugriff auf die App Nachrichten sowie die Suche über Google und andere Suchmaschinen.
Wer beim UriPad oder dem Modell der 2. Generation lediglich eine sehr gute Diktierfunktion haben möchte, greift zur kostenlosen App Dragon Dictation. Die auf NuanceTechnologie basierende Lösung bietet eine ähnlich gute Spracherkennungsleistung wie Siri, aber eben auch auf den von Siri nicht unterstützten älteren iPadModellen.
Nur zum Teil in die Rubrik passt eine neue App namens Sayhi (0,79 Euro). Der Universalübersetzer akzeptiert Text oder Spracheingabe und bringt die Übersetzung aufs Display, dazu wird sie in der Sprache der Wahl auch akustisch ausgegeben. Die App ist einfach klasse, unterstützt haufenweise Sprachen, da
runter sogar Japanisch und Russisch. Sayhi ist somit der ideale Reisebegleiter für den Urlaub und Businesstrips.
Spracherkennung nutzen
Wer die Diktierfunktion beim neuen iPad als nützlich erachtet, sollte sie auch häufiger einsetzen, sie ist lernfähig und stellt sich auf Ihre Sprachgewohnheiten ein. Wie auch bei den anderen Lösungen sind die Ergebnisse gut, solange kein starker Dialekt gesprochen wird. Die meisten anderen Lösungen, die wir in diesem Artikel ausführlich vorstellen, verfügen nicht über eine Lernfunktion. Sie zeigen aber, wo Apple noch nachbessern könnte. Kurz nach Erscheinen dieser Ausgabe wird Apple auf der Entwicklerkonferenz sicher zu kommenden Entwicklungen bei Siri Stellung beziehen. Besitzer eines älteren iPad werden aber weiter auf AppLösungen setzen müssen, Siri wird nicht unterstützt. vr
beim neuen ipad (3. generation) ist siri implementiert, jedoch nur als diktierfunktion. diese wird aber in apps von apple und den meisten drittanbietern, die Texteingabe per displaytastatur erlauben, direkt unterstützt. Über die mikrofontaste starten sie die spracheingabe. siri ist lernfähig und bietet außerdem Textkorrektur.
beim iphone 4s bietet siri nicht nur eine diktierfunktion, sondern den direkten Zugriff auf einige appleapps. man kann etwa das Wetter abfragen, Termine erstellen oder mails schreiben.
16
Aktuell spracheingabe beim ipad iPadWelt 04/2012
2. Text diktieren
Im Gegensatz zu Apples Siri erfolgt das Diktat in der App Dragon Dictation. Wie auch bei Apples Lösung und allen anderen erreichen Sie eine bessere Spracherkennung bei Verwendung eines Headsets. Nachdem
der rote Aufnahmeknopf betätigt ist, beginnt die Aufnahme, ein weiteres Antippen des Displays beendet sie. Der Text lässt sich nach der Aufnahme per Tastatur bearbeiten. Die App sichert Aufnahmen für die spätere Nutzung.
3. Text versenden oder kopieren
Liegt der Text in der gewünschten Form vor, lässt er sich direkt in die App Mail übertragen oder auf Facebook beziehungsweise Twitter veröffentlichen. Dazu tippen Sie das Symbol oben rechts im AppFenster an. Wollen Sie
den Text in einer anderen App – etwa einer Textverarbeitung – nutzen, wählen Sie die Option „Kopieren“, wechseln in die ZielApp und wählen „Einsetzen“. Dragon Dictation benötigt wie Siri InternetVerbindung.
Diktatfunktion für alte iPads1
1. dragon dictation – grundeinstellungen und datenschutz
Dragon Dictation (kostenlos) ist die Diktierlösung der Wahl für Besitzer eines iPad der ersten oder zweiten Generation. Die App basiert auf Dragon Naturally Speaking (Spracherkennung für
PCs). Neben den iPadModellen werden alle iPhones und der iPod Touch der dritten und vierten Generation unterstützt. Beim ersten Start erfragt die App Ihre Region (Bild 1). Nach der Auswahl
(Europa) wird gefragt, ob die App die Namen Ihrer Kontakte (und nur die) an den Server von Dragon übermitteln darf. Damit wird die Spracherkennung erleichtert, falls einer der Namen aus Ihren Kon
takten stammt. Dragon verspricht, die Daten nicht weiterzuverwenden. Wem das nicht geheuer ist, klickt hier „Nein“. Falsch erkannte Namen lassen sich nach der Aufnahme manuell ändern.
Lesen Sie weiter auf Seite 18
auch wenn sie der Übermittlung ihrer Kontakte nicht zustimmen, funktioniert dragon dictation ohne probleme.2beim ersten start der app müssen sie ihre region
preisgeben, in unserem Fall „europa“.1
sie können den erfassten Text direkt an mail übergeben, bei Facebook oder Twitter posten oder kopieren.2der erfasste und erkannte Text lässt sich nacharbeiten,
die app legt Texte unter „notizen“ ab.1
18
Aktuell spracheingabe beim ipad iPadWelt 04/2012
Mit Voice Actions (2,99 Euro) hat Hersteller Pannous eine auf NuanceSpracherkennung basierte Lösung im Angebot, die bei allen iPadModellen sonst nur vom iPhone 4S zur Verfügung gestellte SiriFunktionen bieten soll. So lässt sich per Spracheingabe eine EMail direkt erstellen, eine GoogleSuche in Safari starten oder ein Termin beziehungsweise eine Erinnerung anlegen. Nach der Eingabe des Sprachbefehls öffnet Voice Actions die zuständige App und überträgt den „Auftrag“. Während etwa die GoogleSuche oder MailErstellung gut klappte, haben wir Termine nicht eintragen können – obwohl die freundliche Stimme das erledigt haben wollte. Prima funktioniert hin gegen die Frage nach Orten, hier wird Karten geöffnet.
Siri beim iPad nachrüsten2
Voice actions – direkter Zugriff auf apps
Übersetzer und mehr3
Voice Texter – sprachtalent mit Zugriff auf viele apps
Ende Mai vorgestellt und zum Einführungspreis von 0,79 Euro angeboten wird die App Voice Texter, die sich in erster Linie als Dolmetscher versteht. Auch Voice Texter funktioniert auf allen
iPadModellen. Laut Hersteller versteht sich Voice Texter auf über 20 Sprachen. Der Benutzer wählt die Eingabesprache sowie die für die Ausgabe und spricht die zu übersetzenden Texte.
Klasse gelöst ist der Zugriff auf diverse Apps und Funktionen. Nach der Texterfassung legen Sie über „Aktion starten (Bild 1) fest, für welche App der Text gedacht ist. Neben diversen Stan
dardApps unterstützt Voice Texter auch Dienste wie Facebook, sucht in EbayAuktionen, Youtube und mehr. Voice Texter ist prima für alle iPadNutzer und basiert auch auf NuanceTechnologie.
Voice Texter öffnet einige apps in einem inlineFenster, im bild die app nachrichten, und setzt den Text automatisch ein.2erfasste sprachnachrichten lassen sich einfach an
viele apps oder internetdienste übergeben.1
Ähnlich wie bei siri am iphone 4s bekommt der benutzer Feedback per Text und stimme.2Über die einstellung ist unter anderem die
sprache für Voice actions festzulegen.1
19
iPadWelt 04/2012 spracheingabe beim ipad Aktuell
Wolfram Alpha (www.wolframalpha.com) ist eine auf der Software Mathematica basierende Wissensdatenbank zum Auffinden und Darstellen von Informationen von Wolfram Research. Wolfram Alpha ist eine semantische Suchmaschine. Die Ergebnisse reichen von einer simplen Summenbildung bis zu Eigenwerten, über Differenzialgleichungen bis zu Umlaufbahnen von Planeten. Nur Nutzer des iPhone 4S, die als SiriSprache Englisch eingestellt haben, können derartige Fragen an die Datenbank stellen. In die Lücke springt die App Voice Answer (2,99 Euro). Wer der englischen Sprache mächtig ist, kann seine Fragen per Sprachbefehl stellen, bekommt die Antwort angezeigt oder sogar ganz vorgelesen.
Wolfram Alpha nutzen4
Voice answer – Zugriff auf die Wissensdatenbank
Benutzer mit GoogleAccount sollten unbedingt die kostenlose App GoogleSuche laden. Anders als der Name zunächst vermuten lässt, bietet die App vor allem einen direkten Zugriff auf die zahlreichen GoogleDienste – eine einmalige Anmeldung mit den GoogleAccountDaten reicht aus. Anschließend haben Sie Zugriff auf Google Docs (Ta bellen & Texte), Googlemail, Kalender, PicasaFotos und mehr. Natürlich ist auch die Suche in Googles Datenbanken über die App möglich. Hier und nur für die Suchfunktion hat Google ein kleines MikrofonIcon integriert, das die Suche über die Spracheingabe erlaubt. Die Spracherkennung funktioniert gut, der Begriff wird an die Suche übergeben, die Resultate werden angezeigt (Bild 2).
Suchen per Sprachbefehl5
googlesuche – apps und spracherkennung
… wie banale. das funktioniert auch bei Fragen zu lokalen Themen – allerdings in englisch.2Voice answer beantwortet dank Wolfram
alpha komplexe Fragen ebenso …1
die suche lässt sich per sprachbefehl starten, ergebnisse werden im googleFenster angezeigt.2die kostenlose app bietet Zugriff auf ver
schiedene googleapps und die suchfunktion.1
20
Aktuell spracheingabe beim ipad iPadWelt 04/2012
Mit der App Sayhi (Einführungspreis 0,79 Euro) gibt es eine Übersetzungs und Dolmetschsoftware für sämtliche iPad Modelle, die enorm Furore gemacht hat. Sie bietet Spracherkennung für 24 Sprachen und Dialekte, darunter neben den wichtigen europäischen auch Mandarin, Kantonesisch, Russisch oder Koreanisch. Bei den genannten wird als Eingabe Sprache akzeptiert – alternativ Text per Tastatur. Die Übersetzung wird gesprochen und als Text angezeigt. Bei neun weiteren Sprachen beschränkt sich die Übersetzung auf die Sprachausgabe. Im ersten Schritt legen Sie nach dem Start der App die Sprachen für die Ein und Ausgabe per Klappmenü fest. Das Lautsprechersymbol zeigt an, falls nur die Sprachausgabe verfügbar ist.
Allround-Übersetzer6
1. sayhi – Übersetzer mit sprachein und ausgabe
Nach der Auswahl des Sprachenpaares können Sie loslegen. Tippen Sie unten links „Deutsch“ an, und sprechen Sie die Sätze, die es zu übersetzen gilt. Auch Sayhi nutzt einen Server des Anbieters, eine InternetVerbindung muss bestehen. Alternativ zur Spracheingabe können Sie die Displaytastatur des iPad zu Hilfe nehmen (Bild 1). Sayhi stellt bei den 24 genannten Sprachen und Dialekten Ihre Spracheingabe samt Übersetzung als Text am Display dar und spricht außerdem die Übersetzung. Ihr Gegenüber kann den Button seiner Sprache ebenfalls antippen und einen Text sprechen. Die Übersetzung wird farblich hinterlegt angezeigt (Bild 2). Wir konnten Englisch, Spanisch, Italienisch und Russisch testen und sind begeistert.
2. dolmetscher in beide richtungen nutzen
neben der sprache wählen sie die stimme (männlich/weiblich) und sprechgeschwindigkeit.2Wählen sie zunächst über „settings“ die
eingabe und ausgabesprache.1
der Übersetzer funktioniert in beide richtungen, sprachausgabe und Text inklusive.2alternativ zur spracheingabe lässt sich der
zu übersetzende Text eintippen.1