View
227
Download
8
Category
Preview:
Citation preview
University of Bielefeld
Spezielle Themen der KI
NLPNatural Language Processing
Sprachverstehen
University of Bielefeld
2
NLP - Verarbeitungsstufen des Sprachverstehen
University of Bielefeld
3
Phonologie und Phonetik
Phonologie – Lautlehre oder Sprachgebilde-Lautlehre untersucht • Systeme von Phonemen als kleinsten bedeutungsunterscheidenden Elementen
von Sprachen• Laute als Einheiten im System einer Sprache• Phoneminventar durch benutzung von Minimalpaaren,
– Wörter, die sich nur in einem Laut unterscheiden. Dieser Laut hat dann Phonemstatus.– Beispiel: Kutter und Futter -> /k/ und /f/
• Notierung der Phoneme durch Internationales Fonetisches Alphabet in /x/.
Phonetik - Sprechakt-Lautlehre • Lehre der von Menschen hervorgebrachten Lauten, den Phonen.• Detaillierten Beschreibung von Lauten unabhängig von Systemüberlegungen.• Kleinste Phonologische Repräsentation einer Äußerung:
– Sequenz von Einheiten, gekennzeichnet durch Eigenschaften (Merkmale).– Eigenschaften können entweder vorhanden (+) oder nicht vorhanden (-) sein. – Phonem ist ein Bündel von Merkmalen. (Chomsky und Halle)
• Notierung der Phone durch Internationales Fonetisches Alphabet.
University of Bielefeld
4
Phonologie und Phonetik
Beispiele (Wikipedia):
• ch im Deutschen wird häufig mit Phonem /x/ notiert, Artikulation– im Bereich des harten Gaumens (palatal): ich [ɪç] – hinten im Mund: (ach [aχ] ). – Unterschied ist nicht bedeutungsunterscheidend: auch
• Keine Bedeutungsänderung für ich, wenn statt des Ich-Lautes in ich ein Ach-Laut gesprochen wird, wie es manche Nichtmuttersprachler tun.
– Der Ich-Laut und der Ach-Laut sind so genannte Allophone (fonetisch realisierte Varianten eines einzigen Phonems).
– Vor Variantenidentifikation zwei verschiedene Phone: • [ç] und [χ].
• s-Laute im Deutschen – Bedeutungsunterscheidend ist Unterschied zwischen stimmhaftem und
stimmlosem s. – Zwei Phoneme (/s/ und /z/) unterschiedlicher Schreibweise: (ß oder ss und s):
• reißen und reisen unterscheiden sich lediglich in der Stimmhaftigkeit des s-Lautes
• /s/ versus /z/.
University of Bielefeld
5
Morphologie und LexikonMorphologie – Lehre von den Wortformen• Erforschung der kleinsten bedeutungstragenden Elemente einer Sprache,
der Morpheme• Klassifiziert Wörter nach
– Wortarten und Wortformen (Verb, Substantiv, Adjektiv, Artikel, Pronomen...) und
– der Struktur der Wortformen (Fall, Geschlecht bei Nomen, Person, Numerus, Tempus…).
• Wortbildung (Gesetzmäßigkeiten zur Bildung neuer komplexer Wörter) und • Flexion (Änderung der Gestalt eines Wortes zum Ausdruck seiner grammatikalischen
Funktion innerhalb eines Satzgefüges)
Aufgaben der Morphologie:• Zurückführung von Worten auf Grundform und Kategorisierung• Automatische Wortformerkennung neben dem Lexikon Morphologische Phänomene lassen sich formal mit regulären Ausdrücken
beschreiben.
University of Bielefeld
6
Morphologie und Lexikon
Lexikon – Auflistung der bekannten Wörter• möglichst vollständiger Wortschatz einer Sprache• Wortformen und Wortart• Wörterbuch - Bedeutung der Worte und Beziehungen untereinander
Modelle für Lexika• Liste aller möglichen Worte• Kombiniert mit der morphologischen Analyse (Regeln)• automatische Systeme zu Nutzung und Auswertung bestehender Lexika
University of Bielefeld
7
Morphologie des Deutschen
• Flexion: Oberbegriff für Deklination, Konjugation und Komparation
• nichtflektierbare Wortarten:Beispiele:– Adverbien (z.B. hier), – Konjunktionen (z.B. dass), – Präpositionen (z.B. vor), – Partikel (z.B. denn)
Flexion
Deklination Konjugation Komparation
NomenArtikel
AdverbienPronomen
Verben Adjektive
Worarten Merkmalsklassen
Nomen, Artikel, Pronomen Kasus, Numerus, Genus
Adjektive Kasus, Numerus, Genus,
Komparation
Verben Person, Numerus, Tempus, Modus, Genus verbi
Merkmalsklasse Merkmale
Numerus Singular, Plural
Genus Maskulinum, Femininum, Neutrum
Casus Nominativ, Genitiv, Dativ, Akkusativ
Person 1. Person, 2. Person, 3. Person
Tempus Präsens, Präteritum, Perfekt, Plusquamperfekt, Futur I, Futur II
Modus Indikativ, Imperativ, Konjunktiv
Genus verbi Aktiv, Passiv
Komparation Positiv, Komparativ, Superlativ
University of Bielefeld
8
NLP - Verarbeitungsstufen
• Spracherkennung: – Analyse der unbearbeiteten Sprachsignale.– Bestimmung der gesprochenen Worte und ihrer Abfolge.
• Syntaktische Analyse: – Die Abfolge der Worte wird mit Grammatikwissen analysiert.– Die Satzstruktur wird bestimmt.
• Semantische Analyse: – Bedeutungsdarstellung durch Strukturinformation und
Wortbedeutung.• Pragmatische Analyse:
– Kontextinformation vervollständigt die Bedeutungsdarstellung aus der semantischen Analyse.
University of Bielefeld
NLP - Verarbeitungsstufen
9
SyntaktischeAnalyse
SemantischeAnalyse
Parse Tree
Symbolische Repräsentation
University of Bielefeld
10
NLP - Verarbeitungsstufen
University of Bielefeld
11
NLP - Verarbeitungsstufen
University of Bielefeld
12
Verarbeitung natürlicher Sprache
Spracherkennung• Aufteilung des Signals in verschiedene Frequenzen• Messung der Energie für diese Frequenzen –> Frequenzspektrogramm (FS)• Zuordnung von elementaren Lauten – Phonen- zu Mustern im FS• Suche dieser Muster im Signal
– Evt. Geschwindigkeitsanpassung durch dynamic time warping (DTW)
• Statistische Modellierung:– Wahrscheinlichkeit der Phone– Übergangswahrscheinlichkeiten zwischen den Phonen– Häufigkeit der Worte– Folge der Worte– …
• Benutzung von HMMs zur statistischen Modellierung
University of Bielefeld
13
Syntaktische Analyse
• Satzbildung durch Wortkomposition• Ausgangspunkt für Bedeutungsanalyse
(1) Der Hund fraß den Knochen(2) Der Knochen wurde vom Hund gefressen
• Struktur aus Syntaxregeln hilft der Bedeutungsfindung im Gegensatz zu:– Es ist immer das 2. Substantiv, das gefressen wird.
• Zerlegung der Bedeutungsfindung auf Basis von syntaktischen Zerlegungen (etwa von Phrasen)(3) sp[Der Hase mit den langen Ohren] erfreute sich an sp[einem großen
grünen Salatblatt]• Bedeutungsfindung durch Komposition der Teilbedeutungen• Komposition abhängig von gewählter Clusterung
(4) Tim sah Maria mit dem Fernglas(5) Ich sah den Kölner Dom auf dem Flug nach Frankfurt
University of Bielefeld
Syntaktische Analyse:Parse-Trees (Strukturbäume)
14
(gehört zumWissen überdie Sprache)
University of Bielefeld
Syntaktische Analyse: Grammatiken
15
Vgl.: GrammatikG = ( Φ, Σ, R, S ) aus der VorlesungTheor. Informatik
University of Bielefeld
Syntaktische Analyse: Grammatik und ein Parse-Tree
16
s-maj –> s final-puncs –> np vpvp –> verb npnp –> det nounnp –> proper-noundet –> thenoun –> boynoun –> frogverb –> ateverb –> lovesproper-noun –> Jackproper-noun –> Bill...final-punc –> .
s-maj
s final-punc
np vp
proper-noun
Bill
verb np
loves
det noun
the frog .
University of Bielefeld
Subjekt-Verb-Kongruenz
17
3s
3p
Singular PluralAbkürzg. Beispie
lAbkürzg. Beispie
lerste Personzweite Persondritte Person
I am hungry. We are hungry.1s 1p
You are hungry. You are hungry.2s 2p
She is hungry. They are hungry.3s 3p
University of Bielefeld
Lexikon-Einträge für den Parser
• Aufbau eines Lexikons z.B. mit einer Funktion „dictionary“
• Jeder Lexikon-Eintrag hat eine der folgenden Formen:
(word part-of-speech –feature-assignments– )
(word root-form part-of-speech –feature-assignments– )
18
(dictionary (a det) (be auxverb (tense = tenseless)) (is be auxverb (tense = present) (v-number = 3s)) (block noun) (block verb) (can modal (v-number =1s 2s 3s 1p 2p 3p)) (do modal) (did do modal (tense = past) (v-number = 1s 2s 3s 1p 2p 3p)) (fish noun (n-number = 3s 3p)) (frog noun)
optional
Recommended