46
Dr. Tina John Dokumentation gesprochener Sprache Töne (Mi) Transkription

Töne (Mi) Transkription · Dr. Tina John Ohne Larynx ohne Lunge • öffne die Äußerung …/Nama/VAC_consonants.wav • Worin unterscheiden sich die Konsonanten am Wortanfang nach

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Dr. Tina John

Dokumentation gesprochener Sprache

Töne (Mi) Transkription

Dr. Tina John

Ohne Larynx ohne Lunge

SoSe 20152

Dr. Tina John

Hausaufgabe Gruppe Di 12-14 Uhr (NACHNAME_VORNAME_HA07.pdf)

• Erweitere deine kleine wissenschaftliche Abhandlung mit Abbildungen zum Thema: „Obstruentische Verschlusslaute“ (HA05) um „Verschlusslaute mit rein oralem Luftstrom“ • Beschreibe unter der Verwendung von Bildern die akustischen Eigenschaften

und beschreibe die artikulatorischen Eigenschaften • von Klicks

• max 1 Seiten

• UND

• Schreibe eine kleine wissenschaftliche Abhandlung mit Abbildungen zum Thema: „Töne“

• Beschreibe unter der Verwendung von Bildern die akustischen Korrelate zu Tonhöhe und die artikulatorischen Eigenschaften von Tönen

• Erläutere, warum und wann die Etikettierung von Tönen unbedingt notwendig ist

• max 2 Seiten

SoSe 20153

Dr. Tina John

Hausaufgabe Gruppe Mi 12-14 Uhr (NACHNAME_VORNAME_HA07.pdf)

• Erweitere deine kleine wissenschaftliche Abhandlung mit Abbildungen zum Thema: „Obstruentische Verschlusslaute“ (HA05) um „Verschlusslaute mit rein oralem Luftstrom“ • Beschreibe unter der Verwendung von Bildern die

akustischen Eigenschaften und beschreibe die artikulatorischen Eigenschaften • von Klicks

• max 1 Seiten

SoSe 20154

Dr. Tina John

Ohne Larynx ohne Lunge

• öffne die Äußerung …/Nama/VAC_consonants.wav • Worin unterscheiden sich die Konsonanten am

Wortanfang nach dem ersten Phon an den verschiedenen

Artikulationsstellen SAMPA IPA: • dental |\ | • palato-alveolar =\ ǂ • (post)alveolar !\ ! • alveolar lateral |\|\ ǁ

SoSe 20155

Dr. Tina John

Ohne Larynx ohne Lunge

SoSe 20156

Dr. Tina John

Ohne Larynx ohne Lunge

• (Post)alveolar und palatoalveolar: starke Explosion mit nachfolgendem Intensitätsverlust im oberen Frequenzbereich. • (Post)alveolar: Schwerpunkt im unteren

Frequenzbereich • Palatoalveolar: Schwerpunkt im höheren

Frequenzbereich • Dental und alveolar lateral: starke Friktion mit

nachfolgendem Intensitätsverlust im oberen Frequenzbereich. • Dental: schwächer • Alveolar lateral: mehr Energie im oberen

Frequenzbereich

SoSe 20157

Dr. Tina John

Töne

SoSe 20158

Dr. Tina JohnSoSe 20159

Tonsprachen

• Tonhöhe oder Tonhöhenverlauf in Silben oder Wörtern distinktiv für dessen Bedeutung – Tonhöhe: z.B. hoch, mittel oder tief – Tonhöhenverlauf: z.B. steigend, eben oder fallend

• abhängig von der Sprache – Tonhöhe oder Tonhöhenverläufe – oder beides

• keine Absolutwerte sondern relativ zum Stimmbereich des Sprechers – vor allem bei Tonhöhe-Markierung

Dr. Tina JohnSoSe 201510

Töne

IPA SAMPA IPA SAMPA

_T

_H

_M

_L

_B

!

^

_R

_F

_H_T

_B_L

_R_F

<R>

<F>

Dr. Tina John

Korrelate zu Ton

SoSe 201511

Dr. Tina John

Korrelate zu Ton

• Stimmlippenschwingung • F0 – Oszillogramm • Periodendauer

– Je höher der Ton, umso kürzer die Dauer

– Sonagramm • Abstand der vertikalen Strukturen (Glottisschläge)

– Je höher der Ton, umso kleiner der Abstand

SoSe 201512

Dr. Tina JohnSoSe 201513

Dr. Tina JohnSoSe 201514

Übung

• Etikettiere die Wörter mit ihren Tönen • auf einer Intervallebene Wort mit dem Etikett ’siSAMPATON‘

• in …/Cantonese/Tones/… • in der Reihenfolge zusammengebunden:

• silk, to-try, matter, time, history, city

Dr. Tina John

Hausaufgabe Gruppe Mi 12-14 Uhr (NACHNAME_VORNAME_HA07.pdf)

• Erweitere deine kleine wissenschaftliche Abhandlung mit Abbildungen zum Thema: „Obstruentische Verschlusslaute“ (HA05) um „Verschlusslaute mit rein oralem Luftstrom“ • Beschreibe unter der Verwendung von Bildern die

akustischen Eigenschaften und beschreibe die artikulatorischen Eigenschaften • von Klicks

• max 1 Seiten

SoSe 201515

Dr. Tina JohnSoSe 201516

Kantonesische Töne

Dr. Tina John17

Transkription

Dr. Tina John18

Transkription

• „Diskretisierung der realen Welt“ – orthographische Transkription – phonemische Transkription – phonetische Transkription – prosodische Transkription

– paralinguistische und nicht-linguistische Phänomene

• bildet das Gesprochene so gut wie möglich ab

Dr. Tina JohnSoSe 201519

Orthographische Transkription

• Verwendung von nicht-lateinischen Buchstaben problematisch (Tastatureingabe)

• Weiterverarbeitung der Transkription in anderen Programmen bleibt oft unberücksichtigt – Funktioniert dann nicht

• Lösung: Transliteration – Verschriftung des Gesprochenen unter Verwendung

allgemein vorhandener Zeichen – Übersetzung einer Buchstabenschrift in eine andere – Übersetzungsregeln müssen festgelegt sein

Dr. Tina John

Transliterationsbeispiel - Hindi

SoSe 201520

Dr. Tina John

Transliterationsbeispiel - Devanagari

• Unicode: – International Alphabet of Sanskrit

Transliteration (IAST)

• Bekannteste Standard zur Romanisierung von Sanskrit

– ISO 15919

• Konvention für alle Südasiatischen Sprachen

• ASCII – Harvard-Kyoto

• Keine Diakritika

• Großschreibung

– ITRANS scheme

• Erweiterung Havard-Kyoto

– Velthuis

• Groß- und Kleinschreibungsproblem behoben

SoSe 201521

Dr. Tina John

Hindi in Devanagari

22

Dr. Tina John

Romanisierung Japanisch

• Katakana – Latein • Phonetisch -

silbenbasiert – Keine 1:1

Rücktransformation möglich

– Keine Unterscheidung zwischen „ice cream“ und „I scream“

SoSe 201523

K. Knight and J. Graehl. Machine transliteration. In Proceedings of the 35th Annual Meeting of the Asso- ciation for Computational Linguistics and Eighth Conference of the European Chapter of the Association for Computational Linguistics, ACL ’98, pages 128–135, Stroudsburg, PA, USA, 1997. Association for Computational Linguistics.

ア a イ i ス su ク ku リ ri ム mu ー [ː]

Dr. Tina John

Thai - Romanisierung

SoSe 201524

T. Charoenporn, A. Chotimongkol, and V. Sornlertlamvanich. Automatic romanization for thai. Proc. of the Oriental COCOSDA, 1999.

Dr. Tina John

Töne im Thai

SoSe 201525

Dr. Tina John

Thai - Romanisierung

• Buchstabe für Buchstabe – „khuen“ kh – ue – n

SoSe 201526

Phonetik initial final

Dr. Tina John

Thai

• Buchstabe für Buchstabe – Funktioniert nicht bei Schreibung der

Schriftzeichen: verschieden von der Leserichtung – „eta“ aber [tau]

SoSe 201527

Dr. Tina John

Thai

• Alternative: phonetische Transkription -> Tabelle mit Aussprachevarianten

– [kʰɯːn]

– [tau]

SoSe 201528

Dr. Tina John

Thai

• Alternative: phonetische Transkription • Probleme:

– Phonetische Kenntnisse notwendig • Gutes Gehör

– Aussprache der Buchstaben positionsabhängig • Automatische Generierung benötigt vorangehende

Silbifizierung – Silbengrenzen recht variabel

– IPA nicht rechnergestützt verarbeitbar

SoSe 201529

Dr. Tina John

Thai

• Alternative: romanisierte phonetische Transkription – [khuen]

– [tao]

SoSe 201530

Dr. Tina John 21

Phonetische Transkription

• IPA

31

Dr. Tina John 22

Phonetische Transkription: IPA

• Vorteile:

• Nachteile:

32

Dr. Tina John 23

Phonetische Transkription: IPA

• Vorteile: – universal und etabliert – verwendet Buchstaben und Zeichen aus

verschiedenen Sprachen • Nachteile: – zwar heutzutage auch mit Hilfe eines Rechners in

Dokumente einbindbar, braucht dafür aber Sonderprogramme

– Zeichen sind nicht direkt über die Tastatur einzugeben

– bis vor nicht all zu lange Zeit nicht eindeutig kodiert im Rechner (unterschiedliche Zeichensätze)

33

Dr. Tina John 24

Phonetische Transkription: IPA

• Lösung: – SAMPA

34

Dr. Tina John 25

Phonetische Transkription: SAMPA

• entwickelt im Rahmen vom europäischen Projekt 'Speech Assessment Methods' (1987 - 1989)

• Ziel: maschinenlesbare Kodierung phonetischer Annotation – verwendet ausschließlich 7-bit-ASCII Zeichen – versucht die Zeichen so auszuwählen, dass sie nahe am IPA

sind • seit 1995 erweitert auf X-SAMPA für vollständige

Kodierung vom IPA

• Nachteile: – nicht voll etabliert (X-SAMPA noch immer Vorschlag) – u.U. sind Abweichungen erwünscht / notwendig

35

Dr. Tina John

Phonetische Transkription: SAMPA

• „The IPA phonetic symbols that are also lower-case alphabet symbols naturally remain the same in SAMPA. “ (Wells 1997:1)

• Viele Symbole vorgeschlagen:

36

Wells, J.C. (1997). 'SAMPA computer readable phonetic alphabet'. In Gibbon, D., Moore, R. and Winski, R. (eds.), 1997. Handbook of Standards and Resources for Spoken Language Systems. Berlin and New York: Mouton de Gruyter. Part IV, section B.

Dr. Tina John

Phonetische Transkription: SAMPA

• „This still leaves out many phonetic symbols we may wish to transmit.“ (Wells 1997:2) – Ergänzung verschiedener Zeichen unter

Berücksichtigung traditioneller (ungenormter) Verwendung • [Xʲ] als X‘ übliche Verwendung zur Beschreibung im

Russischen, Irischen ... – Würde aber zu Doppelbelegung von Zeichen führen:

• @‘ = [ɚ] • t‘ = [ʈ]

• Βisher kein universelles SAMPA • Sprachspezifische Varianten existieren

37

Dr. Tina John

SAMPA - Russisch

38

Dr. Tina John

SAMPA – Korean - Chinesisch

39

J. Kim. Computer codes for korean sounds: K-sampa. Journal of Acoustical Society of Korea, 20:1–14, 2001.

C. Tseng and F. Chou. Machine readable phonetic transcription system for chinese dialects spoken in taiwan. JOURNAL-ACOUSTICAL SOCIETY OF JAPAN-ENGLISH EDITION-, 20:215–224, 1999.

Dr. Tina John

Transliteration auf Phon(em)ebene???

• Warum nicht gleich Transliteration nehmen???

40

Dr. Tina John

Transliteration auf Phon(em)ebene???

• Warum nicht gleich Transliteration nehmen???

• Hindi:

41

Dr. Tina John

Transliteration auf Phon(em)ebene???

• Warum nicht gleich Transliteration nehmen??? • Hindi:

• Deutsch: – „Das Haus“

• [das haʊs] – „Weg“

• [veːkʰ] – „weg“

• [vɛkʰ]

42

Dr. Tina John

Transliteration auf Phon(em)ebene???

• Warum nicht gleich Transliteration nehmen??? • Hindi:

• Deutsch: – „Das Haus“

• [das haʊs] – „Weg“

• [veːkʰ] – „weg“

• [vɛkʰ]

43

Dr. des. Tina JohnSoSe 201544

Dr. Tina JohnSoSe 201545

Transliteration und Transkription

• Segmentiere und Etikettiere im Signal (1. Satz)

/data/teach/Modul_D2/Hindi/Narrative/narrative1.wav

– die Wörter auf einer Intervallebene „Wort“

• Verwende hierfür eine Transliteration (TransliterationHindi.pdf)

– die Phone auf einer Intervallebene „Phonetik“

• verwende SAMPA Symbole

• Orientiere dich an der XSAMPA.pdf (XSAMPA.pdf)

– pdfs in /data/teach/Modul_D2

• zu öffnen mit >acroread DATEINAME

Dr. Tina JohnSoSe 201546

Hausaufgabe (NACHNAME_VORNAME_HA08.pdf)

• Schreibe eine kleine wissenschaftliche Erörterung mit Abbildungen zum Thema: „Rechnergestützte Orthographische und phonetische Transkription“ • Welche Annotationsebenen werden verwendet? • Was wird auf den Ebenen annontiert? • Welche Zeichen verwendet man jeweils? • Was macht das ganze rechnergestützt weiterverarbeitbar?

• Segmentiere und Etikettiere dazu als Bsp. im Signal (1. Satz)

…/Hindi/Narrative/narrative1.wav

– die Phone auf einer Intervallebene „Phonetik“

• verwende SAMPA Symbole (XSAMPA.pdf)

– die Wörter auf einer Intervallebene „Wort“

• verwende hierfür eine Transliteration (TransliterationHindi.pdf)