Upload
heike-gensler
View
107
Download
0
Embed Size (px)
Citation preview
Computerlinguistik und Nachbarwissenschaften:
Sprache in unterschiedlichendisziplinären Kontexten
Proseminar im Sommersemester 2009
Udo Hahn
Jena University Language and Information Engineering (JULIE) Lab, Germany
2
Allgemeine Hinweise
• Seminar: MO, 10-12h SR 103 (FG-27)
– Materialien im Netz– http://www.julielab.de/
„Students“
• Sprechstunde: MO, 14-15h R 004 (FG 30)
• Email: [email protected] • Fachliteratur (fast) nur in Englisch
3
Bitte ...
• ... Handies ausschalten
• ... Kein Picknick
4
Leistungsnachweis• Mündlicher Vortrag
– ca. 1 Stunde– Lektüre (ca. 50-150 Seiten)– Powerpoint-Präsentation– Handout
• Schriftliches Referat– Ca. 20 Seiten (+/- 2 Seiten)– Standardformat für Zeichengröße, Rand etc.– formale Standards beachten
• Deckblatt, Inhaltsverzeichnis, Gliederung, Bibliografie
– Startliteratur wird vorgegeben, eigene Recherchen– „Kontextualisierung“, Eigenleistungen erwünscht– Abgabe: spätestens eine Woche nach dem Ende der
letzten Lehrveranstaltung
5
Ziele des Seminars
• Sprache im Kontext verschiedener Disziplinen
• Eingrenzung (nicht Abgrenzung!) durch unterschiedliche Perspektiven
• Verständnis für den Gegenstandsbereich der Computer-Linguistik
6
Sprache in anderen Diszplinen• Geisteswissenschaften
– Philosophie– Literaturwissenschaft– Geschichte– Politik
• Sozialwissenschaften– Soziologie– Psychologie/Kognitionswissenschaft– Pädagogik
• Naturwissenschaften– Biologie– Medizin– Physik
• Metawissenschaften– Mathematik– Informatik– Informationswissenschaft
• Linguistik
7
Philosophie
• Erkenntnistheorie (Sprachbindung?)• Begriffsbildung, Begriffswandel• Sprachphilosophie
– Objektebene vs. Metaebene: reden über (N)Sprache in einer (N)Sprache
• Wahrheitscharakter von Aussagen: formale Logik
• Rhetorik: persuasive Rede
8
Literaturwissenschaft
• Alltagssprache – Literatursprache• Ästhetik vs. Profanität• Durchbrechung von (Sprach-)Normen
und Erwartungen– Ästhetisierung– Humor, Witz
• Textsorten (Textgenres)– Roman, Novelle, Lyrik– Zeitungstext, Fachtext– Brief, Email, SMS, Blog
9
Geschichte
• Synchrone vs. diachrone Sprach-beschreibung
• Sprachwandel– lexikalisch– syntaktisch
• Sprachgeschichte und Sprach(en)politik
10
Politik• Sprachpolitik
– Nationalsprachen– „Sprachregelungen“ für Feindbilder,
Systemabgrenzungen
• Ideologien und ihr Sprachrepertoire– lexikalisch, phrastisch (Slogans)– Bsp: Sprache des Dritten Reiches
• „Korrekte“ Sprache: definitionsgeleitete Kulturhoheit– Bsp: „Neger“, „Behinderter“, „Student“
• Hochemotionale Lexik– Bsp: „Faschist“, „Nazi“, „Jude“,
„Kommunist“, „Liberal“ [USA]
11
Soziologie• Soziale Codes: (Unter/Ober)Schichtsprachen• Jargons
– Jugendsprache u.a. Partikularsprachen (Jäger,…,Betriebswirte)• Spracheninterferenz
– Latinismen, Anglismen („Denglisch“)• Mediensprache: Wirkung von Sprache auf
Einstellungen und Meinungen– Werbesprache (Bsp: „Geiz ist geil“)– Qualitätspresse (Zeit, FAZ, NYT) vs. Boulevard-Presse (Bild,
Sun) vs. Yellow Press• Sprachkontakt (sog. „Ausländer {D,E,F,…}“)• Hochsprache vs. Dialekt• Regionalsprachen
– Bsp: „Broiler“ vs. „Hähnchen“, „Metzger“ vs. „Fleischer“• Sprache und Gewalt, Beleidigungen• Sexistische, nationalistische/tribalistische, gruppen-
ausgrenzende (Fanclubs, Religionen usw.) Sprache– Bsp: „God‘s own country“, „Ungläubiger“/„Heide“
12
Psychologie/Kognitionswissenschaft
• Sprachentwicklung– Kindersprache – Erwachsenensprache
• Sprachverarbeitung– Assoziationsexperimente
• mentales Lexikon
– Prozessierungsexperimente• Satzkomplexität• Ambiguität• Garden paths
– Gedächtnisformen• short/long term, Diskursgedächtnis
• Verständlichkeitsforschung (readability)
13
Pädagogik
• Sprachen lernen: L2-Erwerb, DaF• Lernmodelle für den Spracherwerb von
Immigranten(kindern)– PISA
• Linguistik und Schulpraxis• Kerngrammatik / Kernlexikon• Sprachstörungen
– Legasthenie
14
Medizin
• Sprachpathologien– Broca-Aphasie– Wernicke Aphasie– Logorrhoe (Vielgeschwätzigkeit –
Depression, Psychosen)
• Gehirnareale für Sprache• Sprache und Alterung
– Demenz
15
Biologie
• Physiologische Basis des Sprechens– Artikulationsapparat
• Innateness-Hypothese: „Sprachgen“?• Tiersprachen vs. menschliche Sprache
– Bienentanz– Imponiergehabe bei Primaten
16
Physik
• Sprachsignal als akustisches Phänomen– Quantisierung– Frequenzspektren– Akustische Eigenschaften– Normsprache
• vs. dialektale Sprache• vs. geschlechtsspezifische Sprache• Muttersprachler vs. Fremdsprachler
17
Mathematik
• Sprachstatistik• Logik
– Aussagen- und Prädikatenlogik– Zeitlogik– Modallogik– Default-Logik– Probabilistische und Fuzzy Logik
• Algebra– Strings, Graphen
• Lernbarkeit von Sprachen– PAC learning, algorithmische Lerntheorie
18
Informatik
• Natürliche vs. formale Sprachen• Typen formaler
Grammatiken/Sprachen/ Automaten• Berechnungskomplexität• NL und Programmiersprachen• Rechnerarchitektur
– Zahlensysteme (Chip-Design) vs. Sprachsysteme
• Datenbanken als Informationsspeicher
19
Informationswissenschaft
• Begriffliche Ordnungssysteme– Thesauri, Klassifikationen– Ontologien
• Informationssuche (Information Retrieval)– in Dokumenten (à la Google)– in Datenbanken
• Sprache und …– … Medialität
• gesprochen vs. geschrieben• NL vs. Tabelle, Grafik, Bild, Film
– … Modalität• Gestik, Mimik, Haptik, …
20
(wo bleibt die) Linguistik
• Strukturalismus• Subsysteme
– Laut/Buchstabe, Wort, Satz, Bedeutung, Pragmatik, Diskurs
• Sprachliche Universalien (für alle NLs)• Kompetenz vs. Performanz• Grammatikalität (Norm) vs. Akzeptabilität
(Verstehbarkeit)– Agrammatismus, Paragrammatismus
• Gesprochene vs. geschriebene Sprache– Lautinventar– Alphabete, Bildsprachen (Comics!)
• One World, one language:– Kunstsprachen und Plansprachen (Esperanto)– Latein, Englisch, …
21
Grundlegende Literatur
• Textbooks on Natural Language Processing– D. Jurafsky & J.A. Martin (2000), Speech and
Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall.
– C.D. Manning & H. Schütze (1999), Foundations of Statistical Natural Language Processing. MIT Press.
• Textbooks– T
• Journal Articles– T
22
Main NLP Publication Series
• Journals– Computational Linguistics– Natural Language Engineering– Language Resources and Evaluation