42
1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter LS Prof.Kuhlen ([email protected]) 2 Überblick Einleitung:Neue Konzepte in der computergestützen Lexikographie Wörterbücher Lexikographische Grundlagen für Wörterbücher Einsatz der Auszeichnungssprache SGML/XML für Wörterbücher Erstellung und Produktion von Wörterbuchartikel – lexikographischer Arbeitsprozess

Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

1

Vorlesungseinheit „Wörterbücher“

Im Rahmen derVorlesungsveranstaltung

„Informationsaufbereitung“Thomas Schütz,

wiss. Mitarbeiter LS Prof.Kuhlen([email protected])

2

Überblick

Einleitung:Neue Konzepte in dercomputergestützen Lexikographie

Wörterbücher

Lexikographische Grundlagen fürWörterbücher

Einsatz der Auszeichnungssprache SGML/XML für Wörterbücher

Erstellung und Produktion von Wörterbuchartikel– lexikographischer Arbeitsprozess

Page 2: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

2

3

Neue Konzepte in der Lexikographiefür Wörterbücher -1

l Langweilig ? – „Es gibt schon alle mögliche Wörterbücher ?“

l Neue Dynamik durch den Einsatz der Computertechnik -insbesondere des Internets - bieten sich neue Chancen undPerspektiven für Wörterbücher.

l Ca. 400 elektronisch Wörterbücher können im Internet gefundenwerden.

4

Neue Konzepte in der Lexikographie -2

l im Mittelpunkt der neuen Diskussionen in der L. stehen diefolgenden grundlegenden Konzepte:– Die Einsatzmöglichkeiten der Auszeichnungssprache

SGML/XML für die lexikographischeInformationsmodellierung (wird ausführlich dargestellt)

– Die Nutzung des Internets als Publikationsmedium fürlexikographische Produkte (im WS 01/02)

– Hypertext/Hypermedia als Organisationsform fürlexikalisches Wissen. (andere VorlesungsEinheit)

l ENFORUM: Nutzungs des Internets nicht nur alsPublikationsmedium, sondern auch als Kommunikationsmedium

Page 3: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

3

5

Projekt: „ENFORUM“

l Im Rahmen des ENFORUM-Projektes am Lehrstuhl von Prof.Rainer Kuhlen soll ein Informationsystem aufgebaut werden, das:

– die Inhalte eines enzyklopädischen Wörterbuchs für dieInformationswissenschaft organisiert,

– das Internet nicht nur als Publikationsmedium nutzt, sondernauch ...

– ... als Kommunikationsmedium für eine Diskussion in derinformationswissenschftliche Fachgemeinde. In Diskussionensollen kollaborativ WörterbuchArtikel erarbeitet werden.

l ... WS 01/02.

6

Projekt: „ENFORUM“-Architektur

Benutzungsoberfläche im Web-Client

Diskussions-forenWörterbuch

-db

ABC IW-SystematikAbrechnungs-system

Experten-verwaltung

Lotus Notes -Basis

Wörterbücher Software-Entwicklung

Wissens-management

Page 4: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

4

7

Lexikographische Grundlagen fürWörterbücher

Einleitung:Neue Konzepte fürneue Wörterbücher

Wörterbücher

Lexikographische Grundlagen fürWörterbücher

Einsatz der Auszeichnungssprache SGML/XML für Wörterbücher

Erstellung und Produktion von Wörterbuchartikel – lexikographischer Arbeitsprozess

8

Überblick - Lexikographische Grundlagenfür Wörterbücher

LexikographischeGrundlagen fürWörterbücher

Unterscheidungsmerkmalevon Wörterbüchern

Makrostruktur vonWörterbüchern

Mikrostruktur vonWörterbüchern

Was sind Wörterbücher ?

Page 5: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

5

9

Was sind Wörterbücher ?

l Eine Wörterbuch ist (allg. Veständnis):

– ein (lexikographisches) Nachschlagewerk mit einemgeordneten Verzeichnis von Wörter mit sprachlichen odersachlichen Informationen.

10

Unterscheidungsmerkmale vonWörterbüchern

– hilfreich für den systematischen Überblick übervorhandene Wörterbücherl Für die Plannung und Konzeption neuer Wörterbücherl Für den systematischen Zugriff auf Wörterbücher (z.B. für

Wörterbuchbenutzende die bestimmte lexikalische Informationensuchen)

Page 6: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

6

11

Anerkannte Unterscheidungs-merkmale – „Anzahl der Sprachen“

l Unterscheidungsmerkmale dem Handwörterbuch fürSprach- und Kommunikation (HSK)

Unterscheidungsmerkmal

„Anzahl der Sprachen“für Wörterbücher

monolingual

bilingual

multilingual

HSK-Typologiestufe 1

12

Anerkannte Unterscheidungsmerkmale –„Spezialisierung“

Allgemeine Wörterbücher

Spezial-Wörterbücher

HSK-Typologiestufe 2

Definitions-wörterbücher

EnzyklopädischesWörterbuch

HSK-Typologiestufe 3

Unterscheidungsmerkmale

„Spezialisierung“Wörterbücher

„Der großeBrockhaus“

Page 7: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

7

13

Unterscheidungsmerkmale vonSpezialwörterbücher

Spezial-Wörterbücher

Mit bestimmtenInformationstypen

SyntagmatischeWörterbücher

ParadigmatischeWörterbücher

Markierungen

-Orthographische WB-Aussprache WB-etymologische WB

-horizontale Beziehungen von Begriffen-Sprichwörter-Redewendungen

-vertikale Beziehungen vonBegriffen-Synonyme/ Antonyme-Thesauri

-Fremdwörter-Fachsprachen-Sprachstadien

HSK-Typologiestufe 3

14

Problematik vonUnterscheidungsmerkmalen

l Unterscheidungsmerkmale für Wörterbücher, wie sie für diemetalexikographische Fachdiskussion vorgeschlagen werden,orientieren sich ausschließlich an Print-Wörterbücher.

l Beispiel ...

Page 8: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

8

15

...Beispiel

x

x

Lang D - E

Spezial;Syntagmatisch

Spezial;paradigmatisch

Markierungen

xxSpezial; Inhalstypen

Allg. Definitionswb

Allg. Enzyklopädisches

xMultisprachig

xEinsprachig

http://dict.leo.org/

Duden RechtS

16

ProblematikUnterscheidungsmerkmale-2

l Vergleich der Übersetzungswörterbücher reichen die Merkmalefür Wörterbücher nicht aus:

l Wir brauchen also neben den inhaltlichenUnterscheidungsmerkmalen noch weitere formaleUnterscheidungsmerkmale.

Page 9: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

9

17

Unterscheidungsmerkmale für elektr.Wörterbücher – „Publikationsform“

Unterscheidungsmerkmal

„Publikationsform“Für elektr. Wörterbücher

BuchOffline

-WörterbücherOnline

-Wörterbücher

18

Unterscheidungsmerkmale für elektr.Wörterbücher – „Abschlossenheit“

Unterscheidungsmerkmal

„ Abschlossenheit“für elektr. Wörterbücher

WörterbücherIm Aufbau

AbgeschlosseneWörterbücher

Fehlerbehebung

Schließen vonLemmalücken

Beiträge von Spezialisten

Beliebige BeiträgeZu einem vorgegebenenWörterbuchgegenstand

Wenn das Endprodukt Nicht mehr zur Diskussion

(Besser InKommunikation)

Page 10: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

10

19

Unterscheidungsmerkmale für elektr.Wörterbücher „Hypertextualisierung“

Unterscheidungsmerkmal

„ Hypertextualisierung“für elektr. Wörterbücher

Hypertextualisierung mit Informationsaufbereitung

Hypertextualisierung ohne Informationsaufbereitung

Keine Hypertextualisierung

„Browsing“

„StartetEine Suchfunktion“Bsp.:

„nur Suchfunktion“

20

BSP Hypertext ohne IAin http://work.ucsd.edu:5141/cgi-bin/http_webster?method=exact&isindex=hypertext&db=*

Page 11: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

11

21

Unterscheidungsmerkmale für elektr.Wörterbücher „Multimedialität“

Unterscheidungsmerkmal

„ Multimedialität“Für elektr. Wörterbücher

Text und Bild

Nur Text

Text, Bild und Ton

Text und Ton

Beispiel: Gestenlexikon:Fachgebärdenlexikon Psychologie(textuelle Begriffserläuterungen + Video mit den zugehörigenGestenvorführungen):http://www.sign-lang.uni-hamburg.de/Projekte/PsychLex.html

22

Unterscheidungsmerkmale für elektr.Wörterbücher „Zugriffsangebote“

Unterscheidungsmerkmal

„ Zugriffsangebote“für elektr. Wörterbücher

mit hypertext-orientiertem Zugriff

mit blätterndem Zugriff

mit hypertext- und retrieval-orientiertem Zugriff

mit retrieval-orientiertem Zugriff

Page 12: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

12

23

InformationswissenschaftlicheÜberlegungen zu Merkmalen

l Vielleicht sollte noch der Anbietertyp hinzugenommen werden, dawir grundlegende Unterschiede in Wörterbücher bezüglich diesesWörterbuchtyps feststellen können:

l z.B. Verlage bieten oft 1:1 Übertragungen ihrer Print-Wörterbücherim Internet an (Langenscheid Fremdwörterbuch)

l Z.B. Forschungsgruppen experimentierfreudigerl „Zitierungsfähigkeit“-Aspekt

24

Zwischenfazit–Unterscheidungsmerkmale

Unterscheidungsmerkmalefür Wörterbücher

Anzahl der Sprachen

Spezialisierung

Allg. Wörterbücher

Spezialwörterbücher

Publikationsform

Multimedialität

Abgeschlossenheit

Zugriffsangebote

Anbietertyp

formaleinhaltliche

Page 13: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

13

25

Überblick: Makro- und Mikrostrukturvon Wörterbüchern

LexikographischeGrundlagen fürWörterbücher

Unterscheidungsmerkmalevon Wörterbüchern

Makrostruktur vonWörterbüchern

Mikrostruktur vonWörterbüchern

26

Makrostruktur von Wörterbüchern

l Gib an, wie das Wörterbuchverzeichnis aufgebaut ist. „Wie erfolgtder Zugriff auf die WörterbuchArtikel ?“ bzw. „Wie sind dieWörterbuchArtikel angeordnet ?“

l Wir können zwei grundlegende Zugriffstrukturen unterscheiden:– alphabetische Makrostruktur auch semasiologische

Makrostruktur genannt undl Beispiel: http://www.glossar.de/glossar/index.htm

– die systematische Makrostruktur auch onomasiologischeMakrostruktur genannt.l Beispiel:systematische Makrostruktur findet man bei jedem Thesaurus; auch

im WWW: z.B. bei http://www.gbi.de/thesaurus/subthes/bwl/bwl.htm– Bei elektr. Wörterbücher existieren oft Mischformen.

Page 14: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

14

27

Mikrostruktur von WörterbuchArtikeln

l gibt Auskunft über die innere Zugriffsstruktur bzw.Ordnungsstruktur von WörterbuchArtikeln.

l Für die Beschreibung der Mikrostruktur gibt es aus derMetalexikographie anerkannte Analysemethoden. ImZentrum dieser Methoden steht die funktional-positionaleSegmentation nach Wiegand.

l Zuerst ein Beispiel è

28

Beispiel eines Wörterbuchartikels ausdem HWDG (Handw.buch der Deut.Geschichte).

Moos, das; es, e1. kleine, in großer, dicht stehender Menge,

vorzugsweise an schattigen, feuchtenStellen wachsende immergrüne, sich durchSporen vermehrende Pflanze;weiches, grünes M; sich im Wald ins M setzen.<o. Pl.> umg. Geld (1): da muß doch eineMasse M. herausspringen.

2.

Page 15: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

15

29

Beispiel eines Wörterbuchartikels ausdem HWDG (Handw.buch der Deut.Gesch.

Moos, das; es, e1. kleine, in großer, dicht stehender Menge,

vorzugsweise an schattigen, feuchtenStellen wachsende immergrüne, sich durchSporen vermehrende Pflanze;weiches, grünes M; sich im Wald ins M setzen.

/o. Pl./ umg. Geld (1): da muß doch eineMasse M. herausspringen.

2.

ErläuterungenLemma Grammatische

Angaben

30

Funktional-positionale Segmentation-1

l Diese Methode unterscheidet die folgenden Segmententeaus den ein WörterbuchArtikel besteht kann:– Angaben (z.B. Angaben über die Bedeutung,

etymologische Angaben, Verweise, grammatischeAngaben )

– Strukturanzeiger:l typographische (Schriftart, -größe) undl nichttypographische (Komma, Klammern) Strukturanzeiger, die

dem Benutzer den besseren Zugriff auf die gesuchtenInformationen dienen

Page 16: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

16

31

Funktional-positionale Segmentation-2

l Analyse bzw. zur Beschreibung der Mikrostruktur einesWörterbuches werden nur die Angaben berücksichtigt

l Die Strukturanzeiger lassen sich in gleicherweise in dieseMethode mit einbeziehen (Komplexitätsminderung in derDarstellung)

l Wichtig: Die Mikrostruktur macht nur Aussagen über Angaben undderen Beziehungen.

l Die funktionale positionale Segmentation für dieMikrostruktur erfolgt in zwei Schritten:

32

Funktional-positionale Segmentation–Schritt 1

l Angaben eines Wörterbuchartikels solange in seine Segmentezerlegt bis seine Angabe nur noch eine lexikalische Informationträgt; in diesem Fall spricht man von elementaren Angaben.

l exhaustive funktionale Segmentation der Angabenl Die Beziehungen der einzelnen elementaren Angaben werden mit

partiven Relationen (Teil-Ganzes-Beziehungen) ausgedrückt.l Beispiel:

das; es, e: Grammatische Angaben

das: Artikel

es: Genitiv

e: Deklination

„...besteht aus...“oder „ist Teil von“

Page 17: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

17

33

Funktional-positionale Segmentation–Schritt 2

l Analyse der Reihenfolge der einzelnen Angaben, um

l explizite Informationen über Reihenfolge der Angaben zumachen

l Diese Informationen werden als präzedive Relationen(Vorgänger-Nachfolger-Beziehungen) über die einzelnenAngaben) festgehalten

34

WörterbuchArtikel als Baumstruktur

l Das Ergebnis kann nun dargestellt werden als Baumstruktur

l Positionsnummern sollen die Reihenfolge festhalten

„Moos“:WörterbuchArtikel

das: ArtikelPos =1

es: GenusPos=2

e: PluralangabePos=3

Moos: LemmaPos=1

Das; es, e: GrammatikPos=2

Erläuterung1: ErläuterungPos=3

Erläuterung1: ErläuterungPos=4

Page 18: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

18

35

WörterbuchArtikel als Baumstruktur -2

Erläuterung1

DefinitionPos=1

kleine, in großer, dicht stehender Menge,vorzugsweise an schattigen, feuchtenStellen wachsende immergrüne, sich durchSporen vermehrende Pflanze;weiches, grünes M; sich im Wald ins M setzen.

Beispiel1Pos=2

Beispiel2Pos=3

36

WörterbuchArtikel als Baumstruktur-3

Erläuterung2

Grammatische A.Pos=1

DefinitionPos=2

Beispiel1Pos=2

<o. Pl.> umg. Geld (1): da muß doch eineMasse M. herausspringen.

Page 19: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

19

37

Abstrakte hierarchische Mikrostruktur

l Dieses Ergebnis wird als konkrete hierarchischeMikrostruktur bezeichnet.

l wenn man im letzten Schritt noch von Angaben zuAngabenklassen abstrahiert (in der Lexikographie :Isomorphie ) und erhält man die abstrakte hierarchischeMikrostruktur.

38

Beispiel zur abstraktenhierarchischen Mikrostruktur

WörterbuchArtikel

Artikel Genitiv Pluralangabe

Lemma Grammatik Erläuterung

Grammatik? Definition Beispiel*

Page 20: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

20

39

Zwischenfazit

l Mit der funktional-positionale Segmentation lassen sichwesentliche Aussagen über die Mikrostruktur eine Wörterbuchesgewinnen.

l Selbsterklärend: mehrere WbA notwendig für Aussagen über eineabstrakte hierarchische Mikrostruktur

l Wie diese abstrakte hierarchische Mikrostruktur darüber hinausein wesentlichen Beitrag zu einer konsistenteInformationsmodellierung liefert, soll im folgenden Kapitel erläutertwerden.

40

Übung 1: Mikrostrukturanalysemit der funktional-positionalenSegmentation

l Ausgangspunkt: Artikel aus dem WAHRIG Fremdwörterlexikon

In|for|ma|ti|on <f.; -, -en> 1 Auskunft, Nachricht,Aufklärung; Informationen einholen, erhalten; jmdm. eineInformation (über jmdn. od. etwas) geben 2 <Kyb.>Einwirkung eines dynamischen Systems auf einanderes, mit dem es gekoppelt ist, wobei Nachrichtenüber Zustände u. Vorgänge ausgetauscht werden [<lat.informatio „Formung, Bildung durch Unterweisung”]

Page 21: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

21

41

Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -1

Artikel

In|for|ma|ti|on

<f.; -, -en>

Auskunft, Nachricht,Aufklärung;Informationen einholen, erhalten; jmdm.Eine Information (über jmdn. od. etwas)geben

Einwirkung eines dynamischen Systemsauf einanderes, mit dem es gekoppelt ist,wobei Nachrichten über Zustände u.Vorgänge ausgetauscht werden.

[<lat.informatio „Formung, Bildung durchUnterweisung”]

:Stichwort

:Grammatische Angaben

:Bedeutungs-angaben

:Bedeutungs-angaben

:Herkunfts-angaben

42

Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -2

In|for|ma|ti|onIn

for

ma

ti

on

:Silbe

:Silbe

:Silbe

:Silbe

:Silbe

Page 22: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

22

43

Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -3

<f.; -, -en>

f

-

-en

:Artikel

:Genitiv

:Plural

44

Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -4

Auskunft, Nachricht,Aufklärung;Informationen einholen, erhalten; jmdm.eine Information (über jmdn. od. etwas)geben

Auskunft, Nachricht,Aufklärung;

Informationen einholen, erhalten;

jmdm. Eine Information (über jmdn. od.etwas) geben

:Beispiel

:Beispiel

:Defintion

Page 23: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

23

45

Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -5

<Kyb.>

Einwirkung eines dynamischen Systemsauf einanderes, mit dem es gekoppelt ist,wobei Nachrichten über Zustände u.Vorgänge ausgetauscht werden.

<Kyb.> Einwirkung eines dynamischen Systems aufeinanderes, mit dem es gekoppelt ist, wobeiNachrichten über Zustände u. Vorgängeausgetauscht werden.

:Fachdisziplinangabe

:Defintion

46

Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -5

l Informationen über Reihenfolge über die Anordnungwurde festhalten

l Die konkrete hierachische Mikrostruktur ergibt ausallen (grünen) funktionalen Segmenten.

Page 24: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

24

47

Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -6

l Die abstakte hierachische Mikrostruktur ergibt ausallen (gelben) funktionalen Segmenten.

:Stichwort

:Grammatische Angaben

:Bedeutungs-Angaben +

:Herkunkfts -Angaben ?

Artikel

:Silbe +

:Genitiv

:Plural

:Artikel

:Beispiel*

:Defintion

:Fachdisziplin

:Herkunkftssprache*

:Herkunkftsangabe

48

Zusammenfassung – Ausblick aufSGML

- Informationsproblem: Suche nach einer annerkannte/ allg. gültigen Information, dieer hofft in einem Wörterbuch zu finden.

- Zugriff auf ein bestimmtes Wörterbuch viaUnterscheidungsmerkmalen

- Zugriff via Makrostruktur aufWörterbuchArtikel

- Zugriff via Mikrostruktur auf bestimmteInformationen innerhalb eines WörterbuchArtikels

Page 25: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

25

49

Zusammenfassung – Ausblick aufSGML -2

l Eine konstistente Struktur eines Wörterbuchs dient dem Benutzerzum schnellen Zugriff auf bestimmte Informationen in einemWörterbuch. Selbstverständlich hat der Benutzer keine formaleabstrakte Makrostruktur im Kopf; aber durch die mehrmaligeBenutzung bekommt er eine Vorstellung (auch durchBenutzungshinweise) durch die Makrostruktur, die ihmEffektivitätsvorteile beim Zugriff bringt.

l Damit bestimmte Angaben immer an einer bestimmten Stellestehen, muß der Artikel immer die gleiche Struktur erhalten.

l Der Benutzer eines Wörterbuches verlangt eine konsistenteStruktur, dafür brauchen wir eine Makro- und Mikrostruktur.

50

Anforderungen an eineComputerunterstützung im Aufbauund Erstellung eines Wörterbuches

l Der Anbieter braucht ein System,...

– das bei der Erfassung bzw. beim Schreiben eines Artikels dieStruktur einhalten wird.

– das die Langlebigkeit der Daten garantiert.– das eine flexible Darstellung der Inhalte ermöglicht. (gleicher

Inhalt in unterschiedlichen Publikationsmedium)– das die Speicherung dieser flexiblen Struktur von

WörterbuchArtikel ermöglicht.l è aus diesen Gründen schauen wir uns SGML/XML an.

Page 26: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

26

51

Überblick: SGML-konformeAuszeichnung von Wörterbücher

Einleitung:Neue Konzepte fürneue Wörterbücher

Wörterbücher

Lexikographische Grundkenntnissefür Wörterbücher

Einsatz der Auszeichnungssprache SGML/XML für Wörterbücher

Erstellung und Produktion von Wörterbuchartikel – lexikographischer Arbeitsprozess

52

Einsatz der Auszeichnungssprache SGML/XML für Wörterbücher

Einsatz derAuszeichnungssprache SGML/XML fürWörterbücher

Grundgedanke der SGML

GrundlegendeSGML -konformeAuszeichnung

Mögliche Wege zurAuszeichungssprache

Page 27: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

27

53

Grundgedanke der SGML

Inhalt (Text, Bilder)

Dokument___________________________

InformationenzurInhaltsstruktur(Bedeutung d. I)

InformationenzurDarstellung(Schriftgröße,-art)

l SGML basiert auf den Grundgedanken der Generic Markup, daß ...

54

Grundgedanke der Auszeichnung

l Die wesentliche Frage nun: Wie können Informationen über dieStruktur in den Text hineincodieren. Mit Hineincodieren ist dieAuszeichnung von Textteilen gemeint.

l Eine Auszeichnungssprache soll nun im wesentlichen Antwortenauf die folgenden Fragen leisten :

– Welche Auszeichnungen sind erlaubt?– Welche Auszeichnungen sind erforderlich?– Wie unterscheidet man Auszeichnung vom Text?– Was bedeutet die Auszeichnung?

Page 28: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

28

55

SGML als Metasprache -1

l SGML ist eine Metasprache für Auszeichnungssprachen.l Beispielsweise ist HTML eine Auszeichnungssprache; man kann

auch von einer SGML- Anwendung sprechen.l XML ist wie SGML eine Metasprache, nur wesentlich knapper,

einige sagen auch logisch überzeugender. –Auf jeden Fall kannXML als echte Teilmenge von SGML auf gefasst werden

l SGML und XML legen also nur Rahmenbedingungen fürAuszeichnungssprache fest.

XML

SGML HTML

XHTML

56

SGML als Metasprache -2

l Wir brauchen also eine Auszeichnungssprache für Wörterbücher,die konform ist mit SGML/XML.

Page 29: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

29

57

Grundsätzlicher Aufbau eines SGML-konformen Dokuments

Prolog:-XML-Deklination: < ? xml version = "1.0" encoding="UTF-8"?>- DTD (Document Type Definition)<! DOCTYPE wbuch SYSTEM „wb.dtd“>

TEXT

Verarbeitungsinstruktion

58

Grundlegende SGML-konformeAuszeichnung -ELEMENT

l SGML/XML –Konstrukt: ELEMENT

<wb_artikel> <Lemma>hallo</Lemma> <Grammatik> <artikel>der</artikel> <genitiv>der</genitiv> <plural>e</plural> </Grammatik> <Erlaeuterung> <plural_plus> o.Plu</plural_plus> <beispiel>zum Beispiel</beispiel> <beispiel>zum Beispiel2</beispiel> </Erlaeuterung></wb_artikel>

Page 30: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

30

59

DTD

< ? xml version = "1.0"?><!DOCTYPE wb_artikel [<!ELEMENT wb_artikel (Lemma, Grammatik,Erläuterung+) ><!ELEMENT Lemma (# PCDATA) ><!ELEMENT Grammatik (artikel , genitiv, plural) ><!ELEMENT artikel (# PCDATA) ><!ELEMENT genitiv (# PCDATA) ><!ELEMENT plural (# PCDATA) ><!ELEMENT Erläuterung (plural_plus, beispiel) ><!ELEMENT plural_plus (# PCDATA) ><!ELEMENT beispiel (# PCDATA) >]>

lDTD kann man nun festlegen, welche Elemente innerhalb einesTextes benutzt werden können und welche Beziehungen entstehendürfen.

60

Grundlegende SGML -konformeAuszeichnung –Relationen

l Auch die Teil/Ganzes- und Vorgänger-Nachfolger Beziehungenlassen sich einfach entnehmen

<wb_artikel> <Lemma>hallo</Lemma> <Grammatik> <artikel>der</artikel> <genitiv>der</genitiv> <plural>e</plural> </Grammatik> <Erlaeuterung> <plural_plus> o.Plu</plural_plus> <beispiel>zum Beispiel</beispiel> <beispiel>zum Beispiel2</beispiel> </Erlaeuterung></wb_artikel>

Page 31: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

31

61

Erstellung eines Dokumentes

l XML-Editor

62

Wege zu einer DTD für Wörterbücher

l Eigenentwicklungl Nutzung/Modifikation der von Text Encoding Initative (TEI)

vorgeschlagenen DTD

Page 32: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

32

63

DTD-Eigenentwicklung

l Bedeutet: aus einer abstrakten hierarchischen Mikrostrukturund deren Erweiterungen für die Integration in eineumfassende Wörterbuch-DTD muss eine vollständige DTDentwickelt werden

64

Die DTDs der TEI

l steht für Text Encoding Initiative (http://www.hcu.ox.ac.uk/TEI/)l wurde 1988 als Forschungsprojekt mit Ziel: Richtlinien für die

Auszeichnung verschiedener Texttypen aus demgeisteswissenschaftlichen Bereich zur Verfügung zu stellen

l problemloser Datenaustausch soll gewährleistet werden undLanglebigkeit der Daten

l 1994 erschienen die Guidelines for Electronic Text Encoding undInterchange bekannt als TEI Proposal numer 3

l 1300 Seiten starkes Papier, das die Nutzung dieser modulare DTDerklären sollte.

l Modul auch TEI-DTD (für Printwörterbücher !!!???), hat denAnspruch alle modernen Wörterbücher westlicher Sprachenabzubilden.

Page 33: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

33

65

Problematik der TEI-DTDs

l Einblick in die Modularität (Einblicke in die Komplexität zugewinnen)

l TEI –Pizza Bäcker (http://www.tei-c.org/pizza.html

l Die Anwendbarkeit dieser DTD muss selbstverständlich überprüftwerden. In vielen Stellen in der Literatur findet man allerdings denErkenntnis, dass die TEI-DTD für Wörterbücher zu flexibel undkomplex sind.

l Notwendig ist eine Modifikation der TEI-DTDl Modifikation bedeutet letztendlich das der Anwender sich eigene

Gedanken machen und abgleichen mit der TEI-DTD.

66

Prüfung der Anforderungen: Hilfreichfür die Erfassung der WbArtikel

l Editor () – ein flexibles Hilfsmittel für die Erfassung.

Page 34: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

34

67

Prüfung der Anforderungen:Langlebigkeit der Daten

l Unabhängigkeit von Beriebssystem und Anwendungsprogramm

l Ist gesichert durch den problemlosen Dokumentaustausch, derdurch systemunabhängige Systemschnittstellen gewährleistet ist.

Anwendung1 Anwendung 2

XML-Dokument

XML-Parser

Ähnlich derMikrostruktur

68

Prüfung der Anforderungen:Speicherung flexibler Datenstrukturen

l Die Anwendung liest die Baumstruktur ein

l und transformiert diese für eine Datenbank.

Anwendung 2

XML-Dokument

XML-Parser

Ähnlich derMikrostruktur

XML-Datenbanken

Page 35: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

35

69

Prüfung der Anforderungen: FlexiblePräsentationsformen

l Verschiedene Anwendungsprogramme für die Aufbereitung derWörterbuchInhalte können auf den gleichen Datenbestandzugreifen und die Inhaltsstruktur unterschiedlich interprtieren.

SGML-Document

Satzprogrammfür

Bücher

Satzprogrammfür

CD-ROM

Satzprogrammfür

das Web

Neue Präsentation WAP ?

70

Prüfung der Anforderungen: FlexibleAuswertungsmöglichkeiten

l Für neue Fragestellungen: z.B „gib alle WbA deren Lemma aufSubstantive aus dem 1. Jahrhundert, die .“, können mit SGML-konformen Dokument erfüllt werden:

Artikel

:Herkunkfts -Angaben ?

:Herkunkftssprache*

:HerkunkftsWortangaben

[<lat.informatio „Formung, Bildung durchUnterweisung”, 1.Jhd]

:Wortart

:Übersetzung

:Herk_Zeitangabe

Page 36: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

36

71

Beispiel-Artikel

In|for|ma|ti|on <f.; -, -en> 1 Auskunft, Nachricht,Aufklärung; Informationen einholen, erhalten; jmdm. eineInformation (über jmdn. od. etwas) geben 2 <Kyb.>Einwirkung eines dynamischen Systems auf einanderes, mit dem es gekoppelt ist, wobei Nachrichtenüber Zustände u. Vorgänge ausgetauscht werden [<lat.informatio „Formung, Bildung durch Unterweisung”]

72

Zwischenfazit

l Der immense Arbeitsaufwand war aus meinen Ausführungen kaumzu entnehmen.

l TEI-DTD wahrscheinlich kaum nutzbar; auch andere freiverfügbare DTDs () versprechen keine schnelle Hilfe und müssenauf ihre Anwendbarkeit überprüft werden.

l Auch die vielen Problembereiche wurden nicht angesprochen.– Eine großer Problematik in der Entwicklung einer DTD, die

unabhängig vom Publikationsmedium sein, soll scheint dieinterne Verlinkung zu sein. Für die elektronische Präsentationist ein Hyperlink adäquat; für die Print-Version muss einnormaler textueller Verweis auf ein andres Lemma erscheinen.l Beispiel im Langenscheid Fremdwörterbuch scheinen diese Problematik nicht gelöst

zu sein.

– Auflösung von Verdichtungen

Page 37: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

37

73

Zwischenfazit -2

l Auch wenn der Weg zu einer SGML-konformen DTDarbeitswendig ist, führt kein Weg für Wörterbuch-Anbieter vorbei:

l SGML/XML ist der einzige Weg, der– oben genannten Anforderungen erfülltgarantiert.

74

Überblick

Einleitung:Neue Konzepte fürneue Wörterbücher

Wörterbücher

Lexikographische Grundlagen fürWörterbücher

Einsatz der Auszeichnungssprache SGML/XML für Wörterbücher

Erstellung und Produktion von Wörterbuchartikel – lexikographischer Arbeitsprozess

Page 38: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

38

75

Erstellung und Produktion vonWörterbuchartikel – lexikographischerArbeitsprozess

Einsatz derAuszeichnungssprache SGML/XML fürWörterbücher

1. Materialsammlung

2. Materialauswertung:Dokumentenanalyse undInformationsstrukturmodellierung

3. Schreiben derWörterbuchArtikel –Redaktionelle Erarbeitungund Bearbeitung derWörterbuchartikel

4. Publizieren desWörterbuches

76

1. Materialsammlung

Belegsammlung(Lexikographie: Quellenkorpus

Text, (am besten:SGML-konform)

Sound

Video externe-DB

Page 39: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

39

77

2. Materialauswertung:Dokumentenanalyse undInformationsstrukturmodellierung

l Ganz im Sinne werden einige Dokumente ausgewählt, anhand der dieober dargestellten Mikrostrukturanalyse und der Transformation zu einerSGML/XML-DTD erfolgt.

Informationsstruktur-Modellierung (DTD-Entwicklung)

Beleg-sammlungDokumenten-

anayse

78

3. Redaktionelle Erarbeitung

l konkrete Erarbeitung der Wörterbuchartikell dazu wird ein Redaktionssystem benötigt, das den Zugriff auf die DTD

ermöglicht und die „Schablone“ mit Inhalten (WörterbuchArtikel) füllt.

Informationsstruktur-Modellierung (DTD-Entwicklung)

Beleg-sammlung

SGML-konforme Inhalte (-Instanzen)

Redaktionssystem

1.2.

Informationsbasis

Page 40: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

40

79

Redaktionelle Erarbeitung-Redaktionssystem

l software-technisch kann das ein handelsüblicher SGML/XML–Editor sein. Allerdings das ein ausgebautesRedaktionswerkzeug, wesentlich mehr können bzw.besitzen muss:

l -          Schnittstelle zur Belegsammlungl -          Import von Fremdtexten (Word-Datei)l -          SGML-gestützte Suchfunktionl -          Versionsmanagement von Wörterbüchernl -          Unterstützung von Verknüpfungenl -          Generierung von Verzeichnissen - Schnittstelle zu einem Workflow –Management ( bspw.

für Qualitätssicherungsmaßnahmen, verteilte Informationen)

80

4.Publizieren des Wörterbuches

l Informationsbasis für unterschiedliche Publikationsarten

Informationsstruktur-Modellierung (DTD-Entwicklung)

SGML-konforme Inhalte (-Instanzen)

Informationsbasis

Buch CD-ROM WWW

Page 41: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

41

81

Ausblick

Einleitung:Neue Konzepte fürneue Wörterbücher

Wörterbücher

Untersuchungsgegenstand„Wörterbücher“

Einsatz der Auszeichnungssprache SGML/XML für Wörterbücher

Erstellung und Produktion von Wörterbuchartikel – lexikographischer Arbeitsprozess

82

Ausblick-2

l WS 01/02 Vorlesungsveranstaltung „elektronische Wörterbücher“

Page 42: Vorlesungseinheit „Wörterbücher“ · 1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz, wiss. Mitarbeiter

42

83

Literatur

l zu Unterscheidungsmerkmalen und Typologie von Wörterbücher:Hausmann, Franz Josef: „Wörterbuchtypologie“ ; in: Steger, Hugo;Wiegand, Herbert Ernst: Handbuch der Sprach- undKommunikationswissenschaft; Teilband 1; 1989.

l Angelika Storrer und Katrin Freese: “Wörterbücher im Internet“;erschienen in: Deutsche Sprache 2/1996, S. 97-153; online:http://www.ids-mannheim.de/grammis/orbis/wb/wbfram1.html

l Zur Makro- und Mirkostruktur von Wörterbücher: Wiegand, Herbert Ernst,S. 371-501; in: Handbücher zur Sprach- undKommunikationswissenschaft / mitbegr. von Gerold Ungeheuer. Hrsg.von Hugo Steger u. Wiegand, Herbert Ernst, Teilband 1; 1989.

l Zur Makro- und Mirkostruktur: Bergenholtz, Henning; Tarp, Sven;Wiegand. H.E: Datendistributionsstrukturen, Makro- und Mikrostrukturenin neuen Fachwörterbücher; in:Hoffmann, Lothar: Fachsprachen : eininternationales Handbuch zur Fachsprachenforschung; Teilband 2, 1999.

84

Literatur -2

l s. zu SGML/XML: Lobin, Henning:Informationsmodellierung inXML und SGML; 2000.

l Zum lexikographischen Arbeitsprozess: Schmidt, Ingrid; Müller,Carolin: Entwicklung eines lexikographischen Modells: Ein neuerAnsatz; in: Lemberg, I.: s.u.

l Zur Einführung der in die neuen Grundkonzept imlexikographischen Arbeitsprozess: Lemberg, Ingrid: Chancen undPerspektiven computergestützer Lexikographie, 2001. (erscheintim Juni 01; Manuscipt im Arbeitsordner).