16
Wörterbücher im 21. Jahrhundert Michael Cysouw Quantitativer Sprachvergleich, LMU München

Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung

Wörterbücher im 21. Jahrhundert

Michael CysouwQuantitativer Sprachvergleich, LMU München

Page 2: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung

Quantitative modeling of historical-comparative linguisticsUnraveling the phylogeny of native South American languages

(ERC starting Grant)

Page 3: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung

knowledge of these extinct languages is limited to reconstructionsfrom ancient texts. This uneven sampling might have increasedbasal branch lengths and thus inflated estimates of divergence times.We tested this possibility by recoding apparently absent cognates asuncertainties (absent or present) and re-running the analyses.

Although divergence-time estimates decreased slightly, the effectwas only small (Fig. 1e).Finally, although there is considerable support for Hittite (an

extinct Anatolian language) as the most appropriate root for Indo-European22,23, rooting the tree with Hittite could be claimed to

Figure 1 Consensus tree and divergence-time estimates. a, Majority-rule consensus treebased on the MCMC sample of 1,000 trees. The main language groupings are colour

coded. Branch lengths are proportional to the inferred maximum-likelihood estimates of

evolutionary change per cognate. Values above each branch (in black) express the

bayesian posterior probabilities as a percentage. Values in red show the inferred ages of

nodes in years BP. *Italic also includes the French/Iberian subgroup. Panels b–e show the

distribution of divergence-time estimates at the root of the Indo-European phylogeny for:

b, initial assumption set using all cognate information and most stringent constraints(Anatolian, Tocharian, (Greek, Armenian, Albanian, (Iranian, Indic), (Slavic, Baltic), ((North

Germanic, West Germanic), Italic, Celtic))); c, conservative cognate coding with doubtfulcognates excluded; d, all cognate sets with minimum topological constraints (Anatolian,

Tocharian, (Greek, Armenian, Albanian, (Iranian, Indic), (Slavic, Baltic), (North Germanic,

West Germanic), Italic, Celtic)); e, missing data coding with minimum topological

constraints and all cognate sets. Shaded bars represent the implied age ranges under the

two competing theories of Indo-European origin: blue, Kurgan hypothesis; green,

Anatolian farming hypothesis. The relationship between the main language groups in the

consensus tree for each analysis is also shown, along with posterior probability values.

letters to nature

NATURE |VOL 426 | 27 NOVEMBER 2003 | www.nature.com/nature 437© 2003 Nature Publishing Group

!" !"#$%" !"&'(" ")*$+" ,!"&$-" !"'.

!" &$/" !" 0" " 12" !" 34" !" 351" !" 6&

!" 451"! " 78(97!" 4:" 6(9" 7;$<=>!

?=(;8(97" @" 0" ABCD!" :E" FG!"H"I" E" DG!"J5" E" GD!"≈" K" E" LMM!"KN+" AB!" O(+" LM!" 5=+BG!" IH" P3!" :J6" E" PPLCP!" Q8R+" 3&I" LM!" MD!" ≈"K(S+" LG" )RT*+U" V2"41("30" "7∈ *8(2" =?" 8" >8%=S7!" <W2" >RT" S=2" 41(" 30" "V2X,!" :S+" LBM !

Y*+" 0"ECI"GBCZ3!" H:"E"AZACG!" ON+" EEE"MM3CL!" 1$R+" ALZCB" !Xσ,φ ""7%(=[S7" # "K0" )× 4" Xσ,φ " 7%(=[S!" N98$$" 8<\=9[S8$" = (%8SN

]/[\S;TN!" *8S^(;8N!" 8S\" N[9+_7!" `+-+" ];a" "$" "$" _,"#"K0" #

K" 7V;[N2;!" J;[^R;7!" ∆ " )%;S+" , 7V;[N2;" \ ; N

0?;(\;N7!" :N" )%;S+" ," 758$N\(bN;7" " V*" Y" c1S+d"

7&^R89<W%!" &^R89$;[N2;7" *3<a" c52+d" # " *3N"

7V;[N2;S%;%;S\!" :S\;" \;N" 3<;(N^R;S/;$N7" # "3N"4." !"3N" 3" [\+e

*O%" 7&^RW$2;(!" 5b?2;7" #"3O%"4"&=3" !"O%"4"cHW+d"

≈ " ] _" "YR;" =([%[S" =?" 2R;" a" [S[2[8$" [N" S=2" T;2" ^$;8(e" [2" 98T" % =

<8^/" )2=%;2R;(" >[2R" 2R;" $;S%2R" =?" 2R;" ->+" =?" 2R;" LN2" NT$$+," 2=" 8S" [S[2[8$

^=9*=S;S2" =?" 8" 4" N;2" *R(8N;" +

"#$%! 78S2;$=*;!" \;;(!" 9=WS28[S" %=827" # "&'U"&" "# " 69(

c1d" 7%8.;$$;7!" 6/" 7%8.;$$;" )98$;,7!" 6(

) * $ + ," 79=WS28[S" %=827" )cK(+d" 7 ^ 8* ( 8

9=S28S8!" (W*[^8*(87,!" 1." " 7<;8N2!" 8S[98$7" %%" 6/"79=WS28[S" (897!" &(" 79=WS28[S" %=827" @" K(+" EO" FLM!" V"1"M3!" I#"BA !

fg&"PF!" 1"6"LP!" &\+" GDCZ3!" ZP!" '6f"EhF" FDM!" #(+" A3!" Q0&" FD" @" ES" H6/

)8?2;(" 2R;" *R=S=$=%[^" 9;(%;(" =? 8S\ ," 6/ 9;(%;\" >[2R" 6/

" 7%8.;$$;7" )^=SS;^2;\" >[2R" 6/" 79=WS28[S" (897X," "'U"XX" #icgd" 76([;$C6S2[$=*;7" =(" 76S2[$=*;" &=9;([S%[[7" fR$" c::4d"

7;$8S\7"@"g"J#\"LBB!":"&'"FBZ!"::4"F3" !(U"HU"J(H !"5$H!" #(2

7∈ N98$$" \8(/" 8S2;$=*;" >[2R" $=S%" ?$82" R=(SN 7 ! J(H^

c&YHd" 7>[$\" %=82!" >[$\" 9=WS28[S" (89" ) ,7!

c5(+d" 7N^R>8(.;" 5[(N^R.[;%;S8S2[$=*;7!" cjd" 7>[$\" \8(/C^=$=W(;\" ( 89 !

(;N;9<$[S%" 8" ^R89=[N7" @ ! H:f" GFP!" 'R(+" PGF!" IJ" FBD" " Y%7(;[S\;;(7" #" :>/ ! V9 ! 4;% ! 3(^ ! a\ !"a$

! 4S 7\=9;N2[^" (;[S\;;(7!" J(H^ [\+" @" &YH" EE" FMCA!" j

LPF!" 5(+" ZML" @@" ≈"fk6" lGFD" )6" " 7\;;(!" 8S2;$=*;7&" [S^$+" H!" Y%," !)

7\;;(7" # " Y9 !" YW !" ! c#RId 7\;;(7!" 0(i

7N*=22;\" \;;(7" @@" f" lGDM" 6f" 4H" lA!" &" '4H" A" )NW%%;N2N" 2=" 8\\" Y"

" 7^(=NNC<(;8\" R=(N;7" 8S\" " 7N28$$[=S7,!" O-+" 6:4" PGB+

162

Page 4: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung
Page 5: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung
Page 6: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung

Herausforderung

• Langzeitperspektive ist fördertechnisch Problematisch geworden

• Kooperation in Raum & Zeit ist notwendig

• Wie bauen wir dezentralisierte und modularisierte Forschungsumgebungen ?

Page 7: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung

‣ Gedrucktes Buch‣ Webseite‣ Korrektur-Oberfläche‣ Organisations-Datenbank

‣ ‘Tabelle’ in Computer-lesbare Form

‣ z.B. CSV, SQL, XML, RDF‣ Struktur einfach halten !

Strukturierte Daten

Dienst für Benutzer

‣ Gebühren möglich‣ open access

‣ archivierbar ‣ ephemer

Inhalt Präsentation

Page 8: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung

‣ Gedrucktes Buch‣ Webseite‣ Korrektur-Oberfläche‣ Organisations-Datenbank

‣ ‘Tabelle’ in Computer-lesbare Form

‣ z.B. CSV, SQL, XML, RDF‣ Struktur einfach halten !

Strukturierte Daten

Dienst für Benutzer

‣ Gebühren möglich‣ open access

‣ archivierbar ‣ ephemer

Inhalt Präsentation

Page 9: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung

Datenstrukturen für Wörterbücher

Textedition Zettel Artikel

Basistext Annotation Auswertung

Zentraler Bezugspunkt

für alle

Teilauswahl und Interpretation des Basistextes

Sammlung und Ordnung von Annotationen

steigende Idiosynkrasie

Page 10: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung

abíhábi 27 ácadsfíve

mítyane ó áábímyeíhi. Tengo muchotemor por la enfermedad que viene.

abíhábi onom. 1. expresa que seden llamas de fuego. 2. expresa el es-tado de tener pintas redondas en la su-perficie.

aábo abs. insulto. 1I acción de ...[aabo] vt. 1. poner trampa. Áánu aa-

bó ípakyééju. El pone trampa en su re-presa (quebrada cerrada para que lospeces no puedan pasar). 2. (fig.) in-sultar, ultrajar. Tábyeebe oke aabó tá-tyájkiívá újtsiñe. Mi sobrino mesultó diciéndome que mis piernas sonmuy delgadas.

áábojcátsi abs. insultos. ¿A úhdityúhatsáma teene áábojcátsi? ¿Tú eres elque provocas los insultos? 11 acciónde...[ááb6jcªtsi] vrec. insultarse el uno

al otro. ¿Íveekí ámuha máábócatsíhij-cyá? ¡Ímiááméré bo meíjcyaj! ¿Porqué se insultan? ¡Vivan en armonía!

aabópi abs. estado de...[aabópi] ve. ser insultante. Tsaapi

táñahbémudítyú aabópí. Uno de mishermanos es insultante.[ábópí(h)] adj. insultante. Tsaapi

táñahbémudítyú ávyeta ábópí. Uno demis hermanos es muy insultante.

aabúcu abs. aguante, tolerancia, resis-tencia. 11 acción de...[aabúcu] vt. aguantar, soportar, to-

lerar, resistir. fiju aabúcú mítyane pá-dÚúcuú. El caballo aguanta mucho pe-so.[aabúcu] ve. ser tolerante, ser resis-

tente.[ábúcú(h)] adj. tolerante, resisten-

te. Éje, eene tsiimene ábúcú tsivá ee-

ne piichúcoba. Mira, ese niño resis-tente trae esa tremenda carga.

aabyúcu, aábyu abs. desenterramiento.11 acción de...[aabyúcu, aabyu] vt. sacar, desen-terrar algo. Éíjyúu llihíyó aabyúcúímyeemého. Hace poco mi papá de-senterró su masa de pijuayo (que ha-bía guardado).

ábyucúúve abs. efecto de...[ábyúcuuve] vi. ser sacado 10 que

estaba metido en una cosa.aca parto expresa duda. ¿Aca ure ú méé-nune? ¿Lo has hecho solo?

aaca conj.adv. se refiere a una acciónanterior. Núhbadi tsá mítyane u íj-cyáítyuró; aaca tsá u chéméítyuróne.Si no hubieras estado mucho en el solno te hubieras enfermado.

acádsi onom. expresa la acción de dejarde hacer algo. ¡lijyévéné 'acádsi' uméénúcuhíjcyáné wáábyau u éjécunú-ne! jNo sueltes la soga a cada rato!Ávyeta 'acádsi' néétune muha méwá-kímyeí. Estamos trabajando de corri-do sin tener tiempo para otra cosa.

acádsíh-acádsi onom. expresa que algose suelta o se afloja poco a poco.

acádsihnécu adv. soltando instantánea-mente. Ávyeta aadi áákityé íañújúacádsihnécu. Aquél se cayó y soltóinstantáneamente su escopeta.

ácádsíjcaáyo, ácadsíjco abs. acciónde...[ácádsíjcaayo, ácádsijco] vt. 1. sol-

tar, libertar, librar. 2. soltar, dejarcaer. Ú ácádsijcaayó díwaajácuháá-mi baávu. Tú has dejado caer el libroal suelo.

ácadsííve, áhcadsíba abs. soltura; liber-

Page 11: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung

Basistext

Annotationen

Page 12: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung
Page 13: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung
Page 14: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung

Auswertung:Etymologische “Artikel”

• Liste von Kognate (“links”)

• Orthographische Normalisierung

• Lautentsprechungen

• Rekonstruktion

Page 15: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung

abíhábi 27 ácadsfíve

mítyane ó áábímyeíhi. Tengo muchotemor por la enfermedad que viene.

abíhábi onom. 1. expresa que seden llamas de fuego. 2. expresa el es-tado de tener pintas redondas en la su-perficie.

aábo abs. insulto. 1I acción de ...[aabo] vt. 1. poner trampa. Áánu aa-

bó ípakyééju. El pone trampa en su re-presa (quebrada cerrada para que lospeces no puedan pasar). 2. (fig.) in-sultar, ultrajar. Tábyeebe oke aabó tá-tyájkiívá újtsiñe. Mi sobrino mesultó diciéndome que mis piernas sonmuy delgadas.

áábojcátsi abs. insultos. ¿A úhdityúhatsáma teene áábojcátsi? ¿Tú eres elque provocas los insultos? 11 acciónde...[ááb6jcªtsi] vrec. insultarse el uno

al otro. ¿Íveekí ámuha máábócatsíhij-cyá? ¡Ímiááméré bo meíjcyaj! ¿Porqué se insultan? ¡Vivan en armonía!

aabópi abs. estado de...[aabópi] ve. ser insultante. Tsaapi

táñahbémudítyú aabópí. Uno de mishermanos es insultante.[ábópí(h)] adj. insultante. Tsaapi

táñahbémudítyú ávyeta ábópí. Uno demis hermanos es muy insultante.

aabúcu abs. aguante, tolerancia, resis-tencia. 11 acción de...[aabúcu] vt. aguantar, soportar, to-

lerar, resistir. fiju aabúcú mítyane pá-dÚúcuú. El caballo aguanta mucho pe-so.[aabúcu] ve. ser tolerante, ser resis-

tente.[ábúcú(h)] adj. tolerante, resisten-

te. Éje, eene tsiimene ábúcú tsivá ee-

ne piichúcoba. Mira, ese niño resis-tente trae esa tremenda carga.

aabyúcu, aábyu abs. desenterramiento.11 acción de...[aabyúcu, aabyu] vt. sacar, desen-terrar algo. Éíjyúu llihíyó aabyúcúímyeemého. Hace poco mi papá de-senterró su masa de pijuayo (que ha-bía guardado).

ábyucúúve abs. efecto de...[ábyúcuuve] vi. ser sacado 10 que

estaba metido en una cosa.aca parto expresa duda. ¿Aca ure ú méé-nune? ¿Lo has hecho solo?

aaca conj.adv. se refiere a una acciónanterior. Núhbadi tsá mítyane u íj-cyáítyuró; aaca tsá u chéméítyuróne.Si no hubieras estado mucho en el solno te hubieras enfermado.

acádsi onom. expresa la acción de dejarde hacer algo. ¡lijyévéné 'acádsi' uméénúcuhíjcyáné wáábyau u éjécunú-ne! jNo sueltes la soga a cada rato!Ávyeta 'acádsi' néétune muha méwá-kímyeí. Estamos trabajando de corri-do sin tener tiempo para otra cosa.

acádsíh-acádsi onom. expresa que algose suelta o se afloja poco a poco.

acádsihnécu adv. soltando instantánea-mente. Ávyeta aadi áákityé íañújúacádsihnécu. Aquél se cayó y soltóinstantáneamente su escopeta.

ácádsíjcaáyo, ácadsíjco abs. acciónde...[ácádsíjcaayo, ácádsijco] vt. 1. sol-

tar, libertar, librar. 2. soltar, dejarcaer. Ú ácádsijcaayó díwaajácuháá-mi baávu. Tú has dejado caer el libroal suelo.

ácadsííve, áhcadsíba abs. soltura; liber-

Page 16: Wörterbücher im 21. Jahrhundertcysouw.de/home/presentations_files/cysouwWOERTERBUCHER.pdf · 2014. 1. 15. · Wörterbücher Textedition Zettel Artikel Basistext Annotation Auswertung

Forschungsumgebungdezentral und modularisiert

• Basistext ist fester Bezugspunkt für alle

• Annotationen und Auswertungen unabhängig von Raum & Zeit

• Keine zentrale Kontrollinstanz notwendig

• Präsentation der Daten (“Dienste”) unabhängig von den Daten