Le syntagme vietnamien

  • View
    213

  • Download
    0

Embed Size (px)

Text of Le syntagme vietnamien

  • Le syntagme vietnamien

    Philippe Lambert

    To cite this version:

    Philippe Lambert. Le syntagme vietnamien. Ecole thematique. Semaine NooJ a lInalco,INALCO, 2012.

    HAL Id: cel-00677777

    https://cel.archives-ouvertes.fr/cel-00677777

    Submitted on 9 Mar 2012

    HAL is a multi-disciplinary open accessarchive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come fromteaching and research institutions in France orabroad, or from public or private research centers.

    Larchive ouverte pluridisciplinaire HAL, estdestinee au depot et a la diffusion de documentsscientifiques de niveau recherche, publies ou non,emanant des etablissements denseignement et derecherche francais ou etrangers, des laboratoirespublics ou prives.

    https://hal.archives-ouvertes.frhttps://cel.archives-ouvertes.fr/cel-00677777

  • Le syntagme nominal vietnamien

    Philippe Lambert Institut Jean Lamour, Nancy ASIES (Inalco)

    philippe.lambert@ijl.nancy-universite.fr

    Journe NooJ 2012

  • Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    PLAN

    1. CONTEXTE 2. PROBLEMATIQUE 3. LE SYNTAGME NOMINAL EN VIETNAMIEN 4. LE SN DANS VIET4NooJ 5. CONCLUSION

    Journe NooJ 2012

  • Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Journe NooJ 2012

    Chinois classique (Ch Hn)

    (1000 avant J.C env. 1000 aprs J.C. env.)

    Ecriture dmotique vietnamienne (Ch Nm)

    (Du 10me sicle aprs J.C. au dbut 20me sicle aprs J.C.) Langue nationale romanise (Quc ng ) (Du 17me sicle maintenant)

  • Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Journe NooJ 2012

    La langue vietnamienne : criture et phontique 41 phonmes 23 consonnes 13 voyelles simples 3 diphtongues 2 semi-voyelles 29 lettres Aa Bb Cc Dd Ee Gg Hh Ii Kk Ll Mm Nn Oo Pp Qq Rr Ss Tt Uu Vv Xx Yy

    6 tons

  • Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    La langue vietnamienne :

    Isolante Mots invariables Monosyllabique : ex. : Anh i ch - 3 mots, 3 morphmes, 3 syllabes

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Formalisation TAL du vietnamien

    Problme :

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Viet 4

    NooJ

    Dictionnaire (+40300 entres) Grammaires (+ vingtaine : entits nommes, brevets, etc.)

    L Vn L Description de la langue Logique combinatoire

    19

    48

    Nguyn Kim Thn, Nguyn Ti Cn, Trn Cht, L Xun Thi, Lu Vn Lang, Hong

    Tu, Hong Ph

    Approche smantico-syntaxique

    -> classes de mots

    19

    83

    Choix de catgories pour ltiquetage

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Le syntagme nominal vietnamien

    Numral Classificateur Substantif Qualificatif Dmonstratif

    - 2 - 1 0 +1 +2

    Mot de totalit

    Quantificateur classificateur Spcificatif Nom Complment (nom, adj.,

    verbe) Dmonstratif

    Ba Trois

    Con [class. anim]

    Mo chat

    Mun noir

    Kia L-bas

    Ces trois chats noirs

    Tt c Totalit

    nm cinq

    ci [Class. Inanim]

    quyn [spcif. livres]

    sch livre

    c ancien

    ny ces

    Tous ces cinq vieux livres-ci

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Le syntagme nominal vietnamien

    Mot de totalit

    Quantificateur classificateur Spcificatif Nom Complment (nom, adj.,

    verbe) Dmonstratif

    Une approche cognitive ontologique

    Anim / inanim

    Forme / nature

    substantif

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Le syntagme nominal vietnamien

    Mot de totalit

    Quantificateur classificateur Nom 1 Nom 2 Complment (nom, adj.,

    verbe) Dmonstratif

    Diffrentes coles -> approche fonctionnaliste

    Chercheurs TAL Hanoi Loria/ Nancy : Classificateur = spcificatif = nom individuel (L Hng Phng, Elaboration dun composant syntaxique base de grammaires, thse de doctorat, Loria, Nancy, 2010)

    ou Nom Unit : rserv aux noms dsignant une unit de mesure ou une entit. o natural : Les classificateurs dindividus portent cette valeur, par ex. con = , bc = , o conventional : units de mesure conventionnelles ou scientifiques, par ex. mt = mtre, gi = heure, nhm = pince, ho = centime, o collective : Les classificateurs des collectifs portent cette valeur, par ex. nhm = groupe, ton = troupeau, i = couple, chc = dizaine. o administrative : units administratives, par ex. tnh = province, x = commune, ngnh = division, mn = discipline (Nguyn Th Minh Huyn, Outils et ressources linguistiques pour l'alignement de textes multilingues franais-vietnamiens, thse de doctorat, Loria, Nancy, 2006)

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    4. LE SN dans VIET4NooJ

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Mot de totalit

    Quantificateur classificateur Spcificatif Nom Complment (nom, adj.,

    verbe) Dmonstratif

    Tt c Totalit

    nm cinq

    ci [Class. Inanim]

    quyn [spcif. livres]

    sch livre

    c ancien

    ny ces

    Tous ces cinq vieux livres-ci

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Un choix pragmatique et gnraliste : ltiquette

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Grammaire pour ltiquetage des noms :

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Test sur un corpus :

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    La grammaire du syntagme nominal:

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Les grammaires du syntagme nominal:

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Extraction des variables partir du corpus test :

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Elments bibliographiques

    [1] B. Q. Ho, Vers une indexation structure base sur des syntagmes nominaux (impact sur un SRI en vietnamien et la RI multilingue), 2004. [2] P. T. Nguyen, X. L. Vu, T. M. H. Nguyen, V. H. Nguyen, and H. P. Le, Building a large syntactically-annotated corpus of Vietnamese, in Proceedings of the Third Linguistic Annotation Workshop, 2009, pp. 182185. [3] T. M. H. Nguyen, Outils et ressources linguistiques pour lalignement de textes multilingues franais-vietnamiens, 2006. [4] H. P. Le, T. M. H. Nguyen, A. Roussanaly, and T. V. Ho, A hybrid approach to word segmentation of Vietnamese texts, 2008.

  • Journe NooJ 2012

    Contexte Problmatique Le SN viet. Le SN et Viet4NooJ

    Merci ! Xin cm n !