S©mantique lexicale et TALN Vecteur conceptuels et apprentissage

  • View
    35

  • Download
    0

Embed Size (px)

DESCRIPTION

Sémantique lexicale et TALN Vecteur conceptuels et apprentissage. Mathieu Lafourcade LIRMM - France www.lirmm.fr/~lafourca. Objectifs. Analyse sémantique Désambiguïsation de Sens Indexation de Textes en RI Transfert Lexical en TA Modèle de Vecteurs Conceptuels (MVC) Réminiscences - PowerPoint PPT Presentation

Text of S©mantique lexicale et TALN Vecteur conceptuels et apprentissage

  • Smantique lexicale et TALN Vecteur conceptuels et apprentissageMathieu LafourcadeLIRMM - France

    www.lirmm.fr/~lafourca

  • ObjectifsAnalyse smantiqueDsambigusation de SensIndexation de Textes en RITransfert Lexical en TAModle de Vecteurs Conceptuels (MVC)RminiscencesModles vectoriels lexicaux (Salton)Modles conceptuels (Sowa)Concepts (et non des termes)Ensemble E choisi a priori (petit) / par mergence (grand)Concepts interdpendantsPropagation sur arbre danalyse morpho-syntaxique (pas danalyse de surface)

  • Vecteurs conceptuelsUne ide= combinaison linaire de concepts= un vecteurLespace des ides= espace vectoriel (que lon ne connat pas a priori - dont on se moque a posteriori --> pas de rduction de dimension)Un concept= une ide = un vecteur = combinaison de lui-mme + voisinage

    Comment choisir les concepts ?

  • Vecteurs conceptuelsEnsemble de k conceptsThesaurus Larousse = 873 concepts--> Un vecteur = 873 upletThesaurus Rodget = 1047 concepts--> Un vecteur = 1047 uplet EDR (Japon) --> 40000 conceptsEspace des sens = espace vectoriel + ensemble de vecteurs

  • Vecteurs conceptuelsExemple : chatNoyau dont lindexation est manuelle c:mammifre, c:caresse

    Augmentc: mammifre, c:caresse, c:zoologie, c:amour

    itration --> affinage des vecteurs selon le voisinageVecteurs sans aucun zro--> danger ! Avoir des vecteurs trop plats

  • Espace vectorielLes conceptsNe sont pas indpendantsEspace des sens = Espace gnrateur dun espace V de dim k (inconnue)= k
  • Exprience TH873 Thesaurus LarousseH : hirarchie des concepts K concepts feuilles (K = 873)C0 = racine , c1, c2 , c3, c4 = feuilles

    V(Ci) : aj = 1/ (2 ^ Dum(H, i, j)) Dum= distance ultramtrique

    1/411/41/41/161/161/641/64264

  • Vecteurs conceptuels TH873 Concept c4:PAIXc4:Paix

    C2:Relation hirarchiquesC3:Relations de conflitC1:Le Monde , C1:LHommeC1:La Socit

    Graph1

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    921

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    3687

    3687

    3687

    7375

    3687

    3687

    1843

    1843

    1843

    1843

    1843

    1843

    1843

    1843

    1843

    1843

    1843

    1843

    1843

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229

    1229