Upload
bobby
View
34
Download
0
Embed Size (px)
DESCRIPTION
3rd International Conference on Arabic Language Processing - CITALA 2009 – May 4th – 5th 2009, Rabat, Morocco. Étude et analyse des relatives de la langue arabe en HPSG et LKB. Inès ZALILA & Kais HADDAR. MIRACL, Faculté des sciences de Sfax, Tunisie. Introduction. - PowerPoint PPT Presentation
Citation preview
Étude et analyse des relatives de la langue arabe
en HPSG et LKB
Inès ZALILA & Kais HADDAR
3rd International Conference on Arabic Language Processing - CITALA 2009 –
May 4th – 5th 2009, Rabat, Morocco
MIRACL, Faculté des sciences de Sfax, Tunisie
2
Traitement Automatique des Langues Naturelles
Applications informatiques pour traiter automatiquement les langues naturelles
Phase d’analyse de la source
morphologique syntaxique sémantique pragmatiquelexicale Analyse Syntaxique
Introduction
Étude des règles pour une bonne formation des phrases
2/38
3
...Introduction
Le phénomène des relatives ( الموصولي (المركب
fréquent
existant dans toutes les langues
centre d’intérêt pour plusieurs chercheurs
L’analyse syntaxique est une phase délicate
partie modélisation
partie implémentation
Simplifier la phase de construction d’un analyseur syntaxique (i.e., outils de génération, heuristiques)
Insuffisance des recherches pour l’analyse syntaxique des relatives arabes
Interaction avec les phénomènes linguistiques
Diversité des formes possibles des phrases relatives
Complexité de la structure des phrases relatives
3/38
4
Objectifs
Spécifier en TDL une grammaire HPSG pour les
relatives arabes
Étudier et dégager la typologie des phrases relatives
détailler les schémas traitant les relatives arabes
Spécifier en TDL la grammaire élaborée
Expérimenter avec la plate-forme linguistique LKB
4/38
5
PLAN
Introduction
État de l’art
Typologie de la phrase relative arabe
HPSG pour les relatives arabes
Spécification TDL de la grammaire conçue
Expérimentation avec LKB et évaluation
Conclusion et perspectives5/38
6
État de l’art
La construction d’un analyseur syntaxique à partir d’une grammaire élaborée
Génération automatique
Construction propre
(Elleuch , 2004) et (Mâaloul , 2005) (Garcia, 2005), (Laurens, 2007) et (Loukam and Laskri, 2007)
Extensibilité du code
Maintenance facile
Choix de la démarche d’analyse (ascendante, descendante)
Ergonomie de l’interface
Résultats non robustes
Maintenance difficile
Extensibilité difficile
Entrées et Sorties sont bien définies
Coût moins cher (temps et efforts)
Ergonomie testée
Résultats robustes
6/38
7
PLAN
Introduction
État de l’art
Typologie de la phrase relative arabe
HPSG pour les relatives arabes
Spécification TDL de la grammaire conçue
Expérimentation avec LKB et évaluation
Conclusion et perspectives7/38
8
Typologie de la phrase relative arabe
La proposition relative en Arabe ( المركب(الموصولي
Les noms conjonctifs arabes
, , , , , التي, الذي لو أن أن8 من ... ,ما
Joindre un nom conjonctif à une proposition verbale
ou nominale
إلى سافر االمتحان في نجح الذي الولد فرنسا
8/38
9
...Typologie de la phrase relative arabe
Une hiérarchie de type inspirée de la théorie grammaticale ancienne (Dahdah A., 1992), (Abdelwahed A., 2004) et des travaux de recherche antérieurs (Boukédi, 2008)
Signe
SyntagmeMot
PrépositionnelVerbal Nominal
Nom
Décliné Non décliné
Particule
opérativeNon opérative
Verbe
QuadrilitèreTrilitère
9/38
10
...Typologie de la phrase relative arabe
Un nom conjonctif est un nom
Nom
Décliné Non décliné
VariableNon variablePronomNon significatif
Pr. Démonstratif
Prépositionnel
Agissant sur les noms
Agissant sur les verbes
Nominal
Commun
SpécifiéPr. Relatif
PrépositionnelNominal
Ag. nomsAg. verbesCommunSpécifié
non décliné non significatif
Répartition selon leur fonction
10/38
11
...Typologie de la phrase relative arabe
Typologie
Exigent l’existence d’une proposition verbale juste après
le nom conjonctif
Nom conjonctif nominal spécifié
Nom conjonctif nominal commun à l’exception de « « أّي
Nom conjonctif prépositionnel agissant sur les verbes
Exigent l’existence d’une proposition nominale juste après
le nom conjonctif
Nom conjonctif prépositionnel agissant sur les noms
Nom conjonctif commun « « أّي
Basée sur la nature de la proposition qui suit le nom
conjonctif
11/38
12
...Typologie de la phrase relative arabe
1) Forme 1
Nom conjonctif (forme1) + une proposition verbale
Nom conjonctif (forme2) + une proposition nominale
األب مريض أن8أوضح الولد
L’enfant [qui [a réussi dans l’examen]] a voyagé a France
سافر الذيالولد االمتحان في نجحفرنسا إلى
Le père a déclaré [que [l’enfant est malade]]
2) Forme 2
12/38
13
PLAN
Introduction
État de l’art
Typologie de la phrase relative arabe
HPSG pour les relatives arabes
Spécification TDL de la grammaire conçue
Expérimentation sur LKB et évaluation
Conclusion et perspectives13/38
14
HPSG pour les relatives arabes
HPSG (Head-driven Phrase Structure Grammar) (Sag,
1994)
Théorie d’unification évoluée à base de contraintes
Modélisation de principes grammaticaux universels
Richesse des entrées lexicales
14/38
15
La structure de base de HPSG est la structure de traits typés
Chaque trait décrit un type d’information bien déterminé
PHON < >
SS LOC
NONLOC
CONT
CAT VALENCE
S-ARG <>
TETE MAJ
SLASH
IND
...HPSG pour les relatives arabes
15/38
PHON < ذّيال >
SS LOC
CAT
CONT
TETE
VAL
MAJ اسم
NFORM مبني
NAT مبهم
DEFINI –
RFORM اسمي
RTYPE خاص
SPEC SV:
DEC مبني
SPR< SN >COMPS < >
1
INDPer 3e
GEN masc
NOMB sing
2
...HPSG pour les relatives arabes
Exemple de SAV
16/38
17
PHON < #أن>
SS LOC
CAT TETE
VAL
MAJ اسم
NFORM مبني
NAT مبهم
DEFINI –
RFORM حرفي
RTYPE على عاملاالسم
SPEC SN(DEC منصوب):
DEC مبني
SPR< >COMPS < >
2
...HPSG pour les relatives arabes
17/38
18
Schéma de marquage
Décomposition des phrases : basée sur des schémas standards ( schémas de Domination Immédiate (DI))
Le schéma de marquage pour traiter les relatives
LOC 1
VAL < >
MARQUE 3
2
SS CAT TETE
2
VAL < >CATLOC SS 4
TETE 1
MARQUE 3
LOC
VAL < >
SS CAT TÊTE marqueur [SPEC ]4
Fils tête Fils marqueur
...HPSG pour les relatives arabes
18/38
Forme 1
LOC 1
VAL < >
MARQUE 3
2
SS CAT TETE
2
VAL < >CATLOC SS
4 TETE 1
MARQUE 3
LOC
VAL < >
SS CAT TÊTE marqueur [SPEC ]4
Fils têteFils marqueur
PHON < في نجح الذي < االمتحان
PHON < االمتحان في < نجحPHON < الذي >
...HPSG pour les relatives arabes
19/38
20
Forme 2
LOC 1
VAL < >
MARQUE 3
2
SS CAT TETE
2
VAL < >CATLOC SS
4TETE 1
MARQUE 3
LOC
VAL < >
SS CAT TÊTE marqueur [SPEC ]4
Fils têteFils marqueur
PHON < مريض الولد < أن8
PHON < مريض < الولدPHON < 8أن >
...HPSG pour les relatives arabes
20/38
21
Schéma de modification
Le schéma de modification : traite le phénomène des relatives
LOC 1
VAL < >
MARQUE 3
2
SS CAT TETE
LOC
VAL < >
SS CAT TÊTE [MOD ]3
Fils modifieur
...HPSG pour les relatives arabes
2
VAL < >CATLOC SS 3
TETE 1
Fils tête
21/38
22
LOC 1
VAL < >
MARQUE 3
2
SS CAT TETE
LOC
VAL < >
SS CAT TÊTE [MOD ]3
Fils modifieur
...HPSG pour les relatives arabes
2
VAL < >CATLOC SS
3TETE 1
Fils tête
PHON < في نجح الذي الولد < االمتحان
PHON < الولد > PHON < في نجح الذي < االمتحان
22/38
23
PLAN
Introduction
État de l’art
Typologie de la phrase relative arabe
HPSG pour les relatives arabes
Spécification TDL de la grammaire conçue
Expérimentation avec LKB et évaluation
Conclusion et perspectives23/38
Spécification TDL de la grammaire conçue
TDL (Type Description Langage) est similaire à la
représentation HPSG
Opérateur Fonction
& Adjonction des contraintes sur des types
# [a..z] Indexation des structures
: = L’élément à gauche est une instance de celui de droite
[ ] Définition d’une structure de trait
< > Définition d’une liste
, Séparation des couples attribut-valeur dans une SAV
. Fin d’une description de type
24/38
25
PHON < ذيال >
SS LOC
CAT
CONT
TETE
VAL
MAJ اسم
NFORM مبني
NAT مبهم
DEFINI –
RFORM اسمي
RTYPE خاص
SPEC فعل
DEC مبني
SPR<SN(masc,sing,3e)>
COMPS < >
INDGEN mascNOMB singPER 3e
‘aalladhy := lex-nom-non-decline
[PHON <! “’aalladhy" !>, SS [LOC [CAT. TETE[ MAJ nom, NFORM nondecliné, NAT nonsignificatif, DEFINI non, RFORM nominal, RTYPE specifié, SPEC < SS.LOC.TETE verbe >, DEC saturé],
VAL [ SPR < SS.LOC.TETE nom >, COMPS < [ ] >],
CONT [ GEN masc, NOMB sing, PER 3e]]]].
…Spécification TDL de la grammaire conçue
Spécification d’une SAV
25/38
26
VAL < >
1TÊTE
MARQUE 3
2
TÊTE
VAL < >
1
24
TÊTE marqueur [ SPEC ]4
VAL < >
MARQUE 3
regle-marquage :=
regle-bin-t-fin &
[SS.LOC.
CAT [ VAL [ ],
MARQUE #marque],
BRS [
BRS-NTETE
< [SS.LOC.CAT [TETE relatif
&[SPEC #tete]
MARQUE
#marque]] >,
BR-TETE [SS #tete &
[LOC.CAT [ VAL [] ]] ]
]].
…Spécification TDL de la grammaire conçue
Spécification d’un schéma DI
26/38
27
PLAN
Introduction
État de l’art
Typologie de la phrase relative arabe
HPSG pour les relatives arabes
Spécification TDL de la grammaire conçue
Expérimentation avec LKB et évaluation
Conclusion et perspectives27/38
28
Expérimentation avec LKB et évaluation
LKB (Linguistic Knowledge Building) (Ann Copestake,
02) est un environnement de développement
Chargement des grammaires implémentées en TDL
Fabriquée en LISP
Fichiers LISP (i.e., script.lsp)
Fichiers TDL (i.e., type.tdl, lexique.tdl, regle_syn.tdl)
28/38
29
...Expérimentation avec LKB et évaluation
Expérimentation sur LKB
29/38
30
Fichier in : « test.txt » Fichier out : « resultat.txt »
...Expérimentation avec LKB et évaluation
30/38
31
La grammaire est expérimentée sur
Corpus de 300 phrases
Phrases relatives de différentes formes
Interaction avec différents phénomènes linguistiques
syntagme d’annexion
syntagme descriptif
syntagme de subordination
800 mots
...Expérimentation avec LKB et évaluation
31/38
32
...Expérimentation avec LKB et évaluation
93 % des phrases sont analysées correctement
Nbre d’analyse
(n)
Nbre de phrasesayant n
analyse(s)
0 14
1 174
2 10
> 2 2
200
32/38
33
...Expérimentation avec LKB et évaluation
Absence de règles syntaxiques pour des phénomènes
linguistiques
Interaction entre les différents phénomènes linguistiques
33/38
34
PLAN
Introduction
État de l’art
Typologie de la phrase relative arabe
HPSG pour les relatives arabes
Spécification TDL de la grammaire conçue
Expérimentation avec LKB et évaluation
Conclusion et perspectives34/38
35
Conclusion et perspectives
Proposition d’une typologie des relatives pour l’Arabe
Étude du phénomène des relatives en Arabe
Étendre la grammaire HPSG pour couvrir les relatives
arabes
Expérimentation de la grammaire conçue avec LKB
Spécification TDL de la grammaire HPSG conçue
35/38
36
...Conclusion et perspectives
Enrichir le lexique pour une meilleure couverture lexicale
Détailler des schémas HPSG pour couvrir les
phénomènes linguistiques arabes
Tester l’ analyseur syntaxique sur d’autres types de
corpus
Concevoir d’autres modules
36/38
37
Merci
Pour
votre attention
...Expérimentation avec LKB et évaluation
Module de translittération automatique