1 / 38

Étude et analyse des relatives de la langue arabe en HPSG et LKB

3rd International Conference on Arabic Language Processing - CITALA 2009 – May 4th – 5th 2009, Rabat, Morocco. Étude et analyse des relatives de la langue arabe en HPSG et LKB. Inès ZALILA & Kais HADDAR. MIRACL, Faculté des sciences de Sfax, Tunisie. Introduction.

bobby
Télécharger la présentation

Étude et analyse des relatives de la langue arabe en HPSG et LKB

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 3rd International Conference on Arabic Language Processing - CITALA 2009 – May 4th – 5th 2009, Rabat, Morocco Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR MIRACL, Faculté des sciences de Sfax, Tunisie

  2. Introduction Traitement Automatique des Langues Naturelles Applications informatiques pour traiter automatiquement les langues naturelles Phase d’analyse de la source Analyse Syntaxique lexicale morphologique syntaxique sémantique pragmatique Étude des règles pour une bonne formation des phrases 2/38 2

  3. ...Introduction • Le phénomène des relatives ( المركب الموصولي) • fréquent • existant dans toutes les langues • centre d’intérêt pour plusieurs chercheurs • L’analyse syntaxique est une phase délicate • Insuffisance des recherches pour l’analyse syntaxique des relatives arabes • partie modélisation • partie implémentation • Complexité de la structure des phrases relatives • Simplifier la phase de construction d’un analyseur syntaxique (i.e., outils de génération, heuristiques) • Interaction avec les phénomènes linguistiques • Diversité des formes possibles des phrases relatives 3/38 3

  4. Objectifs • Spécifier en TDL une grammaire HPSG pour les relatives arabes • Étudier et dégager la typologie des phrases relatives • détailler les schémas traitant les relatives arabes • Spécifier en TDL la grammaire élaborée • Expérimenter avec la plate-forme linguistique LKB 4/38 4

  5. PLAN • Introduction • État de l’art • Typologie de la phrase relative arabe • HPSG pour les relatives arabes • Spécification TDL de la grammaire conçue • Expérimentation avec LKB et évaluation • Conclusion et perspectives 5/38 5

  6. État de l’art La construction d’un analyseur syntaxique à partir d’une grammaire élaborée • Construction propre  Génération automatique • Extensibilité du code •  Maintenance facile • Choix de la démarche d’analyse (ascendante, descendante) • Ergonomie de l’interface • Résultats non robustes • Maintenance difficile • Extensibilité difficile • Entrées et Sorties sont bien définies • Coût moins cher (temps et efforts) • Ergonomie testée • Résultats robustes (Garcia, 2005), (Laurens, 2007) et (Loukam and Laskri, 2007) (Elleuch , 2004) et (Mâaloul , 2005) 6/38 6

  7. PLAN • Introduction • État de l’art • Typologie de la phrase relative arabe • HPSG pour les relatives arabes • Spécification TDL de la grammaire conçue • Expérimentation avec LKB et évaluation • Conclusion et perspectives 7/38 7

  8. Typologie de la phrase relative arabe • La proposition relative en Arabe (المركب الموصولي) • Joindre un nom conjonctif à une proposition verbale ou nominale الولد الذي نجح في الامتحان سافر إلى فرنسا • Les noms conjonctifs arabes  ما, من, أنَّ, أن, لو, الذي, التي, ... 8/38

  9. ...Typologie de la phrase relative arabe Verbe Particule Nom Décliné Quadrilitère opérative Non décliné Trilitère Non opérative • Une hiérarchie de type inspirée de la théorie grammaticale ancienne (Dahdah A., 1992), (Abdelwahed A., 2004) et des travaux de recherche antérieurs (Boukédi, 2008) Signe Mot Syntagme Verbal Prépositionnel Nominal 9/38 9

  10. ...Typologie de la phrase relative arabe Pr. Relatif Nominal Prépositionnel Ag. noms Commun Ag. verbes Spécifié • Un nom conjonctif est un nom non décliné non significatif • Répartition selon leur fonction • Prépositionnel • Agissant sur les noms • Agissant sur les verbes • Nominal • Commun • Spécifié Nom Non décliné Décliné Non significatif Non variable Variable Pronom Pr. Démonstratif 10/38

  11. ...Typologie de la phrase relative arabe • Typologie • Basée sur la nature de la proposition qui suit le nom conjonctif • Exigent l’existence d’une proposition verbale juste après le nom conjonctif • Nom conjonctif nominal spécifié • Nom conjonctif nominal commun à l’exception de « أيّ » • Nom conjonctif prépositionnel agissant sur les verbes • Exigent l’existence d’une proposition nominale juste après le nom conjonctif • Nom conjonctif prépositionnel agissant sur les noms • Nom conjonctif commun « أيّ » 11/38

  12. ...Typologie de la phrase relative arabe Forme 1 • Nom conjonctif (forme1) + une proposition verbale الولد الذي نجح في الامتحان سافر إلى فرنسا L’enfant [qui [a réussi dans l’examen]] a voyagé a France Forme 2 • Nom conjonctif (forme2) + une proposition nominale أوضح الأب أنَّ الولد مريض Le père a déclaré [que [l’enfant est malade]] 12/38 12

  13. PLAN • Introduction • État de l’art • Typologie de la phrase relative arabe • HPSG pour les relatives arabes • Spécification TDL de la grammaire conçue • Expérimentation sur LKB et évaluation • Conclusion et perspectives 13/38 13

  14. HPSG pour les relatives arabes • HPSG (Head-driven Phrase Structure Grammar) (Sag, 1994) • Théorie d’unification évoluée à base de contraintes • Modélisation de principes grammaticaux universels • Richesse des entrées lexicales 14/38

  15. ...HPSG pour les relatives arabes • La structure de base de HPSG est la structure de traits typés PHON < > TETE MAJ CAT VALENCE LOC S-ARG <> SS CONT IND SLASH NONLOC • Chaque trait décrit un type d’information bien déterminé 15/38 15

  16. ...HPSG pour les relatives arabes Exemple de SAV PHON < الذي> MAJ اسم NFORM ﻤﺒﻧﻲ NAT ﻤﺑﻬﻢ DEFINI – RFORM اسمي RTYPE خاص SPEC SV: DEC مبني CAT TETE SS LOC 2 VAL 1 SPR< SN> COMPS < > Per 3e GEN masc NOMB sing IND CONT 16/38

  17. ...HPSG pour les relatives arabes PHON < أنَّ> MAJ اسم NFORM ﻤﺒﻧﻲ NAT ﻤﺑﻬﻢ DEFINI – RFORM حرفي RTYPEعامل على الاسم SPEC SN(DEC منصوب): DEC مبني CAT TETE SS LOC 2 VAL SPR< > COMPS < > 17/38 17

  18. ...HPSG pour les relatives arabes • Décomposition des phrases : basée sur des schémas standards ( schémas de Domination Immédiate (DI)) • Le schéma de marquage pour traiter les relatives • Schéma de marquage 1 TETE SS LOC CAT Fils marqueur VAL < > Fils tête 2 MARQUE 3 SS TÊTE marqueur [SPEC ] 4 LOC CAT TETE 1 4 SS LOC CAT VAL < > VAL < > 2 MARQUE 3 18/38 18

  19. ...HPSG pour les relatives arabes • Forme 1 PHON < الذي نجح في الامتحان > 1 TETE SS LOC CAT VAL < > Fils marqueur 2 MARQUE Fils tête 3 PHON < الذي > PHON< نجح في الامتحان > SS TÊTE marqueur [SPEC ] 4 LOC CAT TETE 4 1 VAL < > SS LOC CAT VAL < > 2 MARQUE 3 19/38

  20. ...HPSG pour les relatives arabes • Forme 2 PHON < أنَّ الولد مريض > 1 TETE SS LOC CAT VAL < > Fils marqueur 2 MARQUE Fils tête 3 PHON < أنَّ > PHON< الولد مريض> SS TÊTE marqueur [SPEC ] 4 LOC CAT 4 TETE 1 VAL < > SS LOC CAT VAL < > 2 MARQUE 3 20/38 20

  21. ...HPSG pour les relatives arabes • Le schéma de modification : traite le phénomène des relatives • Schéma de modification 1 TETE SS LOC CAT VAL < > 2 Fils tête Fils modifieur MARQUE 3 SS TÊTE [MOD ] LOC CAT 3 TETE 1 3 SS LOC CAT VAL < > VAL < > 2 21/38 21

  22. ...HPSG pour les relatives arabes PHON < الولد الذي نجح في الامتحان > 1 TETE SS LOC CAT VAL < > 2 Fils tête Fils modifieur MARQUE 3 PHON < الذي نجح في الامتحان> PHON < الولد > 3 TETE 1 SS TÊTE [MOD ] LOC CAT 3 SS LOC CAT VAL < > VAL < > 2 22/38 22

  23. PLAN • Introduction • État de l’art • Typologie de la phrase relative arabe • HPSG pour les relatives arabes • Spécification TDL de la grammaire conçue • Expérimentation avec LKB et évaluation • Conclusion et perspectives 23/38 23

  24. Spécification TDL de la grammaire conçue • TDL (Type Description Langage) est similaire à la représentation HPSG 24/38

  25. …Spécification TDL de la grammaire conçue Spécification d’une SAV ‘aalladhy := lex-nom-non-decline [PHON <! “’aalladhy" !>, SS [LOC [CAT. TETE[ MAJ nom, NFORM nondecliné, NAT nonsignificatif, DEFINI non, RFORM nominal, RTYPE specifié, SPEC < SS.LOC.TETE verbe >, DEC saturé], VAL [ SPR < SS.LOC.TETE nom >, COMPS < [ ] >], CONT [ GEN masc, NOMB sing, PER 3e]]]]. PHON < الذي> MAJ اسم NFORM ﻤﺒﻧﻲ NAT ﻤﺑﻬﻢ DEFINI – RFORM اسمي RTYPE خاص SPEC فعل DEC مبني TETE CAT SS LOC VAL SPR<SN(masc,sing,3e)> COMPS < > GEN masc NOMB sing PER 3e CONT IND 25/38 25

  26. …Spécification TDL de la grammaire conçue Spécification d’un schéma DI regle-marquage := regle-bin-t-fin & [SS.LOC. CAT [ VAL [ ], MARQUE #marque], BRS [ BRS-NTETE < [SS.LOC.CAT [TETE relatif &[SPEC #tete] MARQUE #marque]] >, BR-TETE [SS #tete & [LOC.CAT [ VAL [] ]] ] ]]. 1 TÊTE 2 VAL < > 3 MARQUE 4 TÊTE marqueur [ SPEC ] 1 TÊTE VAL < > 4 VAL< > 2 MARQUE 3 26/38 26

  27. PLAN • Introduction • État de l’art • Typologie de la phrase relative arabe • HPSG pour les relatives arabes • Spécification TDL de la grammaire conçue • Expérimentation avec LKB et évaluation • Conclusion et perspectives 27/38 27

  28. Expérimentation avec LKB et évaluation • LKB (Linguistic Knowledge Building) (Ann Copestake, 02) est un environnement de développement • Chargement des grammaires implémentées en TDL • Fabriquée en LISP • Fichiers TDL (i.e., type.tdl, lexique.tdl, regle_syn.tdl) • Fichiers LISP (i.e., script.lsp) 28/38 28

  29. ...Expérimentation avec LKB et évaluation  Expérimentation sur LKB 29/38 29

  30. ...Expérimentation avec LKB et évaluation • Fichier in : « test.txt » • Fichier out : « resultat.txt » 30/38 30

  31. ...Expérimentation avec LKB et évaluation • La grammaire est expérimentée sur • Corpus de 300 phrases • Phrases relatives de différentes formes • Interaction avec différents phénomènes linguistiques • syntagme d’annexion • syntagme descriptif • syntagme de subordination • 800 mots 31/38 31

  32. ...Expérimentation avec LKB et évaluation • 93 % des phrases sont analysées correctement 32/38 32

  33. ...Expérimentation avec LKB et évaluation • Absence de règles syntaxiques pour des phénomènes linguistiques • Interaction entre les différents phénomènes linguistiques 33/38 33

  34. PLAN • Introduction • État de l’art • Typologie de la phrase relative arabe • HPSG pour les relatives arabes • Spécification TDL de la grammaire conçue • Expérimentation avec LKB et évaluation • Conclusion et perspectives 34/38 34

  35. Conclusion et perspectives • Étude du phénomène des relatives en Arabe • Proposition d’une typologie des relatives pour l’Arabe • Étendre la grammaire HPSG pour couvrir les relatives arabes • Spécification TDL de la grammaire HPSG conçue • Expérimentation de la grammaire conçue avec LKB 35/38 35

  36. ...Conclusion et perspectives • Enrichir le lexique pour une meilleure couverture lexicale • Détailler des schémas HPSG pour couvrir les phénomènes linguistiques arabes • Tester l’ analyseur syntaxique sur d’autres types de corpus • Concevoir d’autres modules 36/38 36

  37. Merci Pour votre attention 37

  38. ...Expérimentation avec LKB et évaluation • Module de translittération automatique

More Related