1 / 50

TOTh’2014, 12/06/2014

TOTh’2014, 12/06/2014. Méthodologie d’ingénierie des connaissances pour la représentation des définitions lexicographiques dans le cadre de la théorie Sens-Texte. Maxime Lefrançois, Fabien Gandon , Alain Giboin Inria. Pourquoi étudier la Théorie Sens-Texte ?.

Télécharger la présentation

TOTh’2014, 12/06/2014

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. TOTh’2014, 12/06/2014 Méthodologie d’ingénierie des connaissances pour la représentation des définitions lexicographiques dans le cadre de la théorie Sens-Texte • Maxime Lefrançois, Fabien Gandon, Alain Giboin • Inria

  2. Pourquoi étudier la Théorie Sens-Texte ? • Approches en sémantique lexicale • 1. Sémantique décompositionnelle • 2. Sémantique componentielle3. Sémantique relationnelle Richesse de description • Besoin de formalisation • Besoin de plus de couverture • Besoin pour le TALN • Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  3. Postulats de base • - Différents niveaux de représentation • - Des règles de transformation entre les niveaux • Le lexique tient une place centrale • Le Dictionnaire Explicatif et Combinatoire (DEC) Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  4. Informatisation du DEC et DEC informatisé ex: éditeur DECID (Sérasset, 1997) Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  5. Informatisation du DEC et DEC informatisé • recherche intelligente d’information • mise à jour et vérification automatique • déduction logique • paraphrasage • déduction du premier ordre Ingénierie des connaissances représenter, manipuler, échanger, interroger, raisonner avec les connaissances,... Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  6. Question de recherche et méthodologie Quel formalisme de représentation des connaissances serait adapté à la représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte ? « Formalisation de la conceptualisation d’un domaine » 1. La conceptualisation est-elle adaptée à une formalisation ? 2. Quel formalisme est adapté à cette conceptualisation ? 3. Comment peut-on opérationnaliser ce formalisme ? Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  7. Plan de la présentation 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  8. 1.a. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  9. Exemple d’extension de conceptualisation Langage : Types d’ (instances d’) Unités linguistiques & Unités linguistiques Usage : Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  10. Introduction au DEC • zone phonologique • zone morphologique • zone sémantique • zone de combinatoire • zone de stylistique, • zone d’exemple, • zone phraséologique, • zone de nota bene 4 volumes papier = environ 500 entrées seulement principal sujet d’étude des linguistes de la Théorie Sens-Texte Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  11. Zone sémantique du DEC> les définitions lexicographiques • Travaux de conceptualisation existant • choix des composantes selon les catégories d’unités lexicales (ex: sentiments) • la structuration est importante pour le TAL (Wanner, MTT’ 2003) • composantes suggérées par des étiquettes sémantiques • symboles de PosASém choisies dans un petit ensemble (à la FrameNet) • structuration en XML (projet Definiens) Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  12. Zone sémantique du DEC> les définitions lexicographiques Degré de formalisation non atteint aujourd’hui Conceptualisation espérée (dans la littérature): Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  13. Prédicats linguistiques • Type d’unité sémantique Positions actancielles • Type d’unité lexicale • Structure actancielle sémantique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  14. Prédicats linguistiques • Type d’unité sémantique Positions actancielles • Type d’unité lexicale • Structure actancielle sémantique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  15. Prédicats linguistiques • Type d’unité sémantique • Structure actancielle = Extension de la conceptualisation • Type d’unité lexicale • Structure actancielle sémantique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  16. Prédicats linguistiques • Type d’unité sémantique • Structure actancielle = Positions actantielles sémantiques: = Les participants de la situation linguistique dénotée par L qui ont une position privilégiées auprès de L dans les phrases + critères linguistiques ! • Type d’unité lexicale • Structure actancielle sémantique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  17. Prédicats linguistiques • Type d’unité sémantique • Structure actancielle = • Type d’unité lexicale • Structure actancielle sémantique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  18. Héritage du sens • et spécialisation • des structures actancielles ? Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  19. Héritage du sens • et spécialisation • des structures actancielles ? contre-exemple 1. • (outil) • PosA 1 – personne qui utilise l’outil • PosA 2 – une activité ou une profession • (ciseaux) • PosA 1 – personne qui utilise l’outil • PosA 2 – l’objet à couper Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  20. Héritage du sens • et spécialisation • des structures actancielles ? contre-exemple 2. • (ustensile) • PosA 1 – personne qui utilise l’ustensile • PosA 2 – une activité • (bouilloire) • PosA 1 – personne qui utilise l’outil • PosA 2 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  21. Le niveau Sémantique Profond Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  22. Le niveau Sémantique Profond • introduction d’une notation /outil\ • définition de la structure actancielle sémantique profonde • choix des Symboles d’Actants: des rôles sémantiques lexicalisés • introduction des positions actancielles interdites SémP SémS • Héritage du sens • et spécialisation • des structures actancielles Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  23. 1.b. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  24. Définitions lexicographiques ? Application au projet RELIEF (Lux-Pogodalla et Polguère, WoLeR’2009) Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  25. Repositionnement> 1. au niveau sémantique profond Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  26. Repositionnement> 2. au niveau du dictionnaire Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  27. Prototype d’éditeur de définitionslexicographiques avec la conceptualisationétendue Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  28. Prototype d’éditeur de définitionslexicographiques avec la conceptualisationétendue Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  29. Prototype d’éditeur de définitionslexicographiques avec la conceptualisationétendue Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  30. Prototype d’éditeur de définitionslexicographiques avec la conceptualisationétendue Offre une première base de discussion essentielle Confirme les attentes des lexicographes pour un tel outil Permet d’identifier des directions d’amélioration possible Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  31. 2.a. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  32. Formalismes candidats Théorie Linguistique Sens-Texte Grammaires de dépendance 65 Graphes Conceptuels Web Sémantique & Logiques de description • Critères de choix de (Gruber, 1995) • clarté • cohérence • extensibilité • minimalité de la déformation d’encodage • minimalité de l’engagement ontologique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  33. Le Formalisme des Graphes d’Unités • un formalisme à base de graphes • inspiré des Graphes Conceptuels • construit pour la théorie Sens-Texte Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  34. 2.b. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  35. Hiérarchie des types d’unités> Objectif • Un type d’unité hérite la structure actancielle de ses parents • et peut la spécialiser • PosA optionnelle  obligatoire • PosA optionnelle  interdite • spécialisation des signatures Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  36. Hiérarchie des types d’unités> Solution: types primitifs d’unités hiérarchie des types primitifs = superposition intriquée de telles structures • Pour un symbole d’actant s • le radix de s introduit une PosAs • l’obligat de s rend la PosAsobligatoire • le prohibet de s rend la PosAsinterdite Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  37. Graphes d’Unités Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  38. Règles de graphes d’unités une hypothèse une conclusion des nœuds frontière Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  39. Définitions de types d’unités= deux règles contraposées Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  40. 3.a. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  41. Objectifs du raisonnement • Critères de choix de (Gruber, 1995) • clarté • cohérence • extensibilité • minimalité de la déformation d’encodage • minimalité de l’engagement ontologique ? Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  42. Sémantique logique Théorie des modèles & Algèbre relationnelle G implique H = pour tout modèle M qui satisfait G, il existe un modèle qui satisfait H Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  43. Déduction logique Règles d’inférence & Dérivation logique H peut être déduit de G = H peut être projeté sur un graphe d’unité dérivé de G Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  44. Décidabilité de la déduction logique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST • Condition suffisante: Expansion finie • des conditions d’acyclicité • sur la hiérarchie des types d’unités • sur les définitions lexicographiques • Les lexicographes de la Théorie Sens-Texte s’imposaient déjà ces conditions par intuition

  45. 3.b. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  46. Standards du web sémantique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  47. Modèle: OWL 2 RL, deux modèles différents, • mais interopérables Alignement avec ontolex Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  48. Conclusions Théorie Sens-Texte Ingénierie des connaissances représenter, manipuler, échanger, interroger, raisonner avec les connaissances,... Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  49. Conclusions Conceptualisation Représentation Opérationnalisation t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

  50. Perspectives Choisir le formalisme Le Peupler L’Appliquer t Conceptualisation Représentation Opérationnalisation t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

More Related