200 likes | 361 Vues
Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel. Cyril Faucher 1 , Jean-Yves Lafaye 1 , Frédéric Bertrand 1 , Charles Teissèdre 2,3. 1 L3i, Université de La Rochelle, France cyril.faucher@univ-lr.fr
E N D
Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles Teissèdre2,3 1 L3i, Université de La Rochelle, France cyril.faucher@univ-lr.fr 2 MoDyCo - Université de Paris Ouest Nanterre La Défense – CNRS 3 Mondeca, France AFADL 2010 - du 9 au 11 juin 2010 – Poitiers Futuroscope Ce travail est financé par l’Agence Nationale de la Recherche (ANR-Contint, projet RelaxMultiMedias 2) 10es Journées Francophones Internationales sur les Approches Formelles dans l’Assistance au Développement de Logiciels)
Introduction • Chaîne d’acquisition de connaissances temporelles • A partir de textes (dépêches) • Produire une reformulation des informations saisies, dans un langage formel non ambigu, proche du langage naturel initial • => validation sémantique par l’utilisateur Sous forme de modèles Evénements + propriétés temporelles Texte libre Texte contrôlé
Plan • 1. Contexte et objectifs • 2. Workflow générique • 3. Modéliser des propriétés temporelles d’événements • 4. Acquisition et Modélisation de Connaissances Temporelles : chaîne TKAM • 5. Conclusion et perspectives
2 1. Contexte • Notion d’événements • Nature des événements: culturels, touristiques • Propriétés spatiales et temporelles • Récurrence et périodicité • Interopérabilité avec les standards du domaine (presse) • IPTC (NewsML, EventsML) • iCalendar
1. Contexte : utilisation de l’IDM • Utilisation de (Méta-) Modèles pivots pour assurer • l’interopérabilité d’applications métier (passerelles entre espaces techniques) • l’intégration de données hétérogènes • la vérification de l’intégrité d’instances / d’information • Exemple : transformation / reformulation / intégration Texte Libre SGBDR MODELE PIVOT Ontologie DSL (Domain SpecificLanguage) Langages formels, langages de preuve Texte contrôlé Langages de règles Applications
1. Objectifs • Représenter de manière intégrée des événements et leurs métadonnées • Assurer la persistance dans une base de données / connaissances • Aligner un modèle métier sur des ontologies existantes (donne accès à des raisonneurs, définit une sémantique de manière formelle et structurée) • Formuler des requêtes sur le Modèle Pivot, exécuter dans un autre espace (ex. base de connaissances) • Visualiser des ensembles de données conformes au Modèle Pivot dans des environnements ad hoc (SimileExhibit, Google Agenda, etc)
2. Workflow générique Métier : linguistique Modèle pivot Dépêches Texte contrôlé Texte Libre CU1 : Persistance Associer des propriétés temporelles aux Events Reformulation en langage naturel contrôlé à l’aide d’une grammaire formelle Extraction de connaissance Obtention de propriétés temporelles valides Représentation dans un DSL Représentation dans le modèle pivot Modèle linguistique : expressions temporelles pour les périodes d’accès CU2 : Résolution de requêtes Rechercher des expressions temporelles dans les bases Vérification de propriétés structurelle (invariant) et sémantique
3. Modéliser des propriétés temporelles d’événements : Comment ? • Deux types de représentations des occurrences d’événements • Concrète : un ensemble (extension) contenant des dates identifiables dans un calendrier (une granularité est fixée, le calendrier est défini sur une base annuelle) • Extension : { …, « de 2010-05-20T14:00:00 à 2010-05-20T16:00:00 », « de 2010-05-27T14:00:00 à 2010-05-27T16:00:00 », … } • Abstraite : une formule décrit en intension l’ensemble précédent • Particulièrement adapté aux événements périodiques ou pseudo périodiques (exceptions), et aussi aux événements définis relativement les uns par rapport aux autres • Intension[Carnap] : « tous les jeudis de mai de chaque année de 14h à 16h » « tous les jours 3 heures avant la basse mer »
3. Modéliser des propriétés temporelles d’événements : avec quel modèle ? • Modèle métier : DSL Modèle d’accessiblité [Battistelli, Teissèdre] • Modèle d’événement : métadonnées sur les événements (IPTC) • spatiales • temporelles • … • Modèles temporels existants • ISO 19108 standard : Time geometry: Instant, Period, Allen’s relations • iCalendar format : Periodic interval, Exception (+ periodic exception) • TimeML [Pustejovsky], OWL-Time [Pan] • Modèle temporel proposé • synthèse de l’ISO et d’iCalendar sous une forme objet • position relative (3 heures avant la basse mer) • une grammaire formelle
3. Modéliser des propriétés temporelles d’événements : Periodic Temporal Occurrence • Extension de l’ISO 19108 • Basé sur le concept de PeriodicRule Norme ISO 19108
3. Modéliser des propriétés temporelles d’événements : Position relative Définition d’un intervalle entre 2 expressions temporelles avec les relations d’Allen Expression relative: 3 heuresavant la BasseMer Allen’s relations 1
3. Un langage textuel contrôlé pour exprimer des propriétés temporelles • L’utilisateur saisie des expressions temporelles avec un éditeur contextuel • Techniques IDM : EMF, xText Peuplement Vue textuelle
3. Un langage textuel contrôlé pour exprimer des propriétés temporelles Temporal Model Grammar (xText) PeriodicRule : ('(identified by 'name=ID')')? (frequency=Frequency)? ('using a time span as ' validity+=PeriodicTimeSpan)* ('time extent ' ruleExtent=TM_Period )? ; FreqWithDurationRef : ( (times=INT 'times') | // times is fixed to 1 ('during one' referenceDuration=Duration 'period') | (times=INT 'times during one‘ referenceDuration=Duration 'period') ) ('and starts on' startTime=TM_Instant)? ;
4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM • Période d’accès d’un lieu exprimé en intension • Le musée est ouvert tous les jours de 10h à 19h sauf le lundi • Le restaurant est fermé les 1ère et 2ème semaines d’avril • Le marché est exceptionnellement ouvert les 3ers dimanche de décembre
4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM Métamodèle générique pour les Events Approche IDM Event ISO19108 Texte libre extension Métamodèle pivot pour les propriétés temporelles DSL des périodes d’accès iCalendar Grammaire formelle (xText) conforme à conforme à conforme à Données métier Instances du modèle pivot Textes contrôlés Vérification de contraintes structurelle (invariant) et sémantique (modèle de calendrier) Solveur de requêtes
4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM - du texte en langage naturel au texte contrôlé - Expression saisie : « Ouvert du lundi au vendredi, de 9h à 18h. Nocturne le jeudi jusqu'à 22h. Fermé le 18 mai. » La chaîne de traitement a été expérimentée sur un corpus de 513 expressions fournies par RelaxNews iCalendar Export Kermeta Kermeta Texte contrôlé Instances du modèle temporel Instances du modèle linguistique
4b. Autre application : couplage d’un SMA avec le modèle temporel SMA : DAHU TimeManager Requêtetemporelle Agents pêcheurs Modèle Temporel Réponse : pêche autorisée, interdite ou restreinte Texteréglementaire : “Digging is prohibited each year, from 9 pm to 6 am between July 1st and August 31st. Out of these periods, digging is allowed from 3 hours before low tide up to 3 hours after the same low tide (according to the tide almanac in Douarnenez).” Faucher C., Tissot C., Lafaye J.Y., Bertrand F., "Benefits of a periodic temporal model for the simulation of human activities", GeoVA(t) (Geospatial Visual Analytics : Focus on Time) Workshop at AGILE 2010, 10-11 May 2010, Guimaraes (Portugal)
5. Conclusions • Chaîne d’acquisition et de modélisation de connaissances temporelles • D’un texte en langage naturel vers un texte contrôlé • Un modèle générique d’expressions temporelles pour modéliser des phénomènes périodiques • Extension de la norme ISO 19108 • Expressions temporelles en intension (à l’inverse d’extension) • Grammaire formelle • Vérification structurelle et sémantique • 2 cas d’utilisations pour expérimenter les approches dont 1 industriel
5. Perspectives • Moteur de requêtes • en formulant une requête sous forme d’expressions temporelles • exprimer et calculer l’intersection de deux expressions sans calculer leurs extensions • Traduire une règle périodique en requête (SQL/SPARQL…) sur la base de données ou de connaissance • Filtrer les nuplets/graphes candidats de la base pour optimiser l’exécution de la requête
Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel Merci de votre attention Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles Teissèdre2,3 1 L3i, University of La Rochelle, France cyril.faucher@univ-lr.fr 2 MoDyCo - Université de Paris Ouest Nanterre La Défense - CNRS 3 Mondeca, France