1 / 44

FrameNet

FrameNet. Théorie, Produit, Processus, Multilingualité et Connexio ns. FrameNet. Théorie: Frame Semantics Produit: Base de Frames Processus: Construction et utilisation d’un FrameNet Multilinguisme: Autres versions de FrameNet Connexions: Liens avec WordNet, VerbNet, PropBank.

joyce
Télécharger la présentation

FrameNet

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. FrameNet Théorie, Produit, Processus, Multilingualité et Connexions Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  2. FrameNet • Théorie: Frame Semantics • Produit: Base de Frames • Processus: Construction et utilisation d’un FrameNet • Multilinguisme: Autres versions de FrameNet • Connexions: Liens avec WordNet, VerbNet, PropBank Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  3. Frame Semantics • (Fillmore, 1982), dérivée de la Case Grammar de Fillmore (1968) • Une Frame est • une structure d’arguments appelés Frame Elements (≈rôles sémantiques) ou FEs • associée à une description textuelle • reliéeà d’autres Frames dans un graphe annoté par un nombre limité de relations • Les types de FEs ne sont pas en nombre finis Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  4. Frame Semantics • Un peu la même idée que la Grammaire de Construction: • la langue n’est pas régie par quelques principes généraux, • mais par de nombreux/ses constructions/cadres qui sont mis en relations • 1 unité lexicale (LU) évoque 1 unique frame • 1 LU = 1 lemme associé à 1 sens (Cruse, 1986) • Chaque frame peut être associée à plusieurs LU, de plusieurs types (nom, adj, verbe) Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  5. Frame Semantics • Relations entre Frames • Inheritance • Using (point de vue, présupposition) • Subframe (partie d‘une frame complexe) • Causative • Inchoative (début d‘un événement) • SeeAlso (lien non spécifié) Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  6. Frame Semantics • Inheritance • Une frame enfant est l’élaboration de la frame parent • Une enfant doit posséder au minimum tous les subframes, FEs, et types sémantiques de son parent. • Exemple: Rewards and Punishment est le parent de Revenge Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  7. Frame Semantics • Using • Point de vue • Une perspective spécifique sur une frame • Ex : Commerce_Sell et Commerce_Buy sont 2 points de vue sur Commerce_Goods_Transfer • Présupposition • Un lien plus “encyclopédique”, un arrière-plan nécessaire pour comprendre la frame, même s’il n’y a pas de lien • Ex: Volubility et Communication Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  8. Frame Semantics • SubFrame • Pour les frames décrivant des scénarios complexes, dont les sous-éléments existent en tant que frame. Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  9. Frame Semantics • Causative_of • Le parent dénote la cause de l’état décrit par l’enfant • Inchoative_of • Le parent dénote l’entrée dans l’état décrit par l’enfant • SeeAlso • Quand un groupe de frames relativement similaires doit être différencié avec précaution, chaque élément du groupe a un lien SeeAlso avec un représentant “central” Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  10. Frame Semantics Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  11. Frame Semantics • Exemple : Commerce_Sell • Description :These are words describing basic commercial transactions involving a buyer and a seller exchanging money and goods, taking the perspective of the seller. The words vary individually in the patterns of frame element realization they allow. For example, the typical patterns for SELL: SELLER sells GOODS to BUYER for MONEY. Robin sold a car to Abby for $5,000. • Core FEs :SELLER, GOOD, BUYER • Non-Core FEs : DURATION(Duration), MANNER, MEANS, MONEY, PLACE(Location), PURPOSE, PURPOSE_OF_GOODS, RATE, REASON, RELAY, RESULT, REVERSIVE, Time(Time), UNIT • Relations : • Inherits From: Giving • Is Used By: Exporting • Perspective on: Commerce_goods-transfer Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  12. Frame Semantics • Unités Lexicales : lease.v, rent.v, retail.v, retailer.n, sale.n, sell.v, vend.v, vendor.n • Voisinage : Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  13. Frame Semantics • Types de FEs • Core: arguments conceptuellement nécessaires • Peripheral: arguments précisant le concept • ex: MONEY, MEANS, PLACE • Extra-Thematic: arguments qui sont liés au Frame complet, pas uniquement au concept « central » • ex: PURPOSE, REASON,RESULT • Difficile de choisir dans certains cas (ex MONEY pourrait être Core) Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  14. Frame Semantics • Pour résumer • Frame = connaissance encyclopédique liée au lexique • Frame+FEs = comment cette connaissance met en relation les arguments des unités lexicales qui “implémentent” la frame • Graphe de Frames = liens de généralisation entre connaissances Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  15. Construction d’un FrameNet • Construire une base de donnée lexicale FrameNet, • il faut d’abord avoir le graphe de Frames avec les FEs (modifier les frames coûte très cher) • Trouver ensuite les unités lexicales qui sont liées à chaque Frame (on peut le faire progressivement) • relier à chaque unité lexicale (LU) des informations sur les instanciations grammaticales Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  16. Construction d’un FrameNet • Technique originale (FN Anglais, Espagnol, Japonais): • Choisir une LU, et chercher dans son corpus des exemples à partir de motifs imaginés par le lexicographe • Annoter les phrases ainsi choisies avec les FEs Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  17. Construction d’un FrameNet • Technique systématique (Allemand) • Prendre phrases d’un corpus les unes après les autres • Trouver la Frame “centrale” • Annoter • Autres techniques (recherches en cours) • Projection à partir d’annotation de traductions ? • Projection interlingue à partir d’un entraînement sur les FEs ? • Recherche des LU à partir de ressources bilingues ? Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  18. Construction d’un FrameNet • Annotation des anaphores, ellipses, etc. • Les core FEs étant nécessaires, on ne peut pas ne pas les annoter, pourtant ils sont parfois absents de la phrase (soit dans le contexte linguistique, soit dans le contexte implicite) • FrameNet introduit 3 étiquettes : CNI, DNI, INI Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  19. Construction d’un FrameNet • CNI - Constructional Null Instanciation • le FE est porté par la construction syntaxique • “Get even[with herOFFENDER][for thisINJURY]. [CNIAVENGER]” • DNI - Definite Null Instanciation • le FE est porté par le discours ou le contexte de l’énonciation • “[The monkeyAVENGER] avenged[himselfINJURED_PARTY] [by growing to the size of a giant and setting fire to the cityPUNISHMENT]. [DNIOFFENDER]” Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  20. Construction d’un FrameNet • INI - Indefinite Null Instanciation • le FE est porté par une valeur implicite, connue encyclopédiquement • “He takes and never gives back. [INITHEME] Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  21. Construction d’un FrameNet • Types de lemmes intéressants dans FrameNet • Verbes • Adjectifs • Noms • Expressions mots multiples • Seuls sont utiles à décrire les LU ayant un aspect prédicatifs, c’est-à-dire qui décrivent un sens par composition d’arguments. Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  22. Construction d’un FrameNet • Pas intéressant pour les choses et les genres naturels (cf. WordNet) • Sémantiquement, FrameNet décrit les événements, les états, les relations et les propriétés Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  23. Construction d’un FrameNet Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  24. Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  25. Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  26. Utilisation de FrameNet • La Frame Semantics a de forts liens avec la Grammaire de Construction • Les informations constructionnelles (Valence, Cadres de sous-catégorisation) servent de base à une GC. • Les liens entre Frames et le graphe de Frames peuvent partiellement être transformés en hiérarchies de constructions. Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  27. Utilisation de FrameNet • Annotation automatique • Entraînement à partir d’annotations manuelles (Gildea & Jurafsky, 2000) • Techniques de classification (clusterisation sémantique + informations grammaticales) • Segmentation automatique des FEs Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  28. Utilisation de FrameNet • Utilisation pour la résolution d’anaphores • Riche description des rôles sémantiques • Fonctionne aussi parfois pour les anaphores nulles… • Mais ne décrit pas la compatibilité sémantique comme peut le faire WordNet Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  29. Utilisation de FrameNet • Autres applications • Questions/Réponses • Systèmes de Dialogue (suffisamment générique pour “traiter” le hors-domaine, mais facilement spécifiable, cf. SoccerFN & NukeFN) • Résumés (à vérifier..) Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  30. Statistiques sur FrameNet • Version anglaise (développée depuis 1997) • 739 Frames + 6054 Fes / 135000 phrases annotées Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  31. Statistiques sur FrameNet • Utilisateurs principaux : • MIT, U Colorado*, Saarland U /DFKI* • CMU, Edinburgh, HK Polytechnic, Keio*, Nat U Singapore • Baylor, HKUST, Leipzig, U College Dublin, USC, U Sydney, U TX Dallas* & Austin*, Xiamen * collab. FrameNet Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  32. Outils FrameNet • Création • FNDesktop (Berkeley) • SALSA (Sarrebruck) • Utilisation • Automatic Labeler (devel) Gildea&Jurafsky • Projection (devel) Pàdo • APIs • Stanford (limitée) • Berkeley (très récente) Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  33. Semantics: Independent frames Trees of depth one One edge points to target, others to frame elements Outils FrameNet (They didn‘t want to pay the move back because the employee had quit.) TIGER Syntax: • Node labels: constituents • Edge labels: gramm. functions • Crossing edges • POS Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  34. FrameNet Multilingue • 4 langues déjà traitées • Anglais américain • Japonais (Keio & U Tokyo) • Corpus propre, outils de recherche • Outils d’édition FN annotation/frame? • Espagnol (U A Barcelona) • Lexicographique • Corpus propre, FN software • 81 Frames, 585 LUs, ~6,900 phrases annotées • Allemand (U Saarlandes) • FN frames & FEs • corpus propre (TIGER) et soft annotation • Creation de LU “unknown” au besoin -> U Texas Austin • 20K phrases Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  35. FrameNet Multilingue • Projets en gestation • Hebreux • Chinois (projection BiFrameNet avec Hownet) • Romance FrameNet • Projet lancé avril 2005 • Plusieurs partenaires intéressés • Besoin d’une structure dirigeante • Et d’un support financier • Français (c’est nous) • Recherche de techniques pour économiser du temps • Mi-parcours de la phase préliminaire • Susanne Alt, Benoît Crabbé, Laurent Romary Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  36. FrameNet Multilingue • Graphe de Frames commun à plusieurs langues • Cas problématiques: • un frame existe qui devrait être divisé. Ex. driving = aller en voiture en conduisant OU en étant conduit (en Allemand) • deux frames qui n’ont pas de parent • Des FE peuvent être Core ou pas (même problème: raffinement) • Questions techniques: pour l’Allemand = mots collés, verbes disloqués (?). Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  37. FrameNet Multilingue • Romance FrameNet • Conception collaborative et simultanée d’un FN pour plusieurs langues (romanes) • Idées proposées • Corpus traduit existant • Traduction “contrainte” par la frame à annoter • Plusieurs corpus traduits pour des sous-ensembles de langue, projections avec techniques bilingues. Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  38. FrameNet Multilingue • FrameNet français • Annotation de 1000 phrases déjà annotées en Anglais et Allemand (Europarl) • Récupération des tables du LADL • Construction semi-automatisée de la base de frames françisées • Tentative d’annotation automatique en utilisant un entrainement LSA sur corpus bilingue - utilisable aussi pour projection Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  39. FrameNet Multilingue • Perspectives • Plutôt un FN européen utilisant plusieurs techniques • récupération des travaux déjà effectués en Espagnol et Allemand • ne reposant pas sur une traduction N langues, mais autorisant plusieurs traductions existantes bilingues • Intégration de WordNet, • Lien avec les classes de Levin difficile car propre à l’Anglais Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  40. Connexions • PropBank • Classification de Levin • 300000 mots (WS Journal) • Décrit les structures de valence pour chaque lemme • Pas de connaissance encyclopédique (notamment pas de liens entre frames) • Les rôles des structures de valence ne sont pas corrélés entre eux hors de la classe de Levin Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  41. Connexions • VerbNet • Classes tirées des classes “intersectives” de Levin • Peuvent être plus ou moins corrélées à des frames • Dans Giuglea & Moschitti (2004), les classes de VerbNet (par exemple Judgment) sont projetées dans plusieurs frames (Rewards and Punishments, Judgment Communication, Pardon, Arraignment, etc.) • Les projections sont faites par similarité de LU liées aux classes et ensuite par les motifs d’ “alternation” Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  42. Connexions • WordNet • Plusieurs synsets peuvent être reliés aux FEs • Potentiellement utile pour affiner les descriptions de frames (usages typiques) • Utilisation envisageable pour l’annotation automatique Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  43. Connexions • Dans le cadre de LIRICS (prg e-Contents) • Développement d’un méta-modèle permettant d’intégrer les 4 approches • Outils d’annotation multilingue • Synchronisation des versions pour un développement collaboratif • Exportation d’anciennes données • Etude de l’intégration d’outils statistiques pour faciliter le développement • préannotation, • validation par annotation auto Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

  44. Journée d’étude • JE ATALA le 13 mai • Deadline le 13 mars • Ressources pour un FrameNet français Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC

More Related