1 / 20

Synonymies et vecteurs conceptuels

Synonymies et vecteurs conceptuels. TALN 2001 Mathieu Lafourcade, Violaine Prince LIRMM - France. Plan de la présentation. Objectifs : pourquoi la synonymie ? Les vecteurs conceptuels : rappel Représentation des « synonymies » Intérêt des fonctions lexicales. Objectifs. Evaluation

edison
Télécharger la présentation

Synonymies et vecteurs conceptuels

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Synonymies et vecteurs conceptuels TALN 2001 Mathieu Lafourcade, Violaine Prince LIRMM - France

  2. Plan de la présentation • Objectifs : pourquoi la synonymie ? • Les vecteurs conceptuels : rappel • Représentation des « synonymies » • Intérêt des fonctions lexicales

  3. Objectifs • Evaluation • De la proximité sémantique aux contextes possibles de « l ’interchangeabilité » lexicale • Synonymie relative • éviction de la non transitivité de la synonymie • équicandidature au « punctum proximum » • Synonymie subjective • équicandidature au « punctum remotum »

  4. Vecteurs conceptuelsEspace vectoriel • Une idée combinaison de concepts ; un vecteur • Espace des idées = espace vectoriel • Un concept = une idée = un vecteur V par augmentation : V + voisinage • Espace des significations = espace vectoriel + {v}* 

  5. Vecteurs conceptuelsThésaurus • H : Hiérarchie du thésaurus — K concepts • Thesaurus Larousse = 873 concepts • V(Ci) : <a1, …, ai, … , a873> • aj = 1/ (2 ** Dum(H, i, j)) 1/16 1/16 1/4 1 1/4 1/4 1/64 1/64 4 2 6

  6. Vecteurs conceptuelsConceptc4:paix paix Les épisodes du conflit Le rapport hiérarchique La société Le monde, L’homme

  7. Vecteurs conceptuelsTerme “paix” c4:paix

  8. Distance angulaire • DA(x, y) = angle (x, y) • 0  DA(x, y)  • si 0 alors x et y colinéaires — même idée • si /2 rien en commun • si  alors DA(x, -x) avec -x “anti-idée” de x x’ x  y

  9. Distance angulaire DA(x, y) = acos(sim(x,y)) DA(x, y) = acos(x.y/|x||y|)) DA(x, x) = 0 DA(x, y) = DA(y, x) DA(x, y) + DA(y, z)  DA(x, z) DA(0, 0) = 0 and DA(x, 0) = /2 par définition DA(x, y) = DA(x, y) avec   0 DA(x, y) =  - DA(x, y) avec  < 0 DA(x+x, x+y) = DA(x, x+y)  DA(x, y)

  10. Distance thématique • Exemples • DA(mésange, mésange) = 0 • DA(mésange, passereau) = 0.4 • DA(mésange, oiseau) = 0.7 • DA(mésange, train) = 1.14 • DA(mésange, insecte) = 0.62 mésange = oiseau passériforme insectivore … …

  11. Synonymie relative • Polysémie des termes • un personnel trié sur le volet (CHOISIR) • une liste triée par ordre alphabétique (ORDONNER) • le courrier est trié (REPARTIR) • Un vecteur sert de « pivot » ou de référence • Quelle est la mesure de l ’interchangeabilité entre A et B dans le contexte de C ?

  12. Synonymie relative • SynR(A, B, C) — C = référence SynR(A, B, C) = DA(A+AC, B+BC) A+AC SynR(A, B, C) A B+BC C B

  13. Synonymie relative • SynR(A, B, C) = SynR(B, A, C) • SynR(A, A, C) = DA(A  C, A  C) = 0 • SynR(A, B, 0) = DA(0, 0) = 0 • SynR(A, 0, C) = /2 • SynA(A, B) = SynR(A, B, 1) = D (A 1, B 1) = D (A, B) • DA(charbon,nuit) = 0.9 • SynR(charbon, nuit, couleur) = 0.4 • SynR(charbon, nuit, noir) = 0.35

  14. Synonymie relative • La synonymie relative est une mesure qui tend à favoriser le “rapprochement” de deux vecteurs : • “noir” meilleur punctum proximum pour “charbon” et “nuit” • “transitivité” de la synonymie • SynR(charbon, corbeau, noir) = 0.18 • SynR(corbeau,nuit, noir) = 0.5 • SynR(charbon, nuit, noir) = 0.35

  15. Synonymie subjective • Problème de la portée de la discrimination sémantique • DA(mésange, oiseau) = 0.7 • DA(hirondelle, oiseau) = 0.48 • A partir de quel point de vue (ou contexte) des vecteurs corrélés deviennent interchangeables ? • plus proche punctum remotum

  16. Synonymie subjective • SynS(A, B, C) — C = point de vue SynS(A, B, C) = D(A-AC, B-BC) A A-AC C B SynS(A, B, C) B-BC

  17. Synonymie subjective Quand DA(A, C)  /2 et DA(B, C)  /2 alors SynS(A, B, C)  DA(A,B) SynS(A, B, 0) = DA(A, B) SynS(A, A, C) = 0 SynS(A, B, B) = DA(A-AB, 0) = /2 • SynS(mésange, hirondelle, @les_animaux) = 0.4 • SynS(mésange, hirondelle, @les_oiseaux) = 0.5 • SynS(mésange, hirondelle, passereau) = 1.2

  18. Limite de la synonymie subjective • non conservation de la chaîne hiérachique des concepts • dans la chaine des concepts : • @ le_monde > @ la_vie> @les_animaux > @les_oiseaux • SynS(mésange, hirondelle, @la_vie) = 0.6 • mais SynS(mésange, hirondelle, le_monde) = 0.83 • sont moins bons que • SynS(mésange, hirondelle, @les_animaux) = 0.4

  19. Limites de la synonymie subjective • Polysémie : terme versus concept • SynS(mésange, hirondelle, @les_oiseaux) = 0.5 • SynS(mésange, hirondelle, oiseau) = 1.6 • Vecteurs peu corrélés comme point de vue • SynS(mésange, hirondelle, @or) = 0.7 • DA(mésange, @or) = 1.19 • DA(hirondelle, @or) = 1.15

  20. Conclusion • Les synonymies comme enrichissement de l’analyse thématique • Le modèle des vecteurs conceptuels montre bien les interférences dues • à la polysémie : synonymie relative • à la relation complexe terme-concept (oiseau vs @les_oiseaux) • Le système est en apprentissage continu...les résultats sont évolutifs.

More Related