Cours sur le traitement automatique des langues La sémantique

Cours sur le traitement automatique des languesLa sémantique Violaine Prince Université de Montpellier 2 LIRMM-CNRS

Plan de l’exposé • Introduction • Les principes • Les applications • recherche d’information • interprétation de requêtes • dialogues finalisés • le contrôle de l’interprétation morphosyntaxique • Conclusion et perspectives Introduction

Introduction • Qu ’est-ce que la sémantique ? • affectation d ’un (ou plusieurs) sens à des formes • A quoi sert la sémantique ? • l ’utilité dépend du domaine • Domaines de la sémantique • linguistique • logique • langages Introduction

Définitions de la sémantique (I) • Autant de définitions que de domaines • en logique : affectation d’une interprétation à • un prédicat, une formule, un énoncé • en logique classique : évaluation à vrai, faux • en logique multivaluée : évaluation à une des valeurs autorisées • en logique floue : calcul de la valeur (numérique) de la fonction de « fitness » Introduction

Exemples (I) • objet (ballon, rouge) évalué à vrai si et seulement si : • objet(x,y) et « ballon » appartient au domaine de validité de x • et « rouge » appartient au domaine de validité de y • sémantique vériconditionnelle • ne traite pas du rapport avec le monde Introduction

Exemples (II) • objet( ballon, rouge) évalué à « inconnu » en logique non monotone • si on n ’a pas, dans la base, objet(ballon, rouge), comme une connaissance vraie. Introduction

Définitions de la sémantique (II) • langages de programmation : • intervient après la vérification morphosyntaxique • la sémantique est réalisée par le compilateur ou l ’interpréteur • interpréter une instruction revient à • vérifier les contraintes d ’intégrité • produire un exécutable Introduction

Définitions de la sémantique (III) • linguistique : il existe plusieurs définitions • ordonner les significations d ’un mot (sens du dictionnaire) • exemple : pompe • 1. appareil permettant l ’aspiration d’un liquide, ex : « une pompe de relevage » • 2. par extension de 1, dispositif de fourniture d ’essence pour automobile , « la pompe à essence » • 3. par extension de 2, représente les propriétés de l ’essence, « le prix à la pompe » • 4. par extension de 2, représente le lieu de fourniture d ’essence , « il y a une pompe pas loin ». Introduction

mais aussi , • 5.faste, luxe , « cérémonie en grande pompe » • 6. (familier) chaussures « des pompes en simili-crocodile ». • 7. Exercice physique, parfois d ’aspect punitif « vous me ferez 100 pompes » • retrouver le (ou les sens) en contexte : • Je me suis arrêté à la première pompe que j ’ai pu trouver. J’en ai profité pour nettoyer au jet mes pompes boueuses, d’autant plus que je devais assister ensuite à une cérémonie en grande pompe à la mairie. Introduction

Qu’est-ce qu’un contexte ? • En linguistique : • groupe de mots • phrase • paragraphe • texte • mais aussi : • le sous-ensemble des hypothèses de l’auditeur sur le monde (Latraverse, 1987) • les objets et individus présents dans la situation d’énonciation ou évoqués par elle (Lyons, 1977) Introduction

Langue référent : objet linguistique objet référé: objet du monde référé: objet mental monde individu triangle aristotélicien Le contexte d’un objet linguistique est composé : 1.du co-texte (autres objets linguistiques dans l ’entourage) 2.du contexte mental (base de connaissances) où se trouve le référé 3.du contexte externe (le monde) où se trouve l ’objet référé. Introduction

En logique • les prédicats du même énoncé • les variables liées • les valeurs de variables proposées • En logique, les contextes mental et externe sont confondus avec le co-texte • En programmation : • il existe un « contexte mental » qui pourrait correspondre à : • l’état de la base de connaissances • l’état de la machine Introduction

A quoi sert la sémantique • En linguistique : • mise en rapport des objets de langue avec le monde • les enfants de Pierre et Marie sont blonds • La génération soixante-huit, ce sont les enfants de Marx et du Coca-Cola • En traitement automatique des langues • mise en rapport des objets de langue et d’une « forme » calculable Introduction

Les principes • Les modèles • de la linguistique • de l ’intelligence artificielle • autres modèles en informatique • Les modes de résolution • Les architectures les principes

Les modèles • Modèles linguistiques pour la sémantique • sémantique compositionnelle • sémantique différentielle • sémantique « interprétative » les principes

Modèles linguistiques pour la sémantique • Sémantique compositionnelle • Le sens de la phrase est une composition (plus ou moins formelle) des sens des mots • si un mot a plusieurs sens, cela génère autant de combinaisons possibles • le « bon » sens est celui dont la combinaison est plausible les principes

Sémantique compositionnelle • Exemple « Je me suis arrêté à la première pompe que j’ai pu trouver. » lieu appareil chaussure La condition de « plausibilité » exclut : « faste », et « exercice physique ». les principes

Sémantique compositionnelle • Exemple « Je me suis arrêté à la première pompe que j ’ai pu trouver. » • trois « phrases -sens » générées. QUI DÉTERMINE LA PLAUSIBILITÉ ? UN PROCESSEUR HUMAIN UNE CONNAISSANCE FORTE DU MONDE les principes

Sémantique compositionnelle • Exemple « Je me suis arrêté à la première pompe que j ’ai pu trouver. » • Une deuxième « passe » de plausibilité supprimera le sens « chaussure ». EST PLAUSIBLE CE QUI : N ’EST PAS INCONGRU N ’EST PAS RIDICULE les principes

Sémantique différentielle • Parmi tous les sens d ’un mot, c ’est le plus spécifique qui doit être choisi en premier. • S ’appuie sur une représentation très fine des sens des mots dans le dictionnaire • Pottier, Greimas (sémantique structuraliste), Barwise et Perry (sémantique des situations) les principes

Sémantique différentielle « Je me suis arrêté à la première pompe que j ’ai pu trouver. » • 1. appareil permettant l’aspiration d’un liquide, ex : « une pompe de relevage » • 2. par extension de 1, dispositif de fourniture d ’essence pour automobile , « la pompe à essence » • 3. par extension de 2, représente les propriétés de l’essence, « le prix à la pompe » • 4. par extension de 2, représente le lieu de fourniture d ’essence , « il y a une pompe pas loin ». les principes

Sémantique différentielle « Je me suis arrêté à la première pompe que j ’ai pu trouver. » 1. appareil aspiration liquide 2. appareil à essence les propriétés de l’essence 3. essence automobile lieu consacré à la vente station d’essence 4. les principes

Sémantique différentielle • Les règles de différentiation qui s ’appliquent sont : • compatibles avec le co-texte • arrêter, trouver • forcées par le co-texte (coercitive rules de Pustejovsky) Introduction

Sémantique interprétative Le sens le plus spécifique garde en mémoire tous les sens génériques, et la récurrence du terme peut s ’appuyer sur le fond commun. Rastier (1986) Fonctionne pour les mots à sens multiples et dépendants. . les principes

Sémantique interprétative « Je me suis arrêté à la première pompe que j ’ai pu trouver. » 1. appareil aspiration liquide 2. appareil à essence les propriétés de l’essence 3. essence automobile lieu consacré à la vente station d’essence 4. les principes

Les modèles • Les modèles de l’intelligence artificielle • Les schémas (frames) • Les scénarios (scripts) • Les ontologies arborescentes (issues des réseaux sémantiques) • Les graphes conceptuels les principes

Les modèles de l ’intelligence artificielle • Les schémas (Minsky 1974) • Un schéma (frame) est un ensemble de connaissances autour d’un sujet donné (ici, un mot). • L ’usage des schémas en sémantique se fait de la manière suivante : • sur une chaîne de classification donnée, on associe à chaque terme son schéma. les principes

valeurs par défaut pour C1n sous forme d ’{attribut (facette, valeur)} C11 Schéma de C11 Schéma de C1n-1 C1n-1 Schéma de C1n lien « is-a » C1n les principes

Exemple fait en : matière (organique, minérale) type (naturelle, artificielle) prix: origine : • Chaise : composé de: pieds (3, 4) dosseret (oui, barreaux : oui,non non) assise :matière meuble chaise fauteuil chaise-à-porteur 17ème siècle mode de transport les principes

Beaucoup de connaissances à intégrer • Problème des sens figurés du mot: • jouer aux chaises musicales • mener une vie de bâton de chaise • Et de certains de ses dérivés : • ambitionner le fauteuil présidentiel. • Les schémas sont adaptés en sémantique lorsqu ’il s ’agit d ’applications très limitées. • A éviter en recherche d’information ou indexation les principes

Les modèles de l ’intelligence artificielle • Les scénarios (Schank 1978) • Un scénario (script) est un ensemble de connaissances autour d ’une situation donnée. • Le scénario comprend : • des conditions initiales (de déclenchement) • des actions (possibles) • un résultat • des exceptions (anomalies) • A chaque élément est associé un schéma. les principes

Les scénarios pour l ’interprétation du LN • Les scénarios s’appliquent à l ’interprétation du langage naturel en fournissant les conditions pragmatiques d ’interprétation. • Les conditions initiales peuvent être exprimées par du texte • Les actions sont des prédicats verbaux • Le résultat est ce qui est attendu • Les anomalies sont répertoriées lors qu ’elles sont connues. les principes

COMPRENDRE ce que l ’on sait déjà Ce qui est dit événement Schémas actions élémentaires référence à d ’autres schémas les principes

Exemple • Scénario : « réviser une voiture » • ELEMENTS : • voiture • ACTEURS : • client, garagiste • CONDITIONS INITIALES • le client amène sa voiture au garage • il possède un moyen de paiement • la voiture est dans un état donné les principes

Exemple : réviser une voiture • RESULTAT(ESCOMPTE) • le client reprend sa voiture au garage • il a de l ’argent en moins • la voiture est révisée • ANOMALIES • le client ne reprend pas sa voiture • la voiture n ’est pas révisée • la voiture est révisée mais elle n ’est pas en bon état les principes

Exemple : réviser une voiture • ACTIONS • Origine : CLIENT • AMENER (voiture, garage) • LAISSER-A (voiture, clés, papiers, garagiste) • CONVENIR-AVEC (rendez-vous, garagiste) • PARTIR • REVENIR • PAYER(facture) • PRENDRE (voiture, clé, papiers) les principes

Exemple : réviser une voiture • Origine : GARAGISTE • pour chaque partie de Voiture (schéma VOITURE) faire : • VERIFIER (partie) • si partie à changer alors CHANGER(partie) • si partie à réparer alors REPARER (partie) • fin • pour tous les éléments changés et réparés, MARQUER (partie) • FACTURER (partie) • DONNER (facture, client). les principes

Les difficultés • Des situations stéréotypées • Ambiguïté du déclenchement • Jean est allé chez le garagiste. réviser une voiture acheter une voiture louer une voiture réparer une voiture les principes

Extensions : plans et thèmes • Repérer le thème du texte • acteurs, éléments • premiers prédicats verbaux • Considérer un scénario comme un plan possible, modifiable (déroutable) planification Introduction

Conclusion sur les schémas et les scénarios • Essaient d ’intégrer des connaissances « contextuelles » de type pragmatique • Mais • lourdeur des structures • rigidité • aspect trop détailliste par certains côtés pas assez par d ’autres • énorme quantité de connaissances • structuration dépendant fortement des concepteurs les principes

Les modèles de l ’intelligence artificielle • Les « ontologies » arborescentes • après l ’échec d’une structuration trop importante et trop large • restriction des années 90 • à une application • à un domaine, de préférence technique et défini • à une structure arborescente • plusieurs « arbres de connaissance » plutôt qu ’un seul réseau les principes

Exemple • domaine : chimie • application : enseignement secondaire de la chimie atomique: • agrégats « partie-de » substance molécule atome particule les principes

Exemple • domaine : chimie • application : enseignement secondaire de la chimie atomique: • agrégat « sorte-de » particule particule chargée particule neutre proton électron neutron les principes

relations typées • sorte-de selon un critère • sorte-de : inclusion de classe • sorte-de : membre-de • partie-de • Les ontologies arborescentes supposent : • un mot un sens • ce qui correspond qu ’à un sous-ensemble très faible du langage naturel les principes

Les modèles de l ’intelligence artificielle • Les graphes conceptuels (Sowa 1984) • l ’idée que l ’esprit et le langage s ’organisent de la même manière (ressemblance des contextes linguistique et mental) • il existe une représentation en lambda-calcul du contexte mental • application à la langue objet du prochain cours les principes

Les applications Recherche d’information recherche d ’une information I représentée par un texte T, dans une base de documents D Indexation par un texte T d ’une information I, applicable à toute base de documents Dk Les deux problèmes ne sont pas exactement symétriques les applications

Recherche d ’information les Ij sont des sens possibles de T, ou contenus dans des sens de T I1 texte T I2 In base de documents (corpus) recherche d’occurrences l ’algorithme de recherche d ’occurrence est celui d ’un motif M/ M◊ T d ’un sous-motif K de M/ MÇ T = K les applications

Problèmes • L ’information I recherchée • n ’est pas représentée par un unique texte T • n ’est pas le seul sens possible de T • n ’est pas la composition des sens des éléments de T • Les occurrences de T récupérées, sont, au mieux des sur-textes de T, parfois des sous-textes. • La recherche d ’information est donc parasitée par la non unicité sémantique. les applications

Exemple • L ’information I recherchée concerne « l ’Hôtel de Ville », c ’est-à-dire, la mairie principale du lieu (s ’il s ’agit d ’une ville à arrondissements). • La séquence « hôtel de ville » a pour sens : • I1 :mairie • I2:sorte d ’hôtel • I3:sorte d ’hôtel en milieu urbain. • Sont récupérées dans le corpus des chaînes : • rue de l ’Hôtel de Ville • l ’hôtelde Mussy est dans la ville de Gordes les applications

Exemple (suite) • Si, de manière sophistiquée, un analyseur accepte les formes accordées, on récupère en plus : • tous les hôtelsde la ville de Paris sont chers. • l ’hôtel est en dehors de la ville. • au métro Hôtel-de-Ville, vous trouverez le bazar de l ’Hôtel-de-Ville. • mais aussi, avec un pourcentage affaibli de concordance, tout ce qui va contenir « hôtel » et « ville », dans la fenêtre donnée. les applications

Cours sur le traitement automatique des langues La sémantique