Raisonnement à partir de cas : des fondements aux applications Sophie Loriette-Rougegrez

Raisonnement à partir de cas : des fondements aux applications Sophie Loriette-Rougegrez sophie.loriette@utt.fr bureau H213 Laboratoire LM2S Université de technologie de Troyes 12, rue Marie Curie BP 2060 10010 TROYES cedex

Plan du cours • Quand utiliser le ràpc ? • Origines du ràpc : • Le modèle cognitif • Le raisonnement par analogie • Les étapes du ràpc • Les techniques utilisées • Le ràpc et les autres techniques de raisonnement • Adresses et bibliographie

Pourquoi le RàPC ? • Problème dans la construction de certains systèmes à base de connaissances : la connaissance s’adapte mal à une représentation déclarative sous forme de règles Experience REGLES

Exemples d’utilisation du RàPC • Diagnostic médical : “Les problèmes de ce patient sont très semblables aux symptômes de cette maladie” • immobilier : Ma maison est très semblable à celle qui vient d ’être vendue au bas de la rue pour 750 000 F • domaine juridique : Ce licenciement abusif est en tout point similaire au dossier Dulino de mai 97

Quand utiliser le Ràpc ? lorsque .... • L ’expérience représente la plus grande partie des connaissances sur un sujet • Les experts parlent de leur domaine en citant des exemples • Les problèmes ne sont pas complètement compris (modèles faibles, connaissances du domaine faibles) • Beaucoup d ’exceptions au cas général • Besoin de construire une mémoire d’entreprise • Un volume de données satisfaisant doit exister suffisantes

Principe sous-jacent au RàPC Nouveau problème Problème Nouvelle solution Solution Nouveau problème = problème cible ancien problème = problème source Nouvelle solution = solution cible ancienne solution = solution source

Problème/Solution • Pas de définition générale • Définition liée à chaque application • Selon la tâche, • la solution sera bien ou approximativement définie (classification/aide à la décision) • la qualité de la solution pourra être évaluée

Modèle cognitif du rapc • Influence majeure : recherches sur les processus liés à la compréhension • La compréhension est vue comme un processus d ’explication • notre connaissance permet de générer les explications • Exemple : Cela suppose un certain nombre de prédictions pour lier les éléments du texte les uns aux autres. Frédéric est allé au restaurant. Il a commandé un menu végétarien.

Théorie des scripts • Schank et Abelson (77) proposent une représentation de notre connaissance sous forme de scripts • Les scripts représentent notre connaissance épisodique • D ’autres formes de connaissance existent (buts, plans, etc.) déjà considérés dans les systèmes informatiques • Les scripts sont supposés faciliter notre compréhension par expositions répétées à la même situation • Scripts = alternative à la théorie des schémas (Brewer & Nakamura 84)

Insuffisances du modèle • Un script est supposé servir de référence dans la compréhension d ’un épisode. • Ex : script « aller chez le dentiste » • On doit pouvoir représenter des schémas généraux et des instances de ces schémas • La théorie des scripts ne précise rien sur ce qui est créé en premier Un schéma général créé à partir de plusieurs instances ? Une première instance généralisée pour servir de schéma général ?

Insuffisances du modèle (suite) Les scripts sont très détaillés Des scènes se répètent Redondance d ’informations, sans lien entre ses différentes instances - Coûteux - frein à la généralisation

Insuffisances du modèle (suite) Expériences de Bower, Black, Turner (1979) Les résultats mettent en évidence des confusions entre scènes appartenant à des scripts différents

L ’accès aux connaissances épisodiques • Comment accède-t-on aux connaissances épisodiques ? • Travaux de Schank et Abelson en 77 émettent l ’hypothèse suivant laquelle les mêmes algorithmes sont utilisés à la fois pour la recherche de la connaissance générale et de la connaissance spécifique Théorie de la mémoire dynamique (Schank 82)

Théorie de la mémoire dynamique (Schank 82) • Hypothèses • se souvenir, comprendre, expérimenter, apprendre, sont des processus indissociables • la mémoire évolue sous l ’influence de l ’expérience Proposition de M.O.P.

MOP : consulter un professionnel Séq. évts Scènes Serv. = phys. Exam.. Serv = toothage Scripts $toothage $exam

La scène « commande »

Autre origine : le raisonnement par analogie "rapport, similitude partielle d'une chose avec une autre" • ex : analogie atome/système solaire, l'analogie courant électrique/cours d'eau. • Le raisonnement par analogie consiste à avoir recours à un élément mieux connu pour inférer des informations sur un élément qui l'est moins. • Deux types d’analogie : analogie heuristique [Coulon et al. 89-90] et analogie recours [Bruneau et al. 89]

Composantes • Théorie de Spearman : 3 composantes • Théorie componentielle de Sternberg (1977) : opérations mentales fondamentales • Ordre contesté en 79 par Whitely et Barnes : approximations successives • Gentner (83 ) : importance de l ’identification de relations de haut niveau

Le "carré" analogique  a C A  b      c D B

Prix ? Adaptation Cas similaires Principales étapes du RàPC • Une situation cible • Recherche de cas similaires dans la base de cas (<> BD) • Adaptation de la solution trouvée • Représentation des cas • indexation des cas • évaluation et comparaison de cas • adaptation de cas

Généralités • Cas • une expérience • Base de cas • les cas doivent être bien choisis : typiques, importants, etc. • Similarité • évaluer la ressemblance de 2 cas (ou la pertinence d ’un cas ?)

Généralités (suite) • Similarité : • locale (valeurs d ’attributs) • globale (ts attributs + poids). • Recherche de cas • BD : appariement exact • CBR : appariement inexact • L ’appariement doit être efficace

Généralités (suite) • Adaptation • de petites différences peuvent engendrer des modifications importantes • Apprentissage • Objectif : améliorer les performances du système au fur et à mesure de son fonctionnement CBR peut être combiné à d ’autres modes de raisonnement

La représentation des cas

Qu'est-ce qu'un cas ? "Une connaissance contextualisée qui représente une expérience enseignant une leçon pour satisfaire les buts du raisonneur" (Kolodner 93) • Circonstances ou situation relatifs à une personne, une chose, une action... • Une chose qui a existé ou qui s'est réellement produite • Des circonstances décrivant un contexte dans lequel a été prise une décision Une description de surface

Représentation des cas • Les cas sont souvent décrits par un ensemble de caractéristiques Année Modèle Constructeur Options Kilométrage

Contenu des cas • Représentation minimale description de problème solution • Extensions Contexte (justification etc.) Liens avec d’autres cas Echecs rencontrés

Formalismes de représentation • Frames (MEDIATOR (Kolodner and Simpson 89)), (Casey (Koton 89)) • Objets : frames + héritage de procédures + envois de messages. KRL (Bobrow et Winograd 77) • Logique des propositions/prédicats • Vecteurs

CHEF (Hammond 89)

Les cas de CELIA (Redmond 92) Titre du cas - la voiture cale 1 3 11 2 4 5 6, 9 7 8 10

CELIA • Cas structurés en fragments • 1 fragment -> 1 but de l ’enseignant • fragments indexés individuellement • contexte  fragment • contexte = dysfonctionnements du système diagnostiqué + résultat des actions entreprises + historique des actions entreprises • similarité sur la liste des actions entreprises et le but • Indexation des fragments par une structure de MOP

Instant tk Instant tl CASE REPRESENTATION in REBECAS (Loriette-Rougegrez 95) Case 3 (axis d) Instant ti Instant tj Propagation Relief Vegetation Wind

PAST FUTURE Relief source parameters Pins Coniferes Vegetation 1000 m 2300 m Wind 50 km/h 110 ° 21/8/90 17:00 40 km/h, 140 ° 21/8/90 16:15 target parameters Propagation 21/8/90 17:00 (125°, 1700m) 21/8/90 16:30 (125°, 1400 m) An axis in REBECAS

L ’indexation

Indexation • Objectif : pouvoir retrouver, rapidement, les bons cas. Les indices indiquent les circonstances dans lesquelles le cas peut être utile  indexation au moment de la constitution de la base de cas • Déterminer en quoi un cas est proche de la nouvelle situation  recherche des cas les plus intéressants

Problématique de l ’indexation • Les succès et les échecs sont-ils indexés dans la même base de cas ? • Les indices organisent-ils la base de cas sur des similarités ou différences (HYPO (Ashley 91)) ? • A quoi accède-t-on ? • Nombre de cas • succès/échecs • instances/généralisations ? • Descriptions de problèmes/solutions ? • L ’indexation est-elle nécessaire : plus proche voisins + implémentation parallèle suffisantes ? • Stocker des échecs ou revoir l ’indexation ? Ou utiliser des démons (CHEF) ?

Qualités requises pour les indices • Permettre de différencier les cas, et être annonciateurs de l ’issue du cas • avoir un bon niveau d ’abstraction • pour pourvoir rendre les cas utilisables dans différentes circonstances • en évitant toutefois un niveau d ’abstraction trop élevé pouvant être à l ’origine d ’inférences multiples pour reconnaître les correspondances entre attributs • couvrir l ’ensemble des cas pouvant se produire : le choix se fait essentiellement en fonction du domaine et des tâches à effectuer par le système

Indexation manuelle • Etablir la check-liste • 1. Lister les tâches faisant l ’objet de la recherche de cas, • 2. Pour chaque tâche, déterminer les types de caractéristiques prédictives des solutions, • 3. Idem pour les caractéristiques prédictives des issues, • 4. Pour chaque type de caractéristique, calculer l ’ensemble des généralisations utiles de la caractéristique et s ’assurer que les caractéristiques choisies sont reconnaissables (disponibles pendant le raisonnement), • 5. Créer la check liste en collectant l ’ensemble complet de caractéristiques • à partir de la comparaison 2 à 2 des cas, déterminer ce qui permet de les différencier (ici on parle des valeurs et non des indices) (CYRUS) => souvent combinaison des 2. Aboutit généralement à un grand nombre d ’indices prédictifs, mais trop nombreux pour être prédictifs dans tous les cas.=> recherche du meilleur cas en 2 étapes ex : MEDIATOR (buts des disputants, types d ’objets disputés), CLAVIER (Hennessy et hinkle 92 )

Méthodes d'indexationautomatiques • Méthodes statistiques • permettent de déterminer les caractéristiques importantes, et de leur associer un poids • utilisation a priori • génération d ’explications : pour savoir comment indexer un cas, on explique l ’issue du cas. Les indices sont les éléments apparaissant dans l ’explication. • méthode inductive • Combinaison de plusieurs méthodes : manuelle + explications dans CHEF

Indexation automatique par explication (knowledge-based) • création d ’explications par un système peut se faire par différentes méthodes : • mécanisme de preuve, • case-based (swale (kass et leake 88)) : stocke explications, • règles (chef) • expliquer quoi ? buts poursuivis lors de la réalisation de la situation décrite dans le cas • utilise beaucoup de connaissances du domaine • procède à une généralisation de l ’explication • puis extrait les indices de l ’explication généralisée • Avantage : les indices sont toujours liés à la réussite ou l ’échec décrit dans le cas

Indexation par induction • Intéressant lorsque le but guidant la recherche de cas est très bien défini. • Les cas sont considérés comme des exemples illustrant des concepts • Des algorithmes comme ID3 (Quinlan 86) sont alors utilisables • Avantages : • procède à un calcul rigoureux des indices permettant de distinguer et de représenter les cas • ce calcul sert à organiser la base de cas. Temps d ’accès de l ’ordre de log(N) • ne nécessite pas de connaissance du domaine • Inconvénients : • temps de calcul • requiert une grande base de cas au départ pour exécuter l ’algorithme d ’induction • Technique présente dans les outils de construction de systèmes rapc

Modèles qualitatifs • Utilisés entre autres dans (Dattani and Bramer, 1995) • Un modèle qualitatif contient des nœuds représentant des paramètres du domaine d ’application, et des arcs, représentant leurs relations (une flèche dans (Dattani and Bramer, 1995) indique un lien de précédence) • Le modèle indique également en quoi une combinaison de caractéristiques affecte l ’issue du cas -> utilisé au cours de l ’indexation inductive • Editeur de modèles dans REMIND

Utilisation des modèles qualitatifs • Immobilier (Dattani and Bramer 1995) • Maintenance d ’avions (Dattani, Magaldi and Bramer 1996) • Maintenance de réseaux de PC (Moss, Bramer and Dattani 1996)

La recherche du/des meilleur(s) cas

Rechercher quels cas ? • Les cas utiles • un cas est utile s'il est similaire au nouveau problème selon des dimensions aidant le raisonneur à faire une tâche ou atteindre un but (Kolodner 93) • il faut : • un algorithme qui sache comment explorer la mémoire • des algorithmes capables de choisir quels cas sont intéressants • le nouveau problème • On peut aussi rechercher des « fragments » de cas CELIA, REBECAS !

La similarité ne suffit pas toujours • des informations peuvent avoir de l ’importance dans certains cas et pas dans d ’autres. Ex : âge du patient • on doit rechercher les cas utiles. Notion subjective et variable dans le temps • L ’utilité ne peut être calculée a priori mais la similarité peut l ’être. La similarité est une mesure objective

Propriétés souhaitées • La similarité entre le cas cible et le cas source implique une utilité du cas source • la similarité est basée sur des faits connus • la similarité peut être plus ou moins grande : nécessité de la quantifier

Fonctions d’acceptation • Origine : [Lenz et al. 98] • cas cible noté q, cas considéré noté c • On définit l ’acceptation entre c et q, notée acc(q, c) • acc(q, c) est fonction des acceptations locales entre entités d ’informations (attributs-valeurs) • (e,e ’), acceptation locale entre e et e ’, peut être forte pour 2 entités liées : e et e ’ similaires/e et e ’ contraires • (e,e ’)=0 si e ’ est sans intérêt pour e • (e,e ’)<0 si e ’ doit absolument être évité

été 0 mois Fonctions d ’acceptation (suite) • (e,e ’)peut être définie par une fonction floue représentant le domaine de l ’attribut ex : (été,mois = juin) • Plusieurs entités e ’ peuvent être associées à une entité e: nécessité d ’une fonction locale d ’accumulation 1

Fonctions d ’acceptation (suite) • Acceptation globale • doit considérer l ’intérêt de chaque attribut dans c, pour q • fonction de la pertinence de chaque ei dans c, des accumulations locales

Raisonnement à partir de cas : des fondements aux applications Sophie Loriette-Rougegrez