1 / 20

Alessandro de Luna Almeida Encadré par : Jean-Pierre Briot Jacques Malenfant Samir Aknine

Smart-. s. Une approche de réplication fondée sur les plans pour la tolérance aux fautes des systèmes multi-agents. Alessandro de Luna Almeida Encadré par : Jean-Pierre Briot Jacques Malenfant Samir Aknine. Motivation: objectif. Qu’est-ce que la fiabilité?

pepin
Télécharger la présentation

Alessandro de Luna Almeida Encadré par : Jean-Pierre Briot Jacques Malenfant Samir Aknine

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Smart- s Une approche de réplicationfondée sur les planspour la tolérance aux fautesdes systèmes multi-agents Alessandro de Luna Almeida Encadré par : Jean-Pierre Briot Jacques Malenfant Samir Aknine

  2. Motivation: objectif • Qu’est-ce que la fiabilité? • « Probabilité de fonctionnement sans défaillance d’un dispositif dans des conditions spécifiées et pendant une période de temps déterminée » (Larousse) • Objectif: minimiser l’impact de pannes sur un système multi-agent Une approche de réplication fondée sur les plans...

  3. Motivation: défi • Exemples de pannes: • Bugs de programmation • Panne de processeur • Panne de communication • Effets: • Comportements non attendus • Messages perdus • Retards de transmission ou traitement Une approche de réplication fondée sur les plans...

  4. Motivation: domaines d’application • Gestion de crise • Contrôle aérien • Automatisation des processus • Surveillance médicale en soins intensifs • … Une approche de réplication fondée sur les plans...

  5. État de l’art • Brazier 02, Fedoruk 02 • Réplication statique  • Criticité des composants peut varier • Cuckuern 98, Kalbarczyk 99, Favarim 03 • Réplication dynamique • Adaptation manuelle et à la charge du concepteur  Une approche de réplication fondée sur les plans...

  6. État de l’art: Guessoum 04 • Réplication dynamique et automatique • Comment déterminer la criticité? • Système: CPU • Sémantique: • Rôles et interdépendance entre agents • Les messages échangées ne suffisent pas pour déterminer l’importance des agents avec précision  • Estimation instantanée seulement  Une approche de réplication fondée sur les plans...

  7. Agent1 Agent2 A F AND AND B C C G H OR AND OR D I E J K L Notre approche • Réplication prédictive, dynamique et automatique • Hypothèse: architecture d'agent avec plans • Utiliser les plans pour estimer un modèle de criticité dans le futur

  8. Criticité d’un agent • Idée • Plus ses actions sont critiques, plus l’agent est critique • Criticité des actions du plan de l’agent • Criticité relative de la racine du graphe de son plan courant Une approche de réplication fondée sur les plans...

  9. Criticité absolue d’une action • Définie a priori par le concepteur: • Nombre d’agents pouvant l’effectuer • Ressources nécessaires (temps, mémoire, …) • Informations sémantiques du domaine d’application Une approche de réplication fondée sur les plans...

  10. Criticité relative d’une action • Importance de l’action dans le système • Criticité absolue + utilité de ses résultats Une approche de réplication fondée sur les plans...

  11. Exemple CA = 4 A CR = CA + SUM(CR(B),CR(C)) = 16 AND CA = 4 CA = 8 B C CR = CA + MOY(CR(D),CR(E)) = 7 CR = CA = 8 OR D E CA = 1 CA = 5 CR = CA = 1 CR = CA = 5 Une approche de réplication fondée sur les plans...

  12. Mécanisme de Réplication • Minimiser les probabilités de panne des agents les plus critiques • Fiabilité des réplicas (pi) • Criticité des agents (ci) • Agenti ensemble des réplicas Ri = {r1, r2, … , rni} • P(Panne (Agenti) = 1) = (1-p1) × (1-p2) × … × (1-pni) • p1 + p2 + … + pni ≤ ti • ti = ci × P / C • P = Somme des fiabilités de tous les réplicas • C = Somme des criticités de tous les agents Une approche de réplication fondée sur les plans...

  13. Implémentation • DARX (Dynamic Agent Replication eXtension) • Plateforme de tolérance aux fautes • Grande échelle • Dynamisme • Environnement hétérogène (JAVA) • Modèle de faute: crash Une approche de réplication fondée sur les plans...

  14. DARX Architecture Agent Contrôle de réplication adaptatif MAS Adaptateur Réplication DARX Nommage & Localisation Détection de Défaillances Une approche de réplication fondée sur les plans...

  15. Expérimentations • Chaque agent doit exécuter une séquence de 5 plans • Chaque plan avec 10 actions • La durée moyenne des actions égale à 2 secondes • Chaque expérimentation exécutée 10 fois Une approche de réplication fondée sur les plans...

  16. Résultats – overhead Une approche de réplication fondée sur les plans...

  17. Résultats – qualité Une approche de réplication fondée sur les plans...

  18. Conclusions et perspectives • Proposition d’une nouvelle approche de réplication fondée sur les plans • Les résultats préliminaires sont prometteurs, mais… • Définir formellement le problème de la tolérance aux pannes dans les systèmes multi-agents • Modeler la criticité comme une courbe au lieu d'une valeur simple • Raffiner le mécanisme de réplication en considérant les actions jointes des agents (stratégie de réplication par groupe d'agents) • Expérimentations grande échelle + comparaison avec d’autres techniques Une approche de réplication fondée sur les plans...

  19. Publications • J.-P. Briot, Z. Guessoum, S. Aknine, A. L. Almeida, N. Faci, J. Malenfant, O. Marin, P. Sens. Engineering Control Strategies for Replication-Based Fault-Tolerant Multi-Agent Systems. In: International Workshop on Engineering of Fault Tolerant Systems, Luxembourg, June 2006. • J.-P. Briot, Z. Guessoum, S. Aknine, A. L. Almeida, N. Faci, M. Gatti, C. Lucena, J. Malenfant, O. Marin, P. Sens. Experience and Prospects for Various Control Strategies for Self-Replicating Multi-Agent Systems. In: Workshop on Software Engineering for Adaptive and Self-Managing Systems, ICSE 2006, Shangai, China, May 2006. • A. L. Almeida, S. Aknine, J.-P. Briot, J. Malenfant. Plan-based Replication for Fault-tolerant Multi-Agent Systems. In: Proceedings of the 11th IEEE Workshop on Dependable Parallel, Distributed and Network-Centric Systems (DPDNS’06), 20th International Parallel and Distributed Processing Symposium (IPDPS’2006), Rhodes Island, Greece, April 2006. • A. L. Almeida, S. Aknine, J.-P. Briot, J. Malenfant. Une approche de réplication fondée sur les plans pour la tolérance aux fautes des systèmes multi-agents. In: Journées Francophones sur les Systèmes Multi-Agents (JFSMA), Calais, France, November 2005. Une approche de réplication fondée sur les plans...

  20. Smart- s Une approche de réplicationfondée sur les planspour la tolérance aux fautesdes systèmes multi-agents Alessandro de Luna Almeida Samir Aknine Jean-Pierre Briot Jacques Malenfant

More Related