260 likes | 436 Vues
XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia DEIS, University of Calabria, Italy Présenté par : ROUMMIEH Youssef Master 2 Recherche : Système d’information Grille de donnée. Le 31 janvier 2006. BD1. BD2. BDn. Intégration de donnée : But. Utilisateur.
E N D
XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia DEIS, University of Calabria, Italy Présenté par : ROUMMIEH Youssef Master 2 Recherche : Système d’information Grille de donnée Le 31 janvier 2006 Youssef ROUMMIEH
BD1 BD2 BDn Intégration de donnée : But Utilisateur Système intégration de donnée Vue uniforme de donnée (Virtuel) Youssef ROUMMIEH
Problématique d’intégration • BD à intégrer auront été développées indépendamment hétérogènes • Hétérogénéité des modèles de données (OO, Relationnel, etc.) • Hétérogénéité des schémas • Conflits de type (date) • Conflits de description (adresse) • Conflits structurels (personne) • Hétérogénéité sémantique • Conflits de nommage (nom du même concept est différent) • Conflits de nommage de valeurs (valeur d’un concept est différent) Youssef ROUMMIEH
Plan • Introduction • Intégration de données sur les grilles • Les approches existantes pour intégrer les données • Problématique de ces approches • Structure décentralisée d’intégration de donnée XML • Modèle intégration • Algorithme reformulation pour les requêtes XPath • Système d’intégration de donnée de Grille (GDIS) • Évaluation • Conclusion Youssef ROUMMIEH
Introduction • Intégration de donnée sur les grilles • Larges volumes de données, hétérogènes, distribués, et dynamiques • Bénéficier de l’infrastructure de grille basé sur OGSA • Deux approches principales • Fédération • Les schémas sont fusionnés en schéma fédéré • Allocation de ressource est statique ne peut pas profiter d’évolutions des circonsatnces • Mediator/wrapper • Vue globale multi-sources/vue mono-source • Coordination de médiateurs a fait centralement SDs ne peuvent pas changer souvent Youssef ROUMMIEH
Introduction • Approches centralisées ne bénéficient de la nature dynamique et distribuée de ressources de la grille SI décentralisé qui conserve la sémantique • OGSA prévoit un ensemble d’outils permettant de gérer l’accès aux donnés • Intégration de schéma en établissant les connections sémantiques • GDMS : wrapper/mediator basé sur un schéma global • Hyper : donnée relationnelle dans les systèmes P2P • Approche proposée : Structure pour intégrer les sources de données XML hétérogènes distribués sur le grille Youssef ROUMMIEH
A1 A0 A5 A4 A2 A3 Modèle d’Intégration • Grille • environnement dynamique et distribué • Architecture centralisé n’est pas convenable • Approche proposée : • Intégrer les SS d’une manière décentralisée • Basé sur le schéma mappings => correspondances entre les schémas sources • collection de schémas locaux • Connections sémantique entre les nœuds reliés A6 Youssef ROUMMIEH
Mappings transitives A B C Mappings point-to-point Mappings point-to-point Modèle d’Intégration • Chaque schéma source est • relié directement au petit nombre d’autres schémas. • accessible de tous les autres schémas qui appartiennent à sa « fermeture transitive » • Graphe de sources reliés sémantiquement • Aucune distinction entre sources de données et médiateur Youssef ROUMMIEH
Schéma source (XML) - E1 (A1) Schéma dest (XML) - E2 (A2) Mappings Path E1~Path E2 Mappings Path E2~Path E1 Modèle d’Intégration • Hétérogénéités structurales association de paths dans les différentes schémas • Basé sur les mappings path-to-path exprimé dans la langage de query XPath. Youssef ROUMMIEH
Modèle d’Intégration • . • ‘n’ = label, ‘.’= nœud courant, ‘/’=child axis, ‘//’=descendant axis, ‘[]’ = prédicat • Schéma de mappings sur S= ensemble de règles de mappings sur S • . • RM = label de la règle • SS = schéma source • PS = expression path dans le schéma source • SD = schéma destination • PD = expression path dans le schéma destination • CM = cardinalité de mappings : 1-1, 1-N, N-1, N-N • Règles mappings documents XMAP associé au SS Youssef ROUMMIEH
Schémas XML pour XMAP Youssef ROUMMIEH
S1 S2 /Artist[style=″Cubism″] Artist /artefact/title Info /Artist id code first-name XMAP Name last-name P artefact kind P1=/Artist/style painter style category P2=/Artist/artefact/title Painting title Sculptor School Title artefact Style Algorithme pour reformuler la requête XpathInput : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 1. identifier les expressions path dans Q Q=/Artist[style=″Cubism″]/artefact/title 1 Youssef ROUMMIEH
Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 1. identifier les expressions path dans Q • 2. Chercher les paths candidats dans le schéma relié à S • Chercher les paths correspondants dans toutes les sources sémantiquement relié à S. Youssef ROUMMIEH
S1 S2 /Artist[style=″Cubism″] Artist /artefact/title Info /Artist id code first-name XMAP Name last-name P artefact kind P1=/Artist/style painter style category P2=/Artist/artefact/title Painting title Sculptor School Candidate set S◊2 P◊1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style Title artefact P◊2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact Style Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 2. Chercher les paths candidats dans le schéma relié à S Q=/Artist[style=″Cubism″]/artefact/title 1 2 Youssef ROUMMIEH
Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 1. identifier les expressions path dans Q • 2. Chercher les paths candidats dans le schéma relié à S • 3.Pruning de schémas candidate • au moins un path candidate pour chaque path dans Q • aucune de ces paths candidates n’a été déjà utilisée Youssef ROUMMIEH
destination set S*2 S1 S2 P*1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style /Artist[style=″Cubism″] Artist /artefact/title Info /Artist id code style first-name P*2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact XMAP Name last-name artefact kind painter title P category School P1=/Artist/style Painting Title P2=/Artist/artefact/title Sculptor artefact Style Candidate set S◊2 P◊1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style P◊2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 3.Pruning de schémas candidate Q=/Artist[style=″Cubism″]/artefact/title 1 3 2 Youssef ROUMMIEH
Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 1. identifier les expressions path dans Q • 2. Chercher les paths candidats dans le schéma relié à S • 3.Pruning de schémas candidate • 4. Construction des requêtes reformulées • Estimer les contraintes de cardinalités • 1-1 ou N-1 simple requête sur le schéma de destination • 1-N plus d’une requête sur le schéma de destination • Vérifier les conditions de jointure • Composition les requêtes XPath Youssef ROUMMIEH
S1 S2 /Artist[style=″Cubism″] Artist /artefact/title Info /Artist id code style first-name XMAP Name last-name destination set artefact kind S*2 painter title P P*1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style category School P1=/Artist/style Painting P*2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact Title P2=/Artist/artefact/title Sculptor artefact Style Candidate set S◊2 P◊1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style P◊2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* Q=/Artist[style=″Cubism″]/artefact/title • 4. Construction de la requête reformulées QR1=/Info/kind/Painter[School=″Cubism″]/Painting/Title QR2=/Info/kind/Sculptor[style=″Cubism″]/artefact 1 4 3 2 Youssef ROUMMIEH
Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 1. identifier les expressions path dans Q • 2. Chercher les paths candidats dans le schéma relié à S • 3.Pruning de schémas candidate • 4. Construction de la requête reformulées • 5. Invocation récursive de l’algorithme • Sur les requêtes reformulées pour produire les requêtes qui correspondent à chaque mappings transitives. Youssef ROUMMIEH
S1 S2 /Artist[style=″Cubism″] Artist /artefact/title Info /Artist id code style first-name XMAP Name last-name destination set artefact kind S*2 painter title P P*1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style category School P1=/Artist/style Painting P*2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact Title P2=/Artist/artefact/title Sculptor artefact Style Candidate set S◊2 P◊1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style P◊2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* Q=/Artist[style=″Cubism″]/artefact/title • 5. Invocation récursive de l’algorithme QR1=/Info/kind/Painter[School=″Cubism″]/Painting/Title QR2=/Info/kind/Sculptor[style=″Cubism″]/artefact 1 4 3 2 Youssef ROUMMIEH
Grid Data Integration System (GDIS) • Architecture d’intégration de donnée décentralisée basé sur le service • Réconciliation de sources de données hétérogènes • Approche basé sur wrapper/mediator • Médiateur décentralisé XMAP sémantique • Wrapper syntactique • Basé sur OGSA en étendant OGSA-DAI et OGSA-DQP • Spécifier les mappings sémantiques • Exécuter l’algorithme de reformulation de la requête XMAP Youssef ROUMMIEH
Architecture GDIS Youssef ROUMMIEH
Évaluation • Article bien structuré, parfois il présente des ambiguïtés • L’exemple donné pour illustrer l’algorithme n’est pas détaillé • Points fortes : • L’utilisateur peut retrouver les données en soumettant une simple requête XPath • Ajouter une source dans le système établir des connections avec un petite nombre de schémas • Pruning dans la 3ème étape de l’algorithme permet d’éliminer une partie des schémas candidates sans les tester • Les prototypes du logiciel de l'algorithme XMAP et le système GDIS sont développés actuellement • Points faibles : • Changement dans un source changement dans tous les mappings reliés à ce source • Le modèle d’intégration proposée ne résoudre que les hétérogénéités structurales sur les BD XML • Les BDRs sont supportées dans la version courant de OGSA-DQP Youssef ROUMMIEH
Évaluation • /S1/Artist[style=« Cubism »]/name ~ Select name from Artist where style =« Cubism » Youssef ROUMMIEH
Conclusion • Intégration de la donnée dans le grille • Concevoir une structure pour intégrer des donnée sources XML hétérogènes • Un algorithme du reformulation de la requête est proposé • le formalisme d’intégration XML est exposé comme un Service de la Grille dans l'architecture GDIS. Youssef ROUMMIEH
Merci de votre attention Youssef ROUMMIEH