1 / 26

XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia DEIS, University of Calabria, Italy Présenté par : ROUMMIEH Youssef Master 2 Recherche : Système d’information Grille de donnée. Le 31 janvier 2006. BD1. BD2. BDn. Intégration de donnée : But. Utilisateur.

daryl
Télécharger la présentation

XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. XML Data Integration in OGSA Grids Carmela Comito & Domenico Talia DEIS, University of Calabria, Italy Présenté par : ROUMMIEH Youssef Master 2 Recherche : Système d’information Grille de donnée Le 31 janvier 2006 Youssef ROUMMIEH

  2. BD1 BD2 BDn Intégration de donnée : But Utilisateur Système intégration de donnée Vue uniforme de donnée (Virtuel) Youssef ROUMMIEH

  3. Problématique d’intégration • BD à intégrer auront été développées indépendamment  hétérogènes • Hétérogénéité des modèles de données (OO, Relationnel, etc.) • Hétérogénéité des schémas • Conflits de type (date) • Conflits de description (adresse) • Conflits structurels (personne) • Hétérogénéité sémantique • Conflits de nommage (nom du même concept est différent) • Conflits de nommage de valeurs (valeur d’un concept est différent) Youssef ROUMMIEH

  4. Plan • Introduction • Intégration de données sur les grilles • Les approches existantes pour intégrer les données • Problématique de ces approches • Structure décentralisée d’intégration de donnée XML • Modèle intégration • Algorithme reformulation pour les requêtes XPath • Système d’intégration de donnée de Grille (GDIS) • Évaluation • Conclusion Youssef ROUMMIEH

  5. Introduction • Intégration de donnée sur les grilles • Larges volumes de données, hétérogènes, distribués, et dynamiques • Bénéficier de l’infrastructure de grille basé sur OGSA • Deux approches principales • Fédération • Les schémas sont fusionnés en schéma fédéré • Allocation de ressource est statique  ne peut pas profiter d’évolutions des circonsatnces • Mediator/wrapper • Vue globale multi-sources/vue mono-source • Coordination de médiateurs a fait centralement  SDs ne peuvent pas changer souvent Youssef ROUMMIEH

  6. Introduction • Approches centralisées ne bénéficient de la nature dynamique et distribuée de ressources de la grille  SI décentralisé qui conserve la sémantique • OGSA prévoit un ensemble d’outils permettant de gérer l’accès aux donnés • Intégration de schéma en établissant les connections sémantiques • GDMS : wrapper/mediator basé sur un schéma global • Hyper : donnée relationnelle dans les systèmes P2P • Approche proposée : Structure pour intégrer les sources de données XML hétérogènes distribués sur le grille Youssef ROUMMIEH

  7. A1 A0 A5 A4 A2 A3 Modèle d’Intégration • Grille • environnement dynamique et distribué • Architecture centralisé n’est pas convenable • Approche proposée : • Intégrer les SS d’une manière décentralisée • Basé sur le schéma mappings => correspondances entre les schémas sources • collection de schémas locaux • Connections sémantique entre les nœuds reliés A6 Youssef ROUMMIEH

  8. Mappings transitives A B C Mappings point-to-point Mappings point-to-point Modèle d’Intégration • Chaque schéma source est • relié directement au petit nombre d’autres schémas. • accessible de tous les autres schémas qui appartiennent à sa « fermeture transitive » • Graphe de sources reliés sémantiquement • Aucune distinction entre sources de données et médiateur Youssef ROUMMIEH

  9. Schéma source (XML) - E1 (A1) Schéma dest (XML) - E2 (A2) Mappings Path E1~Path E2 Mappings Path E2~Path E1 Modèle d’Intégration • Hétérogénéités structurales  association de paths dans les différentes schémas • Basé sur les mappings path-to-path exprimé dans la langage de query XPath. Youssef ROUMMIEH

  10. Modèle d’Intégration • . • ‘n’ = label, ‘.’= nœud courant, ‘/’=child axis, ‘//’=descendant axis, ‘[]’ = prédicat • Schéma de mappings sur S= ensemble de règles de mappings sur S • . • RM = label de la règle • SS = schéma source • PS = expression path dans le schéma source • SD = schéma destination • PD = expression path dans le schéma destination • CM = cardinalité de mappings : 1-1, 1-N, N-1, N-N • Règles mappings  documents XMAP associé au SS Youssef ROUMMIEH

  11. Schémas XML pour XMAP Youssef ROUMMIEH

  12. S1 S2 /Artist[style=″Cubism″] Artist /artefact/title Info /Artist id code first-name XMAP Name last-name P artefact kind P1=/Artist/style painter style category P2=/Artist/artefact/title Painting title Sculptor School Title artefact Style Algorithme pour reformuler la requête XpathInput : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 1. identifier les expressions path dans Q Q=/Artist[style=″Cubism″]/artefact/title 1 Youssef ROUMMIEH

  13. Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 1. identifier les expressions path dans Q • 2. Chercher les paths candidats dans le schéma relié à S • Chercher les paths correspondants dans toutes les sources sémantiquement relié à S. Youssef ROUMMIEH

  14. S1 S2 /Artist[style=″Cubism″] Artist /artefact/title Info /Artist id code first-name XMAP Name last-name P artefact kind P1=/Artist/style painter style category P2=/Artist/artefact/title Painting title Sculptor School Candidate set S◊2 P◊1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style Title artefact P◊2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact Style Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 2. Chercher les paths candidats dans le schéma relié à S Q=/Artist[style=″Cubism″]/artefact/title 1 2 Youssef ROUMMIEH

  15. Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 1. identifier les expressions path dans Q • 2. Chercher les paths candidats dans le schéma relié à S • 3.Pruning de schémas candidate • au moins un path candidate pour chaque path dans Q • aucune de ces paths candidates n’a été déjà utilisée Youssef ROUMMIEH

  16. destination set S*2 S1 S2 P*1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style /Artist[style=″Cubism″] Artist /artefact/title Info /Artist id code style first-name P*2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact XMAP Name last-name artefact kind painter title P category School P1=/Artist/style Painting Title P2=/Artist/artefact/title Sculptor artefact Style Candidate set S◊2 P◊1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style P◊2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 3.Pruning de schémas candidate Q=/Artist[style=″Cubism″]/artefact/title 1 3 2 Youssef ROUMMIEH

  17. Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 1. identifier les expressions path dans Q • 2. Chercher les paths candidats dans le schéma relié à S • 3.Pruning de schémas candidate • 4. Construction des requêtes reformulées • Estimer les contraintes de cardinalités • 1-1 ou N-1  simple requête sur le schéma de destination • 1-N  plus d’une requête sur le schéma de destination • Vérifier les conditions de jointure • Composition les requêtes XPath Youssef ROUMMIEH

  18. S1 S2 /Artist[style=″Cubism″] Artist /artefact/title Info /Artist id code style first-name XMAP Name last-name destination set artefact kind S*2 painter title P P*1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style category School P1=/Artist/style Painting P*2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact Title P2=/Artist/artefact/title Sculptor artefact Style Candidate set S◊2 P◊1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style P◊2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* Q=/Artist[style=″Cubism″]/artefact/title • 4. Construction de la requête reformulées QR1=/Info/kind/Painter[School=″Cubism″]/Painting/Title QR2=/Info/kind/Sculptor[style=″Cubism″]/artefact 1 4 3 2 Youssef ROUMMIEH

  19. Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* • 1. identifier les expressions path dans Q • 2. Chercher les paths candidats dans le schéma relié à S • 3.Pruning de schémas candidate • 4. Construction de la requête reformulées • 5. Invocation récursive de l’algorithme • Sur les requêtes reformulées pour produire les requêtes qui correspondent à chaque mappings transitives. Youssef ROUMMIEH

  20. S1 S2 /Artist[style=″Cubism″] Artist /artefact/title Info /Artist id code style first-name XMAP Name last-name destination set artefact kind S*2 painter title P P*1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style category School P1=/Artist/style Painting P*2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact Title P2=/Artist/artefact/title Sculptor artefact Style Candidate set S◊2 P◊1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style P◊2,2=/Info/Kind/Painter/Painting/Title, /Info/kind/Sculptor/artefact Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q* Q=/Artist[style=″Cubism″]/artefact/title • 5. Invocation récursive de l’algorithme QR1=/Info/kind/Painter[School=″Cubism″]/Painting/Title QR2=/Info/kind/Sculptor[style=″Cubism″]/artefact 1 4 3 2 Youssef ROUMMIEH

  21. Grid Data Integration System (GDIS) • Architecture d’intégration de donnée décentralisée basé sur le service • Réconciliation de sources de données hétérogènes • Approche basé sur wrapper/mediator • Médiateur décentralisé XMAP  sémantique • Wrapper  syntactique • Basé sur OGSA en étendant OGSA-DAI et OGSA-DQP • Spécifier les mappings sémantiques • Exécuter l’algorithme de reformulation de la requête XMAP Youssef ROUMMIEH

  22. Architecture GDIS Youssef ROUMMIEH

  23. Évaluation • Article bien structuré, parfois il présente des ambiguïtés • L’exemple donné pour illustrer l’algorithme n’est pas détaillé • Points fortes : • L’utilisateur peut retrouver les données en soumettant une simple requête XPath • Ajouter une source dans le système  établir des connections avec un petite nombre de schémas • Pruning dans la 3ème étape de l’algorithme permet d’éliminer une partie des schémas candidates sans les tester • Les prototypes du logiciel de l'algorithme XMAP et le système GDIS sont développés actuellement • Points faibles : • Changement dans un source  changement dans tous les mappings reliés à ce source • Le modèle d’intégration proposée ne résoudre que les hétérogénéités structurales sur les BD XML • Les BDRs sont supportées dans la version courant de OGSA-DQP Youssef ROUMMIEH

  24. Évaluation • /S1/Artist[style=« Cubism »]/name ~ Select name from Artist where style =« Cubism » Youssef ROUMMIEH

  25. Conclusion • Intégration de la donnée dans le grille • Concevoir une structure pour intégrer des donnée sources XML hétérogènes • Un algorithme du reformulation de la requête est proposé • le formalisme d’intégration XML est exposé comme un Service de la Grille dans l'architecture GDIS. Youssef ROUMMIEH

  26. Merci de votre attention Youssef ROUMMIEH

More Related