1 / 95

Uma Abordagem Bottom-Up para a Integração Semântica de Esquemas XML

UFRGS/II - PPGC. Uma Abordagem Bottom-Up para a Integração Semântica de Esquemas XML. Tese de Doutorado por Ronaldo dos Santos Mello Prof. Carlos Alberto Heuser Orientador. Roteiro. Introdução Abordagem de Integração Proposta Modelo Canônico e Mapeamentos Etapa de Conversão da DTD

bliss
Télécharger la présentation

Uma Abordagem Bottom-Up para a Integração Semântica de Esquemas XML

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. UFRGS/II - PPGC Uma Abordagem Bottom-Up para a Integração Semântica de Esquemas XML Tese de Doutorado por Ronaldo dos Santos Mello Prof. Carlos Alberto Heuser Orientador

  2. Roteiro • Introdução • Abordagem de Integração Proposta • Modelo Canônico e Mapeamentos • Etapa de Conversão da DTD • Etapa de Integração Semântica • Considerações Finais

  3. Roteiro • Introdução • Abordagem de Integração Proposta • Modelo Canônico e Mapeamentos • Etapa de Conversão da DTD • Etapa de Integração Semântica • Considerações Finais

  4. Motivação • Contexto do problema • consultas a fontes de dados heterogêneas e semi-estruturadas na Web • foco em dados XML • Áreas de pesquisa • integração de esquemas • tradução e otimização de consultas globais • integração de resultados de consultas

  5. Motivação • Contexto do problema • consultas a fontes de dados heterogêneas e semi-estruturadas na Web • foco em dados XML • Áreas de pesquisa • integração de esquemas • tradução e otimização de consultas globais • integração de resultados de consultas

  6. Objetivo da Tese • Uma abordagem de integração semântica de esquemas XML • semi-automático • mínima intervenção do usuário • processo bottom-up • esquema global que representa de forma garantida todas as informações dos esquemas das fontes • modelo canônico conceitual • alto nível de abstração

  7. Trabalhos Relacionados

  8. Trabalhos Relacionados

  9. Características Trabalho Limitações na integração de esquemas XML CUPID • não tratam a integração de representações alternativas de elementos • não tratam de forma completa a integração de elementos textuais com estruturados MOMIS

  10. Características

  11. Proposta da Tese • Processo de integração semântica de esquemas XML • tratamento dos casos de unificação de elementos heterogêneos • modelagem canônica conceitual de um esquema XML • análise do esquema XML • inferências semânticas (heurísticas) • análise de documentos XML

  12. Roteiro • Introdução • Abordagem de Integração Proposta • Modelo Canônico e Mapeamentos • Etapa de Conversão da DTD • Etapa de Integração Semântica • Considerações Finais

  13. Arquitetura de Mediação SitesWeb SitesWeb Documentos XML

  14. Camada de Wrappers • disponibiliza um • esquema local para • uma ou mais fontes • executa consultas • nestas fontes Wrapper 1 Wrapper n ... DTD 1 DTD n SitesWeb SitesWeb Documentos XML

  15. Mediador • integra esquemas locais • gerencia consultas • globais a um conjunto de • fontes Esquema Global Documento XML global Consulta global textual Usuário Especialista Mediador Consulta local textual DTDs Documentos XML Locais Wrapper 1 Wrapper n ... DTD 1 DTD n SitesWeb SitesWeb Documentos XML

  16. Interface de Consulta • define consultas sobre • o esquema global • apresenta os resultados Consulta global Resultados Interface de Consulta Esquema Global Consulta global textual Documento XML global Usuário Especialista Mediador Documentos XML Locais Consultas locais textuais DTDs Wrapper 1 Wrapper n ... DTD 1 DTD n SitesWeb SitesWeb Documentos XML

  17. Processo de Integração Esquema Global Camada de Mediação ARTEMIS Integração Semântica . . . Esquema Conceitual 1 Esquema Conceitual n Usuário Especialista . . . Conversão da DTD Conversão da DTD . . . DTD 1 Documentos XML DTD n Documentos XML

  18. Processo de Integração Esquema Global Camada de Mediação ARTEMIS Integração Semântica . . . Esquema Conceitual 1 Esquema Conceitual n Usuário Especialista . . . Conversão da DTD Conversão da DTD . . . DTD 1 Documentos XML DTD n Documentos XML

  19. Processo de Integração Esquema Global Camada de Mediação ARTEMIS Integração Semântica . . . Esquema Conceitual 1 Esquema Conceitual n Usuário Especialista . . . Conversão da DTD Conversão da DTD . . . DTD 1 Documentos XML DTD n Documentos XML

  20. Roteiro • Introdução • Abordagem de Integração Proposta • Modelo Canônico e Mapeamentos • Etapa de Conversão da DTD • Etapa de Integração Semântica • Considerações Finais

  21. Roteiro • Introdução • Abordagem de Integração Proposta • Modelo Canônico e Mapeamentos • 3.1 Modelo Conceitual Canônico (MCC) • 3.2 Mapeamento MCC-DTD • Etapa de Conversão da DTD • Etapa de Integração Semântica • Considerações Finais

  22. Modelo Conceitual Canônico (MCC) • Variante do ORM (Object with Roles Model) Halphin, T. Object-Role Modeling (ORM/NIAM), Handbook on Architectures of Information Systems. Springer-Verlag, 1998. • notação gráfica do modelo ER

  23. Exemplo de Esquema MCC string string (1,1) (1,N) Publisher Publication Name Title (1,1) (1,1) string (1,N) (1,N) (1,N) (1,N) University string (1,N) (1,N) Book Author Proceedings (1,N) (1,N) (1,N) (1,N) (1,N) (1,1) (1,1) workAddress homeAddress (1,1) Business string (0,1) (1,1) Conference Category string Address integer {technical, fiction} (1,N) (1,N) (1,N) (1,1) (1,1) (1,1) Number City Street string integer string

  24. Exemplo de Esquema MCC string string (1,1) (1,N) Publisher Publication Name Title (1,1) (1,1) string (1,N) (1,N) (1,N) (1,N) University string (1,N) (1,N) Book Author Proceedings (1,N) (1,N) (1,N) (1,N) (1,N) (1,1) (1,1) workAddress homeAddress (1,1) Business string (0,1) (1,1) Conference Category string Address integer {technical, fiction} (1,N) (1,N) (1,N) (1,1) (1,1) (1,1) conceito NL Number City Street string integer string

  25. Exemplo de Esquema MCC string string (1,1) (1,N) Publisher Publication Name Title (1,1) (1,1) string (1,N) (1,N) (1,N) (1,N) University string (1,N) (1,N) Book Author Proceedings (1,N) (1,N) (1,N) (1,N) (1,N) (1,1) (1,1) workAddress homeAddress (1,1) Business string (0,1) (1,1) string Conference Category Address integer {technical, fiction} (1,N) (1,N) (1,N) (1,1) (1,1) (1,1) Number City Street string integer string conceito L

  26. Exemplo de Esquema MCC string string (1,1) (1,N) Publisher Publication Name Title (1,1) (1,1) string (1,N) (1,N) (1,N) (1,N) University string (1,N) (1,N) Book Author Proceedings (1,N) (1,N) (1,N) (1,N) (1,N) (1,1) (1,1) workAddress homeAddress (1,1) Business string (0,1) (1,1) Conference Category string relacionamento de associação Address integer {technical, fiction} (1,N) (1,N) (1,N) (1,1) (1,1) (1,1) Number City Street string integer string

  27. Exemplo de Esquema MCC string string (1,1) (1,N) Publisher Publication Name Title (1,1) (1,1) string (1,N) (1,N) (1,N) (1,N) University string (1,N) (1,N) Book Author Proceedings (1,N) (1,N) (1,N) (1,N) (1,N) (1,1) (1,1) workAddress homeAddress (1,1) Business string (0,1) (1,1) Conference Category string Address integer {technical, fiction} (1,N) (1,N) (1,N) (1,1) relacionamento de herança (1,1) (1,1) Number City Street string integer string

  28. Exemplo de Esquema MCC disjunção string string (1,1) (1,N) Publisher Publication Name Title (1,1) (1,1) string (1,N) (1,N) (1,N) (1,N) University string (1,N) (1,N) Book Author Proceedings (1,N) (1,N) (1,N) (1,N) (1,N) (1,1) (1,1) workAddress homeAddress (1,1) Business string (0,1) (1,1) Conference Category string Address integer {technical, fiction} (1,N) (1,N) (1,N) (1,1) (1,1) (1,1) Number City Street string integer string

  29. Roteiro • Introdução • Abordagem de Integração Proposta • Modelo Canônico e Mapeamentos • 3.1 Modelo Conceitual Canônico (MCC) • 3.2 Mapeamento MCC-DTD • Etapa de Conversão da DTD • Etapa de Integração Semântica • Considerações Finais

  30. Mapeamento MCC - DTD • Informação de mapeamento • correspondência entre o esquema global e os esquemas locais • finalidade: tradução de consultas globais • Abordagens para definição de mapeamentos • catálogos de mapeamento • visões

  31. Mapeamento MCC - DTD • Informação de mapeamento • correspondência entre o esquema global e os esquemas locais • finalidade: tradução de consultas globais • Abordagens para definição de mapeamentos • catálogos de mapeamento • visões

  32. Mapeamento MCC - DTD • Estratégia de mapeamento • expressões de caminho XPath associadas a conceitos e relacionamentos do esquema global • por quê XPath? • XPath é um padrão para consulta a dados XML • visão XPath: expressão direta de busca para um elemento ou atributo em uma fonte XML

  33. Mapeamento de Conceitos • Expressão de caminho absoluto XPath Author (1,N) Book (1,N) DTD X <!ELEMENT Book (AuthorList, ...)> <!ELEMENT AuthorList (Author+)> <!ELEMENT Author (...)>

  34. Mapeamento de Conceitos • Expressão de caminho absoluto XPath DTD X : /Book/ Author (1,N) Book (1,N) DTD X <!ELEMENT Book (AuthorList, ...)> <!ELEMENT AuthorList (Author+)> <!ELEMENT Author (...)>

  35. Mapeamento de Conceitos • Expressão de caminho absoluto XPath DTD X : /Book/AuthorList Author (1,N) Book (1,N) DTD X <!ELEMENT Book (AuthorList, ...)> <!ELEMENT AuthorList (Author+)> <!ELEMENT Author (...)>

  36. Mapeamento de Conceitos • Expressão de caminho absoluto XPath DTD X : /Book/AuthorList/Author Author (1,N) Book (1,N) DTD X <!ELEMENT Book (AuthorList, ...)> <!ELEMENT AuthorList (Author+)> <!ELEMENT Author (...)>

  37. Mapeamento de Relacionamentos • Expressão de caminho relativo XPath Author (1,N) Book (1,N) DTD X <!ELEMENT Book (AuthorList, ...)> <!ELEMENT AuthorList (Author+)> <!ELEMENT Author (...)>

  38. Mapeamento de Relacionamentos • Expressão de caminho relativo XPath DTD X: BookAuthor: Author (1,N) Book (1,N) DTD X <!ELEMENT Book (AuthorList, ...)> <!ELEMENT AuthorList (Author+)> <!ELEMENT Author (...)>

  39. Mapeamento de Relacionamentos • Expressão de caminho relativo XPath DTD X: BookAuthor: AuthorList Author (1,N) Book (1,N) DTD X <!ELEMENT Book (AuthorList, ...)> <!ELEMENT AuthorList (Author+)> <!ELEMENT Author (...)>

  40. Mapeamento de Relacionamentos • Expressão de caminho relativo XPath DTD X: BookAuthor: AuthorList/Author Author (1,N) Book (1,N) DTD X <!ELEMENT Book (AuthorList, ...)> <!ELEMENT AuthorList (Author+)> <!ELEMENT Author (...)>

  41. Mapeamento de Relacionamentos • Expressão de caminho relativo XPath DTD X: Author Book: Author (1,N) Book (1,N) DTD X <!ELEMENT Book (AuthorList, ...)> <!ELEMENT AuthorList (Author+)> <!ELEMENT Author (...)>

  42. Mapeamento de Relacionamentos • Expressão de caminho relativo XPath DTD X: Author Book: .. Author (1,N) Book (1,N) DTD X <!ELEMENT Book (AuthorList, ...)> <!ELEMENT AuthorList (Author+)> <!ELEMENT Author (...)>

  43. Mapeamento de Relacionamentos • Expressão de caminho relativo XPath DTD X: Author Book: ../.. Author (1,N) Book (1,N) DTD X <!ELEMENT Book (AuthorList, ...)> <!ELEMENT AuthorList (Author+)> <!ELEMENT Author (...)>

  44. Roteiro • Introdução • Abordagem de Integração Proposta • Modelo Canônico e Mapeamentos • Etapa de Conversão da DTD • Etapa de Integração Semântica • Considerações Finais

  45. Etapa de Conversão da DTD • Contribuição principal da abordagem • diferencial em relação a outros trabalhos • define um esquema semântico para uma DTD • resulta de uma análise detalhada do esquema + dados de documentos XML + inferências semânticas • modelagem canônica +adequada ao domínio esquema global +preciso

  46. Processo de Conversão Esquema Conceitual Definitivo Reestruturação Esquema Conceitual Preliminar Conversão Usuário Especialista DTD Pré-Processada Pré-Processamento Documentos XML DTD Fonte XML

  47. Processo de Conversão Esquema Conceitual Definitivo Reestruturação Esquema Conceitual Preliminar Conversão Usuário Especialista • modifica detalhes de estruturação da DTD: • remoção de • informação irrelevante • para o domínio • tratamento de • elementos com • aninhamento • renomeação de • informação DTD Pré-Processada Pré-Processamento Documentos XML DTD Fonte XML

  48. Remoção de Elementos <!ELEMENT Book(AuthorList, Publisher)> ... <!ELEMENT AuthorList(Author)+>

  49. Remoção de Elementos <!ELEMENT Book(AuthorList, Publisher)> ... <!ELEMENT AuthorList(Author)+> <!ELEMENT Book((Author)+, Publisher)>

  50. Tratamento de Aninhamentos <!ELEMENT Address((Street, Number)?, City)>

More Related