1 / 11

Érick de Souza Carvalho

Instituto Tecnológico de Aeronáutica. CE-262 Ontologia e Web Semântica. Prof. Dr. José M. Parente de Oliveira. Integração de Diferentes Fontes de Dados Aula 09. Érick de Souza Carvalho. Revisão da Aula Anterior. Conhecemos as fontes de dados: Memória , Arquivo e Banco de Dados

step
Télécharger la présentation

Érick de Souza Carvalho

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Instituto Tecnológico de Aeronáutica CE-262 Ontologia e Web Semântica Prof. Dr. José M. Parente de Oliveira Integração de Diferentes Fontes de Dados Aula 09 Érick de Souza Carvalho

  2. Revisão da Aula Anterior • Conhecemos as fontes de dados: Memória, Arquivo e Banco de Dados • Vimos uma avaliação de Sistemas de Base de Conhecimentos (Knowledge Base Systems -KBS) para grandes bases de dados OWL. • KBSs Avaliados: Memory-based systems: OWLJessKB, Memory-based Sesame Systems with persistent storage: Database-based Sesame, DLDB-OWL • KBSs Não-avaliados (Descartados): Memory-based Jena, Database-based Jena, KAON, TRIPLE, RACER

  3. Integração X Descentralização • A Web tradicional é naturalmente descentralizada e distribuída. • Logicamente a Web Semântica também é descentralizada e distribuída! Os dados vêm de diferentes ontologias. • Integração X Descentralização: • Quando falamos em integração, a idéia é trabalhar de forma centralizada, ou seja, pegar os dados que estão distribuídos e integrá-los. Mais usado dentro de uma empresa. • Para trabalharmos com uma base de dados descentralizada usamos uma arquitetura P2P com várias bases de dados distribuídas. Mais usado na Internet.

  4. Integração de Bases de Dados Temos duas bases separadas que têm algo em comum, ou que tratam de um mesmo domínio e desejamos transformá-las em uma única base. Normalmente vamos fazer a integração de ontologias de domínios similares. Para podermos integrar precisamos conhecer as bases e fazer um mapeamento entre elas. No caso da Web Semântica, precisamos conhecer as ontologias, as correspondências semânticas entre seus elementos e fazer o mapeamento semântico entre elas. Podemos fazer isto manualmente ou usando uma ferramenta

  5. Learning to Map Between Ontologies on the Semantic Web Ontologies play a prominent role on the Semantic Web. However, because of the Semantic Web's distributed (de-centrilized) nature, data on it will inevitably come from many different ontologies. Many of these ontologies will describe similar domains, but using different terminologies, and others will have overlapping domains. To integrate data from disparate ontologies, we must know the semantic correspondences between their elements. Information processing across ontologies is not possible without knowing these semantic mappings between their elements.

  6. Map Between Ontologies on the Semantic Web The semantic correspondences are in effect the “glue” that hold the ontologies together into a “web of semantics". Without them, the Semantic Web is akin to an electronic version of the Tower of Babel. Manually finding such mappings is tedious, error-prone, and clearly not possible at the Web scale. Hence, the development of tools to assist in the ontology mapping process is crucial to the success of the Semantic Web.

  7. GLUE (Ferramenta para o mapeamento ente Ontologias) GLUE is a system that employs machine learning techniques to find and semi-automatically create such mappings. Given two ontologies, for each concept in one ontology GLUE finds the most similar concept in the other ontology. It uses multiple learning strategies, each of which exploits a different type of information either in the data instances or in the taxonomic structure of the ontologies.

  8. Integração Semântica de Dados através de Federação de Ontologias A comunidade de Banco de Dados tem conhecimento de métodos para dar conta da integração de bases de dados distribuídas no contexto de federações de Bancos de Dados heterogêneos. A comunidade de Banco de Dados tem considerado ontologias na solução do problema da integração de Banco de Dados. O alinhamento ou “merge” de ontologias são algumas das propostas conhecidas da comunidade de WEB semântica. É proposto o uso de métodos de “merge” de ontologias como solução ao problema da construção de uma federação de ontologias como método integrador de fontes de dados. O estudo de caso foi implementado no Protegé

  9. Peer Data Management System (PDMS) The Peer Data Management System (PDMS) represents a natural step beyond data integration systems, replacing their single logical schema with an interlinked collection of semantic mappings between peers’ individual schemas. This is in contrast to data integration systems, which have a centralized mediated schema and administrator, and which, in our experience, impede small, point-to-point collaborations The concept of the peer data management system emphasizes not only an ad-hoc, scalable, distributed peer-to peer computing environment (which is compelling from a distributed systems perspective), but it provides an easily extensible, decentralized environment for sharing data with rich semantics.

  10. Referências COLONESE, E.M., “Methodology for Integrating the Scenario Databases of Simulation Systems” Masters’ Thesis AFIT/GCS/ENG/99J-03, June 1999 CUNHA, Adilson M., Notas de Aulas – Projeto de Sistemas de Banco de Dados (CE-240), Instituto Tecnológico de Aeronáutica (ITA), 1o Semestre de 2006 DIAS, Sandra Aparecida; MELO, Rubens Nascimento. Integração Semântica de Dados através de Federação de Ontologias. Dissertação de Mestrado - Departamento de Informática, Pontifícia Universidade Católica do Rio de Janeiro, 83p. Rio de Janeiro, 2006 DOAN, A., MADHAVAN, J., DOMINGOS, P., HALEVY, A. “Learning to Map between Ontologies on the Semantic Web” Computer Science and Engineering University of Washington, Seattle, WA, USA, 2002 KWOK, C. C. T., ETZIONI, O., WELD, D. S., “Scaling Question Answering to the Web” Computer Science and Engineering University of Washington, USA, 2001

  11. Referências (Continuação) GUO, Y., PAN, Z., HELFLIN, J. “An Evaluation of Knowledge Base Systems for Large OWL Datasets” Computer Science and Engineering Department, Lehigh University, Bethlehem, PA18015, USA, 2004 LOPEZ, V., MOTTA E., UREN V. “PowerAqua: Fishing the Semantic Web” Knowledge Media Institute & Centre for Research in Computing, The Open University. Walton Hall, Milton Keynes,MK7 6AA, United Kingdom, 2005 RUTLEDGE L., OSSENBRUGGEN J., HARDMAN L. “Making RDF Presentable: Integrated Global and Local Semantic Web Browsing” Box 94079 NL1090 GB Amsterdam, The Netherlands, 2005 HALEVY, A. Y., IVES Z. G., SUCIU, D., TATARINOV I. “Schema Mediation in Peer Data Management Systems” University of Washington Seattle, WA, USA, 2004

More Related