710 likes | 921 Vues
Formatos de metadados para bibliotecas, arquivos e museus. Tendências -Garantia de interoperabilidade. Marcia Lei Zeng, Kent State University, USA. Introdução 1.1 O movimento dos metadados desde os anos 90s. Crescimentos excepcional da World Wide Web e dos recursos na Web
E N D
Formatos de metadados para bibliotecas, arquivos e museus Tendências -Garantia de interoperabilidade Marcia Lei Zeng, Kent State University, USA 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
Introdução1.1 O movimento dos metadados desde os anos 90s • Crescimentos excepcional da World Wide Web e dos recursos na Web • A emergência das bibliotecas digitais • Muitas bibliotecas, arquivos e museus estão envolvidos com o desenvolvimento das coleções digitais, bibliotecas digitais, exibições digitais, etc. • A necessidade de descrever e de organizar os estoques de recursos disponíveis na Web a partir de bibliotecas digitais e repositórios 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
A necessidade de metadados na sociedade Conhecimento Informação Dados 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
Proliferação dos esquemas de metadados • Esquemas de metadados têm sido desenvolvidos desde os anos 90 para diferentes tipos de recursos e para diferentes funções. 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
1.2 Principais padrões de metadadospara bibliotecas, arquivos e museus • MARC • MODS (Metadata Object Description Schema) • MARCXML • Dublin Core • EAD (Encoded Archival Description) • Categories for the Description of Works of Art (CDWA) • VRA Core Categories • Learning Object Metadata (LOM) 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
Padrões de Metadados Existentes Descrição bibliográfica (geral) • MARC (Machine Readable Cataloging) • Dublin Core Element Set • GILS (Government Information Locator Service) • RFC 1807 (Format for Bibliographic Records) • TEI Headers (Text Encoding Initiative) • MCF (Meta Content Format) • PICS (Platform for Internet Content Selection) • SOIF (Summary Object Interchange Format) Dados numéricos • ICPSR Data Documentation Initiative • Standard for Survey Design and Statistical Methodology Metadata (SDSM) Dados geoespaciais • Content Standards for Digital Geospatial Metadata (CSDGM) 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
Padrões de metadados existentes (cont.) Imagens and objetos • Categories for the Description of Works of Art (CDWA) • VRA Core Categories • MESL (Museum Education Site Licensing Project) Data Dictionary • Object ID Checklist • NISO Metadata for Images in XML Schema (MIX) • IPTC (International Press Communications Council) Core Descrição do Plano da Coleção • EAD (Encoded Archival Description) DTD • Z39.50 Profile for Access to Digital Collection Educação • Instructional management Systems (IMS) • The Gateway to Educational Materials (GEM) Schema • DC Education Schema • Learning Objects Metadata (LOM) • The Sharable Content Object Reference Model (SCORM) Computação para a Internet • CORBA (Common Object Request Broker Architecture) 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
Padrões de metadados existentes (cont.) Preservação e objetos digitais • CEDARS Project: CEDARS Preservation Metadata Elements • National Library of Australia. Preservation Metadata for Digital Collections:Exposure Draft • Networked European Deposit Library. Metadata for Long Term Preservation • PREMIS (PREservation Metadata: Implementation Strategies) • Open Archival Information System (OAIS) Comércio eletrônico • The INDEXS project • ONIX (Online Information Exchange) • Publishing Requirements for Industry Standard Metadata (PRISM) Gerenciamento de Direitos • Rights Metadata • DOI -- Digital Object Identifier Mídia-específica • MPEG-4 and MPEG-7 for Audio and Video Música • Standard Music Description Language (SMDL), ISO/IEC 10743
Padrões de metadados sobrepostos • Não existe limite para o tipo ou a quantidade de recursos que podem ser descritos pelos metadados. Um padrão de metadados pode ser desenvolvido ou proposto para qualquer área que tiver interesse na recuperação e compartilhamento de recursos eletrônicos. • Não existe limite para o número de padrões de metadados sobrepostos para qualquer tipo de recurso ou qualquer assunto específico. Ex., para se descrever recursos de museus ou recursos visuais existem pelo menos, 9 esquemas de metadados muito bem estruturados e muito bem documentados • Não existe limite para os tipos de profissões ou assuntos específicos que poderiam estar envolvidos no desenvolvimento e aplicação de padrões de metadados 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
1.3. Diferentes fases dos projetos de bibliotecas digitais Select a schema Building a digital collection Federated search Providing search across collections Providing search for this collection Finding out users’ needs
Decisões sobre os metadados em diferentes fases (1) No início da fase: selecionar ou criar um esquema • Que padrão de metadado nós deveríamos escolher? • Nós deveríamos adaptar um esquema completo? • Nós precisamos modificar um esquema? • Parece que 3 esquemas são úteis para nós. Nós deveríamos adaptar os 3 esquemas? • O nosso projeto utiliza o mesmo esquema que outro projeto 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
Decisões sobre os metadados em diferentes fases (2) • Na fase de construção da coleção digital • Eu descobri que os nossos registros de metadados são muito simples e faltam dados importantes. O quê eu deveria fazer agora? • Eu gostaria de fundir com os registros de outra coleção. Mas eles utilizam um formato diferente. O quê eu devo fazer? 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
Decisões sobre os metadados em diferentes fases (3) • Na fase da busca unificada e depois da integração • Um grande projeto de biblioteca digital solicitou os nossos metadados para integrar o seu repositório. Entretanto, o nosso formato é diferente do deles. O que nós deveríamos fazer? • Nós gostaríamos de de nos juntar a um catálogo coletivo e oferecer uma interface única para busca de todos os dados de várias coleções. Mas, nós temos formatos diferentes. Como poderíamos oferecer uma busca unificada? 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
TENDÊNCIAS A necessidade de metadados na sociedade “O movimento dos metadados” nos anos 90 Interoperabilidade dos metadados 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
1.4 Interoperabilidade dos metadados -- Por quê é importante? • Conciliar diversos esquemas num ambiente particular de busca • Compartilhar e trocar dados • Busca “One-stop” sem cortes (“unificada”) Interoperabilidade dos metadados: a habilidade de vários sistemas, que usam diferentes plataformas de hardware e de software, diferentes estruturas de dados e diferentes interfaces em trocar e compartilhar dados. -- NISO, Understanding Metadata http://www.niso.org/standards/resources/UnderstantingMetadata.pdf 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
2. Implementação da Interoperabilidade em vários níveis • Princípios dos metadados • Simplicidade • Modularidade • Reutilização • Extensibilidade • Interoperabilidade 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
Schema A Records Schema B Application Profile Repository Records Schema C Os vários níveis dos projetos de metadados d b c a
2.1 Nível de esquema 2.1.1 Origem Adaptação, modificação, expansão, adaptação parcial, tradução, etc. Esquema novo depende do esquema fonte Source schema e.g.:DC, VRA Core New schema
2.1 Nível de esquema MODS MARC MARCXML Mudança no formato de codificação, manuteñção dos elementos originais 2.1.1 Origem Adaptação, modificação, expansão, adaptação parcial, tradução, etc. Esquema novo depende do esquema fonte
2.1 Nível de esquema MODS DC in Various languages MARC MARCXML DC Versão reduzida, versão traduzida MARC Lite 2.1.1 Origem Adaptação, modificação, expansão, adaptação parcial, tradução, etc. Esquema novo depende do esquema fonte
2.1 Nível de esquema DC-ED -- audience Dublin Core ETD-MS*-- thesis.degree (name,level,discipline,grantor) Expansão 2.1.1 Origem Adaptação, modificação, expansão, adaptação parcial, tradução, etc. Esquema novo depende do esquema fonte *ETD-MS: an Interoperability Metadata Standard for Electronic Theses and Dissertations
Data Providers Other Harvesters ETD metadata repository BDTD Biblioteca Digital de Teses e Dissertações MTD-Br OAI-PMH Etd-ms DC Harvester IBICT Source: Pavani & Maffia. BDTD - The Brazilian National ETD Project. ETD 2005
BDTD Biblioteca Digital de Teses e Dissertações BDTD member institutions & numbers of ETDs – Sep 27, 2005 Source: Pavani & Maffia. BDTD - The Brazilian National ETD Project. ETD 2005
2.1 Nível de esquema Schema A Schema B Schema C 2.1.2Perfil de aplicação -- como aqueles esquemas que contém elementos de dados desenhados de um ou maisnamespaces* -- Nuncatake it or leave it, sempre take what you want, create what you need Application Profile * para definir o contexto de um termo em particular, garantindo assim que o termo tenha uma definição única nos limites do namespace declarado. (Duval et al., 2002)
Perfis de aplicaçãodefinições básicas Um perfil de aplicação (PA) é um relatório onde os termos são utilizados por uma organização, um recurso informacional, uma aplicação ou uma comunidade de usuário para o metadado. --Baker, 2003 for Dublin Core Metadata Initiative (DCMI) Usage Board). Um perfil de aplicação é uma reunião de elementos dos metadados selecionados de um ou mais esquemas de metadados e combinados em um esquema composto. -- Duval, E., et al. Metadata Principles and Practicalities D-Lib Magazine, April 2002 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
AVEL METADATA ELEMENT LIST Dublin Core elements supported by AVEL DC.Identifier DC.Title DC.Creator DC.Subject DC.Description DC.Publisher DC.Contributor DC.Date DC.Type DC.Format DC.Language DC.Coverage DC.Relation DC.Rights AGLS elements supported by AVEL AGLS.Availability EDNA elements supported by AVEL EdNA.Review Administrative elements supported by AVEL AC.Creator AC.DateCreated AVEL.Comments
Projeto dos perfis de aplicação • Selecionar o namespace da “base” de metadados • Selecionar os elementos de outros namespaces de metadados • Definir elementos dos metadados locais • Impor a aplicação dos elementos • Imposição fundamental • Restrição do espaço para o valor • Especificação de relacionamento e dependência 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
Perfis de aplicação Dublin Core • DC-Library Application Profile (DC-Lib) • esclarece o uso do conjunto de elementos do metadado DC em bibliotecas e em aplicações e projetos relacionados com bibliotecas • DC Government Application Profile • esclarece o uso do DC no contexto governamental • DC Collection Description Application Profile 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
2° Congresso INTEGRAR, June 2006, São Paulo, Brasil Source: CORES Registry. http://cores.dsd.sztaki.hu/
2.1 Nível de esquema Schema A Schema B Source definition Target definition Mapping definition Target Metadata Source Metadata Mapping template Mapping template language 2.1.3 Cruzamentos Cruzamentos entre elementos Esquemas são independentes
2.1.3 Cruzamentos Exemplos de cruzamentos: • MARC21 para Dublin Core • MARC para UNIMARC • VRA para Dublin Core • ONIX para books to MARCXML • FGDC para MARC • EAD para ISAD(G) • ETD-MS para MARCXML • Dublin Core/MARC/GILS • MARC/LOM/DC • ADL/FGDC/MARC/GILS • Etc., etc., etc. 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
Objetivo Fonte Cruzamento Absoluto Cruzamento Relativo VRA Core (3.0) Dublin Core (com qualificadores) Dublin Core (com qualificadores) Título Título. Variante Título. Tradução Título. Série Título.Entidade Maior Título Título Título. Alternativo Técnica Formato Localização. Repositório atual Colaborador,Cobertura Duas abordagens ------------------------ ------------------------ 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
2.1.3 Cruzamentos • Mais operacional se delineado de esquema complexo para simples – one way street • Vários graus de equivalência: • One-to-one, one-to-many, many-to-one, one-zero • Mais operacional se o número de esquemas envolvidos for pequeno • Delinear múltiplos esquemas é extremamente trabalhoso, intensivo e requer um enorme esforço intelectual 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
2.1 Nível de esquema Schema A Schema C Schema B Schema D Switch 2.1.4 Transferência
Getty’s Crosswalk from CDWA to 7 Schemas http://www.getty.edu/research/conducting_research/standards/intrometadata/3_crosswalks/
2.1 Nível de esquema Schema A Schema B Metadata Registry Schema C • Funcionalidades do arquivo de metadados: • registro e publicação do esquema e perfis de aplicação • gerenciamento • busca e recuperação • cruzamento e links de cruzmento 2.1.5 Registros dos metadados
2.1 Nível de esquema Schema A Schema B Metadata Registry Schema C • Componentes fundamentais do arquivo • Modelos de dados • Identificação dos elementos • Identificação do esquema (conjuntos de elementos) • Identificação da codificação do esquema • Identificação do perfil de aplicação • Identificação do uso do elemento • Identificação do cruzamento do elemento 2.1.5 Registros dos metadados
Extensões de diferentes arquivos • (1) Domínio-cruzado e arquivo de esquema-cruzado. • Por exemplo, o arquivo UKOLN (UK Office for Library Networking)'s SCHEMAS http://www.schemas-forum.org/registry/ . • Agora, intitulado arquivo CORES http://cores.dsd.sztaki.hu/ 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
Partners • PricewaterhouseCoopers • Fraunhofer Gesellschaft • Computer and Automation Research Institute, Hungarian Academy of Sciences (MTA SZTAKI) • UKOLN, University of Bath
Extensões de diferentes arquivos (cont.) • (2) Domínio-específico, arquivo de esquema-cruzado. • For exemplo, o arquivo UKLON's MEG (Metadata for Education Group) facilita o registro do esquema num domínio educacional. • (3) Arquivo de um projecto-específico. • O arquivo de metadados da European Library (TEL) foi estabelecido com o objetivo de registrar todas as atividades de metadados associadas à TEL. • (4) Arquivo de esquema-específico Registro DC 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil
Dublin Core Metadata Registry (page 1) elements Element refine-ments
Dublin Core Metadata Registry (page 2) Element Refine-ments Controlled Vocabulary Terms Vocabulary and Encoding Schemes
Vários níveis dos projetos de metadados Schema A Records Schema B Records Schema C Application Profile
2.2 Nível de registro Records Records 2.2.1 Conversão de registros Ex.: MARC record MODS record MARC record MARCXML record LOM record DC record 。。。
ADLstandard report ADLXMLreport
Como se designam nos cruzamentos: Como existem nos esquemas verdadeiros: B1 A1 B1 A1=B1 A1 B1 A1 Desafios da conversão de dados • Relacionamentos de combinação complexa • One-to-One • One-to-Many • Many-to-One • One-to-Zero • Overlapping horizontally or vertically • Controlled value spaces 2° Congresso INTEGRAR, June 2006, São Paulo, Brasil