1 / 55

Evolution des catalogues : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Evolution des catalogues : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA. ENS Lyon 17 au 19 juin 2013 Thierry Clavel et Philippe Bourdenet. Programme. Introduction : le contexte Problématique de l’interopérabilité  des données en bibliothèque Paysage applicatif

sydney
Télécharger la présentation

Evolution des catalogues : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Evolution des catalogues :Métadonnées, Interopérabilité, web sémantique, FRBR et RDA ENS Lyon 17 au 19 juin 2013 Thierry Clavel et Philippe Bourdenet

  2. Programme Introduction : le contexte Problématique de l’interopérabilité  des données en bibliothèque Paysage applicatif Exemple d’interopérabilité : le SCD du Maine Pourquoi changer ? : Enjeux du Web de données pour les bibliothèques Métadonnées : jeux et formats Expression des données en XML Dublin Core, MODS, ONIX, TEI, EAD METS, LOMFR Interopérabilité des systèmes Notion de modèle conceptuel Web sémantique et Web de données FRBR et FRAD RDA et le catalogage FRBerisé

  3. Introduction : Le contexte

  4. Bibliothèque scientifique numérique (BSN) Une « très grande infrastructure de recherche » créée en 2009 Un projet qui fédère l’action des acteurs de l’enseignement supérieur et de la recherche basé sur la coopération 9 segments (axes) BSN 1 à BSN9

  5. Projet d’établissement de L’ABES 2012-2015 Le projet compte 8 axes dont : Missions de l’ABES : mutualisation « acquérir, signaler, diffuser » Signalement des ressources électroniques « priorité absolue » Projet SGBM Hub de métadonnées de la recherche Faire évoluer les catalogues

  6. 2012 : Lancement de 2 études en parallèle Etude du cabinet pléiade sur les outils découverte Conclusions : La mutualisation devrait porter sur les données : base de connaissances nationale intégrée à GOKB Se doter d’un localisateur national Etude du groupe de travail SGBM 3 scénarios

  7. Choix du CA de l’ABES du 31/5/2013 SGBM : Choix du scénario 2 Migration des établissements volontaires vers le SGBM Maintien de CBS pour le catalogage (transferts réguliers vers le SGBM) Étude complémentaire de 6 mois pour le remplacement de CBS Etude Pléiade Développement d’un localisateur national

  8. Hub de métadonnées de la recherche • Partenariat ABES-CNRS • Récupération des métadonnées commerciales ou institutionnelles sous n’importe quel format • Dédoublonnage, Conversion et Redistribution des métadonnées « enrichies » vers les bibliothèques du réseau

  9. que dit le projet sur FRBR et RDA et les données ? « L’ABES poursuivra dans la voie de l’ouverture et de l’interopérabilité de ses données sur le web. Elle expérimentera la mise en oeuvre du modèle FRBR en concertation avec la BnF dans la perspective de l’implémentation du code de catalogage RDA »

  10. Ouverture des données (open data) vers une interopérabilité technique et juridique Mouvement international Plateforme française d'ouverture des données publiques data.gouv.fr Exposition des données en RDF ABES : licence ouverte (LO) recommandée par la mission ETALAB pour les données produites par le réseau BnF : idem pour : Catalogues Gallica Data.BnF.fr

  11. Le comité stratégique bibliographique (CSB) Composition : ABES, BnF et leurs tutelles Nouvelles orientations du paysage bibliographique français  : Exposer les métadonnées des catalogues nationaux sur le Web de données FRBRiser les catalogues (BnF et SUDOC) Permettre un catalogage FRBRisé en révisant les normes AFNOR (2015) Préparer l’adoption de RDA pour ne pas s’isoler du contexte international et européen rapport d'orientation du 13 novembre 2012

  12. FIN de l’introduction

  13. Open URL et les résolveurs de liens OPEN URL : protocole de métadonnées permettant de faitre des liens contextuels Résolveur de liens : outil informatique implémentant la norme OpenURL et faisant le lien entre une citation bibliographique et le texte intégral, en fonction des abonnements de l'établissement.

  14. Discovery tools (outil découverte) Logiciel avec fonctions de recherche et facettes Réservoir unique Rapidité des résultats Indexe texte intégral et métadonnées de différentes bases Base de connaissance Autres fonctions : fourniture de documents, résolveur de liens Problème récurrent : bruit et pertinence des résultats

  15. Pourquoi changer nos catalogues ? ou Les enjeux du Web de données pour les bibliothèques

  16. Les catalogues de bibliothèques, monde merveilleux ? On a déjà des normes de catalogage (ISBD, AFNOR…) des formats MARC pour saisir et récupérer des notices… Des SIGB qui fonctionnent… Des OPAC et des catalogues collectifs accessibles sur le Web… Alors, pourquoi vouloir changer ?

  17. Mais d’abord, est ce que nos catalogues conviennent aux usagers? 1 – changer pour l’usager

  18. Aurez-vous la patience d’aller jusqu’à la 62ème page

  19. Source : Sylvain Machefert

  20. Source : Sylvain Machefert

  21. 1 - changer pour L’usager L’usager est avant tout un internaute : Il veut tout et tout de suite Il veut des contenus précis (un article, une chanson, etc.) Il recherche en priorité sur le Web (et pas spécialement dans des catalogues) Il consulte les catalogues en recherche simple à la « google » Il faut donc : Faire évoluer nos catalogues pour les adapter à l’usager Ils ramènent trop de réponses (bruit) sans les classer Il faut structurer les résultats de recherche pour afficher des réponses pertinentes Aller vers l’usager Pousser les contenus et les données des bibliothèques vers les usagers/internautes donc sur le Web

  22. Data.bnf.fr

  23. Autre exemple catalogue collectif ciné-ressources http://www.cineressources.net/recherche_t.php

  24. « Super » Notice d'autorité « nom de personne » C'est pas merveilleux, Cette page de résultats ?!

  25. Expérimentation OPENCAT

  26. OPENCAT

  27. Pourquoi Les catalogues de bibliothèques ne sont ils pas visibles sur le Web ? Le Web ne parle pas MARC Le Web a ses propres normes Et surtout … 2 – changer pour être sur le Web

  28. Les catalogues sont dans le Web profond http://www.flickr.com/photos/markhillary/3774707075/ Les catalogues de bibliothèques sont dans des bases de données (silos) qui ne sont pas indexées par les moteurs de recherche http://www.flickr.com/photos/75905404@N00/5088208539/

  29. 2 - Changer pour être sur le Web Pourquoi adopter les standards du Web sémantique ? pour sortir du Web profond et de notre « niche » technologique des formats MARC pour évoluer avec le Web pour que la maintenancede nos catalogues coûte moins cher Interopérabilité +++

  30. 3 - Changer pour rationaliser et enrichir le travail de catalogage Récupérer des données produites ailleurs Par exemple les biographies de Wikipediapour les auteurs Ne pas avoir à répéter les mêmes informations Réutiliser les données du catalogue Par exemple : l’indexation matière

  31. Indexation matière dans le SUDOC : Une indexation-matièrerecréée pour chaque notice

  32. 4- Changer pour que nos données soient réutilisées créer des « Données liées ouvertes » Eclater nos notices en données réutilisables pour que n’importe qui puisse réutiliser n’importe lesquelles de nos données de n’importe quelle manière

  33. Quels outils pour le changement ? Des modèles conceptuels pour Structurer l’information bibliographique Un code de catalogage Des Technologies et normes garantissant l’Interopérabilité du Web de données Web de données Un espace global d’information, ouvert, qui permet de lier, exploiter, mettre à disposition,réutiliser les données sur le Web

  34. Métadonnées : Tentative de définition - données sur (à propos) d’autres données - Information structurée qui sert à décrire, trouver, localiser, gérer, ,,, des ressources

  35. Types de Métadonnées Métadonnées descriptives Titre, auteur, résumé, mots clés, etc, Métadonnées de structure Chapitres d’un livre, organisation d’un texte Métadonnées de gestion (administratives) gestion des droits (propriété intellectuelle) Archivage et conservation Techniques : format, type, accès aux ressources, etc,

  36. Métadonnées ou notice ? Métadonnées internes ou externes à une ressource

  37. Formats de Métadonnées Métadonnées existent dans tous les secteurs d’activité Nombreux formats Problème d’interopérabilité

  38. Dublin core : un exemple de métadonnées

  39. Dublin Core Jeu de métadonnées descriptives normalisées : devenu une norme ISO (15836) en 2003, maintenu par le DCMI (Dublin Core Metadata Initiative). Objectif d’origine:décrire les ressources électroniques sur Internet dans un contexte HTML pour faciliter la recherche , avoir des métadonnées communes à plusieurs communautés Caractéristiques du Dublin Core : Simplicité : 15 éléments seulement Souplesse d’utilisation : tous les éléments sont facultatifs et répétables Utilisable dans différents formats : HTML, XML, etc.

  40. Les 15 éléments de base du Dublin Core Title : titre de la ressource Subject : mots-clés ou language documentaire Description : présentation du contenu (résumé, table des matières, etc;) Source : référence à une ressource dont la ressource décrite est dérivée Language : langue utilisée dans la ressource Relation : référence à une ressource apparentée Coverage : couverture spatio-temporelle (périmètre ou domaine d’application de la ressource) Creator : auteur principal Contributor : responsabilité secondaire Publisher : éditeur (mise à disposition de la ressource) Rights : gestion des droits Date : date d’un événement dans le cycle de vie de la ressource Type : catégorie, fonction ou genre de la ressource (contenu sémantique) Format : format, taille de la ressource Identifier : identifiant (URL, ISSN etc.)

  41. Dublin Core qualifié et non qualifié • Dublin Core non qualifié : utilisation des 15 éléments seulement • Dublin Core qualifié : Utilisation d’un Référentiel plus complet : Dubin Core metadata termsPossibilité de choisir d’autres éléments et des schémas d’encodage. • http://dublincore.org/documents/dcmi-terms/ • Exemples de DC qualifié: • qualificatifs de raffinement (création de nouveaux éléments) • <meta name="dc.identifier.URI" content=« http://www.enssib.fr"> • schéma d’encodage (association d’un élément à un référentiel) <meta name="dc.subject" scheme = « DDC »  content= «  025.314 »>

  42. Exemple pour un site Web

  43. Exemple de notice OAI (métadonnées Dublin Core) <record> <identifier>oai: 2450</identifier> <dc:title> Accueillir, orienter informer </dc:title> <dc:creator> Bertrand Calenge</dc:creator> <dc:type>Monographie imprimée</dc:type> … </record>

  44. DC Profil bibliothèques http://dublincore.org/documents/library-application-profile/

  45. Avantages du Dublin core Simplicité Reconnaissance internationale : norme ISO Utilisation grandissante grâce au protocole OAI PMH

  46. Limites du Dublin Core Globalement encore peu utilisé à l’échelle du Web simplicité à double tranchant 15 éléments de base : insuffisant pour décrire des ressources complexes

  47. Exercice Dublin Core Transposer en DC simple la notice MARC suivante

  48. MODS Metadata Object Description Schema

  49. MODS Schéma XML développé par la Bibliothèque du Congrès pour décrire tout type de ressource Métadonnées descriptives Adaptation simplifiée du MARC 21 Indépendant d’un code de catalogage Plus riche que le Dublin Core Mappings facilités vers différents jeux de métadonnées : MARC, DC, RDA, ONIX

More Related