1 / 100

Modélisation de l’information bibliographique et nouveau code de catalogage : FRBR, FRAD, RDA

Modélisation de l’information bibliographique et nouveau code de catalogage : FRBR, FRAD, RDA. Médiadix, 19 octobre 2012 Françoise Leresche Patrick Le Bœuf. I. Les enjeux. ou : Pourquoi vouloir tout changer quand tout allait si bien ?. Tableau. On avait notre ISBD… … nos normes AFNOR…

azra
Télécharger la présentation

Modélisation de l’information bibliographique et nouveau code de catalogage : FRBR, FRAD, RDA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Modélisation de l’information bibliographique et nouveau code de catalogage : FRBR, FRAD, RDA Médiadix, 19 octobre 2012 Françoise Leresche Patrick Le Bœuf

  2. I. Les enjeux ou : Pourquoi vouloir tout changerquand tout allait si bien ?...

  3. Tableau • On avait notre ISBD… • … nos normes AFNOR… • … notre format MARC… • … notre SIGB… • Où était le problème ?

  4. Ombres au tableau • Catalogues dans le « Web profond » il faut y aller exprès • « Dis, Madame, commenton cherche dans ton catalogue ? » • L’utilisateur : « Je veux tout,tout de suite, sans effort. »Le catalogue : « Votre requêteramène 614 réponses.Bonne chance. »

  5. Aurez-vous la patience d'aller jusqu'à la 62e page ?

  6. Source : Sylvain Machefert

  7. Source : Sylvain Machefert

  8. Le « syndrome Google » • On n’a plus l’habitudede chercher par index • Les recherches par motsdans nos catalogues • ramènent trop de réponses • classées de manière plus ou moins anarchique •  Nos catalogues doiventévoluer pour mieux cibler

  9. Par exemple…

  10. Par exemple encore…

  11. Ombres au tableau (suite) • La recherche d’info, aujourd’hui,pour beaucoup de gens, c’est le Web… • Le Web ne parle pas MARC • Le Web a ses propres normes • Le Web ne fréquente pasles fournisseurs de SIGB • Le Web concerne tout le monde • Le Web suit son évolution propre…vers le Web sémantique

  12. Pourquoi changer ? Enjeux liés au Web • Adopter les standards du Web sémantique • pour sortir de notre « niche » technologique • pour avancer du même pas que les autres • pour que la maintenancede nos catalogues coûte moins cher

  13. Pourquoi changer ? Enjeux liésau confort des utilisateurs • Adopter les standards du Web sémantique • pour sortir nos catalogues du Web invisible • Modifier la structurede l’information bibliographique • pour adapter nos cataloguesaux besoins des utilisateurset à leurs nouvelles pratiques de recherche • pour mieux structurerles résultats d’une recherche simple

  14. Pourquoi changer ? Enjeux liésau confort des bibliothécaires • Adopter les standards du Web sémantique • pour récupérer des données produites ailleurs • Modifier la structurede l’information bibliographique • pour ne pas avoir à répéter indéfinimentles mêmes informationsquand une œuvre est souvent éditée • pour harmoniser l’information fournie • exemple :

  15. à la BnF :…

  16. Une indexation-matièrerecréée pour chaque notice … et dans le SUDOC :

  17. Pourquoi changer ? Enjeux liésau confort de …?... • Adopter les standards du Web de données et créer des « Données liées ouvertes » • pour que n’importe qui puisse réutiliser • n’importe lesquelles de nos données • de n’importe quelle manière

  18. En bref • Répondre aux attentes des utilisateurs d’aujourd’hui • permettre à des utilisateurs extérieurs de récupérer les infos qui les intéressent, et seulement celles-là • Aller vers une granularité plus fine de l’information bibliographique : des « notices » aux « données » • permettre à chacun de récupérer et d’exploiterle niveau d’information qui l’intéresse • Mettre les données à disposition des utilisateurs…… là où sont les utilisateurs • Participer au Web de données

  19. Bon. Changer, OK. ... mais changer au profit de quoi ???

  20. Zoom arrière • Nos standards actuels s’appuient sur des outils datant des années 1960 • Principes de Paris : 1961 • Format MARC : 1967-1969 • ISBD : 1969-1971 • C’est-à-dire l’époque de la prédominance : • des catalogues sur fiches • des contenus textuels imprimés

  21. Au tournant du siècle :l’IFLA secoue le cocotier ! • Modélisation de l’information bibliographique • FRBR(Functional Requirements for Bibliographic Records)publiés en 1998 • FRAD(Functional Requirements for Authority Data)publiés en 2009 • Nouveaux principes de catalogage • PIC(Principes internationaux de catalogage)publiés en 2009

  22. Et maintenant… • Juin 2010 : publication de RDA(Resource Description and Access) • 31 mars 2013 : la Bibliothèque du Congrès n’appliquera plus que RDA (http://www.loc.gov/catdir/cpso/news_rda_implementation_date.html) • Courant 2013 : au tour des bibliothèques nationales du Royaume-Uni,d’Australie, du Canada et d’Allemagne

  23. Et maintenant… (bis) • Mai 2011 (Library of Congress) : lancement de Bibliographic Framework Transition Initiative (réflexion sur le format futur des échanges d’information bibliographique) • abandon du format MARC (d’ici 10 ans ?) • création d’un nouveau format • aussi robuste que MARC • plus apte à exprimer le modèle FRBR • mieux adapté aux technologies du Web (XML, RDF…)

  24. En bref • Changer… • notre manière de structurer l’information bibliographique : FRBR, FRAD • nos règles de catalogage : RDA ?? • notre format de catalogage : [euh… là,c’est l’inconnu] • … pour aller sur le Web sémantique ! • [au fait, c’est quoi, le Web sémantique ?...]

  25. II. Participer au Web de données … en utilisant les technologies du Web sémantique

  26. Le Web de données ? • Un Web constitué de données accessibles, structurées, dans un format non-propriétaire, identifiées et liées entre elles sémantiquement (Définition de Tim Berners-Lee dès 1999) • Objectif: Mettre à disposition des données en utilisant des techniques standardisées qui garantissent l’interopérabilité • Disposer de données utilisables dans des contextes et avec des systèmes différents sans restriction de conditions d’accès ou de mise en œuvre

  27. Architecture du Web (1) • World Wide Web : toile d’araignée de serveurs d’informations reliés les uns aux autres par des liens physiques (le réseau matériel) et des liens logiques (les liens hypertextes) • Architecture du Web: infrastructure technologique définie par des standards • Standardisation de l’architecture du Web assurée par un organisme, le W3C • W3C = World Wide Web Consortium

  28. Architecture du Web (2) Repose sur 3 technologies : • Un protocole : HTTP (Hypertext Transfer Protocol) • Un langage : HTML (Hypertext Markup Language) • Standard défini par le W3C pour la diffusion de documents sur le Web pour pouvoir afficher de l'information à l'aide de balises dont le nombre est limité. Il est interprété par le navigateur • Des identifiants : URI (Uniform Resource Identifier) • Chaîne de caractères normalisée permettant d'identifier de manière permanente une ressource abstraite ou physique, accessible ou non sur Internet (personne, organisme, lieu, évènement, concept, …)

  29. Les URI • 3 déclinaisons : • URC (Uniform Resource Characteristic) • Caractéristiques d’une ressource • URN (Uniform Resource Name) • Nom d’une ressource • URL (Uniform Resource Locator) • Spécification de l'adresse physique de localisation d'une ressource sur Internet et de la méthode permettant d'y accéder

  30. Évolutions du web • Web 1.0  web de documents • permet aux usagers de naviguer facilement sur Internet en utilisant des liens hypertexte • une page = un document • format : HTML (HyperTextMarkup Language) • ne permet que la mise en forme • Web 2.0 web collaboratif • Web 3.0  web de données ou web sémantique • permet aux machines de trouver et d’exploiter les données contenues dans les documents • format : RDF (Resource Description Framework)

  31. Le Web de documents Données Documents Base de données Hyperlien Base de données Yann Nicolas, Le Web de données, enssib, 11 octobre 2012

  32. Limites du Web de documents • Les données sont cachées sous les pages HTML (deep web) • Seules les pages HTML sont liées entre elles • Les pages HTML sont faites pour les humains • Ce que veulent les machines, ce sont des données • des données liées • car elles se complètent les unes les autres • car les liens permettent de naviguer et de découvrir • avec des liens qualifiés, signifiants • au-delà du « voir aussi » des hyperliens

  33. Le web de données liées Liens entre les bases de données Données Documents Base de données Hyperlien Base de données Yann Nicolas, Le Web de données, enssib, 11 octobre 2012

  34. Le Web de données • Extension du Web permettant de relier non pas des documents (pages HTML) mais les données elles-mêmes, et de les rendre exploitables par des machines • Repose sur les mêmes technologies de base • HTTP : transfert des données • URI : nommage des ressources • Utilisation d’un autre langage • il ne s’agit plus d’échanger des documents destinés à être immédiatement visualisés, mais des données structurées • RDF = langage du Web de données liées

  35. RDF • RDF = Resource Description Framework • Nouveau modèle généraliste et standardisé pour encoder, échanger et réutiliser des métadonnées structurées • Proposé en 1999 par le W3C • Permet de décrire simplement des ressources : document, personne, objet, évènement • Objectif : partager les métadonnées pour des ressources identiques par l’utilisation d’une syntaxe commune

  36. RDF : un modèle conceptuel • Principe de base • toute chose peut être décrite avec des phrases minimales composées d’un verbe, d’un sujet et d’un complément  déclaration RDF Exemple : Honoré de Balzac a écrit "La Comédie humaine" Sujet : Honoré de Balzac Ressource Verbe : a écrit Prédicat Complément : La Comédie humaine Objet

  37. RDF : un modèle conceptuel • Modèle de données élémentaires constitué de 3 types d’objets : • Ressource • toute chose décrite par une déclaration RDF • entité d’information pouvant être identifiée par une URI • Propriété • caractéristique, attribut ou relation utilisé pour décrire une ressource • Déclaration • association d’une propriété à une ressource

  38. RDF : la notion de triplet • Une déclaration est composée de 3 éléments  triplet • Triplet {ressource – propriété – valeur} • sujet = ressource • prédicat = propriété : nature de la relation • objet = valeur • ressource liée ou • caractéristique exprimée par une chaîne de caractères Exemple : Sujet (Ressource) : Honoré de Balzac Prédicat (Propriété) : Creator Objet (Valeur) : La Comédie humaine

  39. RDF : Graphe • La déclaration est représentée visuellement par un graphe (système de nœuds reliés par des flèches) qui permet de parcourir l'information de lien en lien OBJET SUJET PREDICAT Sujet : Honoré de Balzac Objet : La Comédie humaine Prédicat : A écrit

  40. RDF : modèle de graphe • L’objet d’un triplet est • Soit une chaîne de caractères (« littéral ») • Soit une ressource qui peut être le sujet ou l’objet d’autres déclarations • On construit ainsi un modèle de graphe Sujet : Honoré de Balzac Objet : La Comédie humaine Prédicat : A écrit Sujet : La Comédie humaine Prédicat : Comprend Objet : Scènes de la vie privée

  41. Formalisme RDF • Modèle permettant de représenter un nombre considérable de ressources désignées chacune par une URI • Éclatement de l’information • Des données et pas des « documents » • Plus de souplesse pour manipuler, sélectionner…

  42. RDF : souplesse • Cadre conceptuel de description des ressources applicable à n’importe quel domaine • Permet de mélanger les vocabulaires • Peut être exprimé en utilisant diverses syntaxes • RDF/XML (eXtensible Markup Language) seule syntaxe qui fait l’objet actuellement d’une recommandation du W3C • RDF NTriples • RDF Turtle • RDFa • etc.

  43. RDF : extensibilité • RDF rend les données extensibles • Plus besoin de tout dire sur une ressource, une personne, etc. • Possibilité d’établir des liens vers d’autres sources (en RDF) pour compléter l’information • Recensions, commentaires, etc. • Données commerciales, etc. • Dictionnaires biographiques, etc.

  44. Un Web de données … • Modèle de données : RDF • Langage d’interrogation : SPARQL • Langage de requête sur les graphes RDF permettant de spécifier le type de données recherchées • SPARQL permet d’interroger les données telles qu’on les a modélisées

  45. … et un Web sémantique • Schéma (ou ontologie) • Document formel expliquant les catégories, leurs relations, avec leur sens, la structure et les contraintes associées • Exemples : • Foaf pour la description d’un profil utilisateur • Dublin Core pour la description (simple) d’une ressource • ISBD pour la description bibliographique • RDF permet de raisonner sur les données, pour les enrichir ou contrôler leur cohérence

  46. Web de données et Web sémantique • Web de données :possibilité de relier et d’échanger des données au moyen d’URI • Web sémantique : possibilité d’échanger les schémas des données et la sémantique associée • Objectif : permettre aux machines de comprendre la sémantique, la signification de l’information sur le Web

  47. Le Web de données aujourd’hui

  48. Et les bibliothèques? • Que peut nous apporter le Web de données ? • Relier les catalogues des bibliothèques avec d’autres données existantes • Ouverture à d’autres communautés (libraires, éditeurs, …) • Navigation par les utilisateurs sans avoir à connaître les formats des bases de données et les langages de requête spécifiques • Plus de visibilité par les moteurs de recherche • Tirer parti des données structurées des catalogues et des référentiels • Interopérabilité  Souplesse pour la réutilisation des données

  49. Comment y arriver ? • Des données structurées • Des vocabulaires normalisés • éléments de métadonnées • listes de valeurs • Des identifiants pérennes (URI) • pour désigner les ressources • pour exprimer les relations entre les données • Une syntaxe normalisée : RDF RDF = Resource Description Framework

More Related