Numérisation de la presse Belge
180 likes | 315 Vues
Numérisation de la presse Belge. Projet fédéral D/00/02 Alain Goossens Bibliothèque royale de Belgique. Le projet en bref Titres concernés Principes clés du projet Situation en novembre 2008 Exploitation Démo Conclusion. Le projet en bref (1).
Numérisation de la presse Belge
E N D
Presentation Transcript
Numérisation de la presse Belge Projet fédéral D/00/02 Alain Goossens Bibliothèque royale de Belgique
Le projet en bref • Titres concernés • Principes clés du projet • Situation en novembre 2008 • Exploitation • Démo • Conclusion
Le projet en bref (1) • Numérisation de 30 titres de la presse belge • Pourquoi, parmi les collections de la Bibliothèque royale, choisir les journaux comme principal axe de numérisation ? • Période couverte : début du journal jusque 1950 • Volume : 3.000.000 pages • En plus : presse clandestine et censurée des deux conflits mondiaux • Volume : 35.000 pages • Choix opéré par le CEGES et la KBR
Le projet en bref (2) • Cadre : projet de numérisation du patrimoine fédéral • 9 projets • 15.000.000 € • 2005-2008, reports sur 2009 autorisés • Investissement de l’Etat pour ce projet : 2.272.000 € • Futur ? En discussion actuellement • Souhait de la politique scientifique : un large PPP
les titres concernés (1) • Le Courrier de l’Escaut (1829-1950) • Le Journal de Charleroi (1837-1950) • L’Indépendance belge (1843-1940) • Het Handelsblad (1844-1950) • La Meuse (1855-1950) • La Gazette de Charleroi (1878-1950) • De Gentenaar (1879-1950) • Vooruit (1884-1950) • Le Peuple (1885-1950) • Het Nieuws van den dag (1885-1950) • Het laatste Nieuws (1888-1950) • De Gazet van Antwerpen (1891-1950) • Het Volk (1891-1950) • Le Vingtième Siècle (1895-1940) • L’avenir du Luxembourg (1897-1950)
Titres concernés (2) • La Dernière Heure (1906-1950) • De Standaard (1914-1950) • De Volksgazet (1914-1950) • La Libre Belgique (1915-1950) • La Nation belge (1918-1950) • Vers l’Avenir (1918-1950) • De Schelde (1918-1936) • La Wallonie (1919-1950) • Le Drapeau Rouge (1921-1950) • De Rode Vaan (1921-1950) • Grenz Echo (1927-1950) • De dag (1934-1944) • Le Pays Réel (1936-1944) • Volk en Staat (1937-1944) • La Cité nouvelle (1937-1950) • + presse clandestine et censurée des deux conflits mondiaux
Principes clés du projet • Scinder numérisation et exploitation • Confier via appel d’offre européen la numérisation à un sous-traitant • Scinder exploitation intranet et Internet • Négocier l’exploitation Internet avec les ayant droits • Assurer la conservation pérenne du patrimoine numérisé
Situation en novembre 2008 • Juillet 2007 : lancement de l’appel d’offre • Depuis janvier 2008 : numérisation + OCR + segmentation • Depuis janvier 2008 : réflexion sur le stockage et l’accès • Seuls (KBR + CEGES) ? (oui, mais insuffisant) • De façon concertée avec les autres ESF ? (toujours ouvert) • Via PPP, avec les éditeurs ? (toujours ouvert + auteurs + journalistes + ???) • Depuis juillet 2008 : exploitation (en fait… exploitations : cf slides suivants…)
Exploitation (1) • Interne : = missions de base de la bibliothèque • Externe : complexe, pcq nouvelles missions… mais on progresse • Belge : Belgica@kbr.be • Internationale : RFBNN • Internationale : Europeana • …
Exploitation (2) • De la totalité des pages numérisées : dans les murs de la bibliothèque • Partielle ou totale : sur Internet
Exploitation (3) • Gratuite : dans les murs de la bibliothèque • Gratuite : sur Internet pour les journaux libres de droits • Gratuite ou payante : sur Internet pour les journaux sous droits
Démo • Outils mis en place à la Bibliothèque royale (en développement) • http://mara.kbr.be/calendarapp/calendar1fr.php • http://mara.kbr.be/nutch/KBRSearch.php
Conclusion (1) • La numérisation prend plus de temps que prévu • Phase de démarrage = long dialogue… • Cadences difficiles à soutenir >< qualité • OCR erratique • Contrôle qualité nécessaire et long… • Très bonne volonté de nos partenaires • Le marché public nous protège très bien
Conclusion (2) • Le défi de l’exploitation est passionnant, mais complexe car neuf • Pour la Bibliothèque • Pour les représentants des auteurs, des journalistes • Pour les représentants des éditeurs • Globalement, les coûts de numérisation + exploitation sont et seront toujours supérieurs aux recettes futures • Le plus important = obtenir la sécurité juridique, via accord le plus large possible entre ayant droits, et conscience des droits et devoirs respectifs de tous ! • La complexité croît encore lorsqu’on se place dans la perspective d’un PPP global à tous les ESF, pour tout type de documents patrimoniaux numérisés
Conclusion (3) • Une seule plateforme d’exploitation ne suffit pas • La redondance permettra de toucher plus d’internautes • Via l’association privé-public, des plateformes à modalité d’accès et de services divers peuvent éclore. • Il n’y a aucune incompatibilité avec les missions de base des bibliothèques
Conclusion (4) • Au-delà de la numérisation et des formes d’exploitation, la préservation numérique est un vrai défi également • Notre approche : • Formats ouverts (le + possible) • Lien structurel entre les formats + métadonnées • Stockage multiple + monitoring : • On-line (serveur, Bibliothèque royale) • Near on-line (tape, Bibliothèque royale) • Off-line (disque + tape, hors site)
Contacts : • Coordination : alain.goossens@kbr.be • Technique : elisabeth.mazur@kbr.be • Presse belge : marc.dhoore@kbr.be • Presse clandestine et censurée : dirk.luyten@cegesoma.bejan.laplasse@cegesoma.be