110 likes | 277 Vues
Arbeitsstand und Arbeitsbedarf Bibliotheken. Universitätsbibliothek. Arbeitsstand bezüglich… Datenlage CIDOC-CRM und FRBRoo Architektur und Infrastruktur Ausblick. Universitätsbibliothek. Datenlage Keine echten Daten: Einbindung von Open Library Data
E N D
Arbeitsstand und Arbeitsbedarf Bibliotheken Universitätsbibliothek
Arbeitsstand bezüglich… • Datenlage • CIDOC-CRM und FRBRoo • Architektur und Infrastruktur • Ausblick Universitätsbibliothek
Datenlage • Keine echten Daten: Einbindung von Open Library Data • Weg: MODS-Mapping + Konvertierung (Erstellung von Werkzeugen) • Quellen: Universitäts- und Stadtbibliothek Köln, British National Bibliography der British Library, Daten der UB Dortmund aus SwetsWise Journal Content, Katalogdaten von KOBV und BVB: B3Kat, Literaturdaten aus dem Gela-Projekt • Veröffentlichung der Ergebnisse: Lins, Maike; Becker, Hans-Georg: Open Data und Linked Data in einem Informationssystem für die Archäologie. In: Handbuch Linked Open Library Data / Pohl, Adrian; Danowski, Patrick [Hrsg.]. DeGruyter: 2012. (Hybride Publikation) Universitätsbibliothek
CIDOC-CRM und FRBRoo • Repräsentation der bibliographischen Metadaten mittels FRBRoo Arbeit abgeschlossen • Veröffentlichung der Ergebnisse: Becker, Hans-Georg: FRBR, Serials und CIDOC CRM - Modellierung von fortlaufenden Sammelwerken unter Verwendung von FRBRoo. In: Handbuch Linked Open Library Data / Pohl, Adrian; Danowski, Patrick [Hrsg.]. DeGruyter: 2012. (Hybride Publikation) • Weiterentwicklung Konvertierungswerkzeuge parallele Verarbeitung: Konvertierung von 1,3 Millionen MODS-Datensätzen nach FRBRoo-RDF: < 3 Min. Ergebnis: 90 Millionen Tripel Universitätsbibliothek
CIDOC-CRM und FRBRoo • CRM-Export der Ripacandida-Daten: Werkzeuge: STELLAR-Projekt der University of Glamorgan • Anpassung: Verkürzung der CRM-Pfade Verbindung zu anderen Ontologien (z. B. LIDO; ähnliches Verfahren bei FRBRoo-RDF mit RDA-Vokabular) Universitätsbibliothek
Architektur / Infrastruktur • Bisher: Daten MODS Indexierung in Solr/Lucene nutzbar in Web-Anwendung (Django): Derzeit 26.989 Metadaten-Dokumente • Neue Möglichkeit: Linked Media Framework Universitätsbibliothek
Architektur / Infrastruktur Linked Media Framework: • Open Source • Speicherung von RDF-Daten in Tripeln: z.B. via cURL • Indexierung in Solr/Lucene mit geeigneter Abfragesprache: Indexierung nach konfigurierbaren LDPath-Dokumenten Bsp.: @prefix hg : <http://www.holygoat.co.uk/owl/redwood/0.1/tags/> ; title = rdfs:label :: xsd:string ; summary = rdfs:comment :: lmf:text ; tag = hg:taggedWithTag / hg:name :: xsd:string ; type = rdf:type :: xsd:anyURI ; • Verwendete Technologien: PostgreSQL, Apache Tomcat, Solr/Lucene, Apache Stanbol, LDPath, SPARQL… Universitätsbibliothek
Architektur / Infrastruktur • Prototypische Instanz: http://lxsisis2.ub.tu-dortmund.de:8082/ArcheoInf/ • Daten: BNB, USB Köln, Swets, Projekt Gela, Funddaten Ripacandida; 2.626.753 Tripel in 54.943 Dokumenten • Sichtbarmachen der Suchergebnisse: Servlet: Kapselung der Solr/Lucene-Zugriffe, Umwandlung XML HTML per XSLT • Prototypische Instanz: http://129.217.132.132:9000/search/?q=*%3A* Universitätsbibliothek
Ausblick/ Geplante Arbeitsschritte Thesaurus: Thesaurus-Mapper: Umwandlung der Erschließungselemente aus Ripacandida-Funddaten in Thesaurus Mapping zum ArcheoInf-Thesaurus Technischer ArcheoInf-Thesaurus: Mapping der Thesaurus-Klassen auf Metadatenformat diese Anbindung wurde bisher nicht thematisiert Universitätsbibliothek
Ausblick/ Geplante Arbeitsschritte Abstimmungsbedarf: Integration der Literatursuche in die Oberfläche des Prototypen Zusammenarbeit mit DAI/ IANUS? Plenum Anschluss Forschungsdaten – bibliographische Daten Universitätsbibliothek