270 likes | 389 Vues
Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library www.sub.uni-goettingen.de/GDZ. Meta- und Strukturdaten. Retrieval. Navigation. Anzeige. Meta- und Strukturdaten. Elektronisches Inhaltsverzeichnis:. im PDF. Meta- und Strukturdaten.
E N D
Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library www.sub.uni-goettingen.de/GDZ
Meta- und Strukturdaten Retrieval Navigation Anzeige
Meta- und Strukturdaten Elektronisches Inhaltsverzeichnis: im PDF
Meta- und Strukturdaten Elektronisches Inhaltsverzeichnis im Web:
Meta- und Strukturdaten Elektronisches Inhaltsverzeichnis im Web: Links zu den Seiten
Datenformat RDF/XML Logische Strukturen eine Start- / Endseite pro log. Struktureinheit pro Seite nur ein Image Optional: Volltext
Datenformat RDF/XML Logische Strukturen eine Start- / Endseite pro log. Struktureinheit pro Seite nur ein Image Zukünftig METS: technische Metadaten Physische Struktur Derivate von Images
Meta- und Strukturdaten Metadatenerfassung Aufnahme in den Katalog Identifier wird während des Workflows zur eindeutigen Benennung von Ordnern / Dateien genutzt. Anschliessend detailliertere Erfassung
Meta- und Strukturdaten Erfassung vor dem Scannen Anhand des gedruckten Buches Erfassung in ein Excel_Sheet Konvertierung in RDF/XML-Datei
Meta- und Strukturdaten Paginierungssequenzen: Logische Seitennummern Aufgedruckt Paginierung; Physische Seitennummern Eindeutige Benennung der Seiten
Meta- und Strukturdaten Paginierungssequenzen: Spalten A and C: Gezählte Start/Endseiten logische Seitennummern Spalten D and E: Ungezählte Start- und Endseiten Spalten M and N: Physische Seitennummer (errechnet)
Meta- und Strukturdaten Strukturdaten: Spalte B: Typ d. Strukturelements Spalten C und D: Startseite des Strukturelements Spalten H und I: Autor und Titel des Strukturelements
Meta- und Strukturdaten Strukturdaten: Metadata: Erfassen der Metadaten Title Author
Meta- und Strukturdaten Strukturdaten: Metadata: Erfassen der Metadaten (Autor und Titelinformation) Title Author
Meta- und Strukturdaten Strukturdaten: Metadata: Erfassen der Metadaten (Autor und Titelinformation) OCR der Inhaltsverzeichnisse Funktioniert nicht bei schlechter Druckqualität oder Frakturschrift
Meta- und Strukturdaten Metadatenübernahme Katalogmetadaten Übernahme der Metadaten aus dem OPAC Download mit WiniBW Java-Programm zum mergen der Katalogdaten mit den XML-Daten
Meta- und Strukturdaten Erfassung nach dem Scannen Images werden zur Metadatenerfassung genutzt AGORA XML-Editor Keine Konvertierung notwendig
Meta- und Strukturdaten AGORA Editor
Meta- und Strukturdaten docWorks Software des METAe-projekts derzeit im Testeinsatz automatische Generierung der Struktur- und Metadaten...
Volltext Im TEI/XML Format (mit Wortkoordinaten möglich) Manuelle Erfassung (Dienstleister) Automatische Generierung mit AGORA Konverter (unkorrigierter OCR-Text) mit docWorks (während Meta- und Strukturdatenerfassung; derzeit noch kein TEI/XML)
Management Dokumentenmanagement System Ein System für alle Projekte Erweiterung/Updates stehen für alle Projekte zur Verfügung Einfache Pflege und Administration Import Batch-Import der Meta- und Strukturdaten mit den Images Volltexte (TEI/XML) können separat importiert werden
Dokumenten-Management AGORA Java-Servlet Meta-, Strukturdaten und Volltexte in relationaler Datenbank Imagedaten im Dateisystem Verity-Engine zur Volltextindexierung Kooperation mit „Satz-Rechen-Zentrum“
Dokumenten-Management Administration
Dokumenten-Management Administration Derzeit Windows basiert Web-basierte Administrationsoberfläche in Entwicklung
Dokumenten-Management Web-Präsentation WebMacro Templates Auch XML-Ausgabe realisierbar Cache-Verwaltung (von HTML-Seiten) Als JAVA-Servlet realisiert
Dokumenten-Management Web- Präsentation