150 likes | 262 Vues
Petr Žabička Moravská zemská knihovna v Brně zabak@mzk.cz. Návrh HW a SW vybavení krajského digitalizačního centra. Podklady k rozhodnutí. Druh dokumentů určený k digitalizaci noviny staré tisky 19./20. století mapy, grafiky, atlasy... Množství dokumentů k digitalizaci
E N D
Petr Žabička Moravská zemská knihovna v Brně zabak@mzk.cz Návrh HW a SW vybavení krajského digitalizačního centra
Podklady k rozhodnutí • Druh dokumentů určený k digitalizaci • noviny • staré tisky • 19./20. století • mapy, grafiky, atlasy... • Množství dokumentů k digitalizaci • Fyzický stav dokumentů • nutný restaurátorský zásah? • pevnost papíru, pevnost vazby • Typ vazby • nakolik lze svazek rozevřít? • jak daleko od vazby začíná text?
Scannery • Pravděpodobné vybavení pracoviště • 1x robotický scanner • 1-2x ruční knižní scanner • Vhodné koordinovat mezi kraji, např. • 1x robotický A2, 1x ruční A4 • 1x robotický A4, 1x ruční A3 • 1x ruční 2A0 (mapy), 2x ruční A3 • ... apod. • Vhodné prostory • eliminace negativních vlivů vnějšího světla • hlučnost
4DigitalBooks • Pro dokumenty max. formátu A2 • Nutnost rozevření dokumentu do roviny • Přítlak zespodu na sklo • Vyšší cena (cca 7 mil. Kč) • Velká hmotnost a rozměry • 1 pracovník obslouží cca 2 scannery
Treventus • Unikátní konstrukce skenovacího mechanismu • Svislý pohyb • Skenované listy drženy podtlakem • Skenují se obě strany zároveň • Obálku a přídeští je nutné skenovat na ručním skeneru zvlášť • Nepříjemné blikání při digitalizaci (zátěž) • Doporučuje se aby 1 pracovník obsluhoval 1 scanner
Kirtas • Snímání jedním nebo dvěma digitálními fotoaparáty • Obracení stran mechanickým ramenem s využitím podtlaku • Nasazeno zejména v USA, ale např. i BL • 1 pracovník obslouží více než 1 scanner
Velkoformátový scanner - Metis 2xA0 • Pravděpodobně nejpřesnější scanner pro staré mapy • Maximální velikost 2xA0 • cca 4 mil. Kč • Metis vyrábí i další knižní scannery
Workflow • Koordinace digitalizace rámcovou dohodou • Přesněji prostřednictvím RD CZ • Analogické toky dokumentů na obou pracovištích • bibliografický záznam -> digitalizace -> metadata • využití komerčních nebo open source nástrojů • snaha o minimum ruční práce, maximální automatizaci workflow, vysoký výkon • Ochrana digitalizovaných dokumentů (omezení výpůjček, restaurování, ochranné obaly)
Požadavky na SW pro workflow 1 • vazba na existující systémy (Aleph a další - Z39.50 nebo XML/HTTP; RD.CZ) • nezávislý na jednom modelu/výrobci HW (zejm. scannerů) • minimalizace lidské práce, maximální automatizace procesů • automatické OCR, generování OCRtextu v podobě XML včetně souřadnic slov (např. Finereader) • tvorba požadovaných metadat (METS) • sledování toku dokumentů linkou • rozhodnutí zda výpočetní výkon centralizovat na serverové farmy nebo na velký počet PC
Požadavky na SW pro workflow 2 • Proces končí vložením balíčku dat a metadat do systému pro digital preservation (SIP v terminologii OAIS) - jeho případnou absenci nutno zohlednit • zvětšení objemů dat spravovaných tímto SW • dočasně supluje jeho roli? • Zkušenosti z fungujících digitalizačních center: • důraz na kontrolu kvality ihned po digitalizaci • možnost opravit chyby před vrácením svazku do skladu => úspora • větší chybovost při digitalizaci na manuálních scannerech • Testy různých SW pro workflow nedávno provedla ÖNB
Potenciální dodavatelé SW pro workflow • 4DigitalBooks • každý pracovník obsluhuje 2-3 počítače • CCS • centrální serverová farma • využívá se levná práce Rumunů • Treventus • připravuje se • Goobi • open source systém, 2 firmy zajišťují podporu
Děkuji za pozornost! Petr Žabička <zabak@mzk.cz> Moravská zemská knihovna v Brně www.mzk.cz