140 likes | 250 Vues
Aineiston siirto Open Journal Systems -järjestelmään. OJS järjestelmään voidaan tuoda Yksittäisiä artikkeleita (abstrakti + artikkeli) Kokonaisia numeroita (artikkelit erillisinä) - Käyttäjiä. Missä formaatissa? Digitoitu aineisto tekstitunnistettuun PDF-muodossa.
E N D
OJS järjestelmään voidaan tuoda • Yksittäisiä artikkeleita (abstrakti + artikkeli) • Kokonaisia numeroita (artikkelit erillisinä) • - Käyttäjiä
Missä formaatissa? • Digitoitu aineisto tekstitunnistettuun PDF-muodossa. • Myös HTML, DOC ja RTF tuettuja.
Miten tuodaan? • Järjestelmässä valmis työkalu (Articles and Issues XML Plugin). • Käytettävissä netin ylitse (http) tai paikallisesti.
XML • UTF-8 koodaus • Validia XML-kieltä • Päivämäärät YYYY-MM-DD • Rakennemäärittelyt /plugins/importexport/native/native.dtd
XML –tiedoston validointi *nix xmllint [http://xmlsoft.org/xmllint.html] Validome [http://www.validome.org/xml/] Oxygen XML [http://www.oxygenxml.com/] XMLspy [http://www.altova.com]
Numeron metatiedot Numero julkaistu / julkaisematon Volyymi Numero Vuosi Julkaisupäivämäärä Nimeke Osastot (nimi & lyhenne)
Artikkelin metatiedot Otsikko Kirjoittajat (nimi + email) Julkaisupäivämäärä Sivunumerot
Muita mahdollisia tietoja Numero: title, description, volume, number, year, cover (caption/image), published, date_published, current, access_date, open_access Artikkeli: title, abstract, indexing, sponsor, author, pages, date_published, open_access, supplemental_file Kirjoittaja: firstname, middlename, lastname, affiliation, country, email, url, competing_interests, biography http://ojs.tsv.fi/plugins/importexport/native/native.dtd
Tiedostojen upottaminen XML-tiedostoon Esim. artikkelit PDF tai HTML –muodossa.<embed> -tagilla base64-koodattuna <galley> <label>PDF</label> <file> <embed encoding="base64" filename="my_file.pdf" mime_type="application/pdf">PGxpPjxCPlc8Zm9ukjfdaSD… </embed> </file> <galley>
Tiedostojen tuominen paikalliselta levyltä tai verkosta <href> -tagilla <galley> <label>PDF</label> <file> <hrefsrc="http://www.example.com/import_files/my_file.pdf" mime_type="application/pdf"/> </file> <galley>
Esimerkki <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE issues SYSTEM "native.dtd"> <issues> <issuepublished="true" current="false"> <volume>21</volume> <number>1</number> <year>2002</year> <date_published>2002-01-1</date_published> <titlelocale="fi_FI">Vol 21, Nro 1 (2002)</title> <section> <titlelocale="fi_FI">Pääkirjoitus</title> <abbrevlocale="fi_FI">PAA</abbrev> <article> <titlelocale="fi_FI">Mietteitä</title> <date_published>2008-12-04</date_published> <pages>1-2</pages> <authorprimary_contact="true"> <firstname>Etunimi</firstname> <lastname>Sukunimi</lastname> <email><![CDATA[]]></email> </author> <galleylocale="fi_FI"> <label>PDF</label> <file> <embed encoding="base64" filename="2-3.pdf"> JVBERi0xLjQKJeLjz9MKNCAwIG9iago8PC9MYXN0Q2hhciAyNTUKL0Jhc2VGb250IC9IZWx2ZXR jFmODRjPl0KPj4Kc3RhcnR4cmVmCjg3NTc4CiUlRU9GCg== </embed></file></galley></article></section></issue></issues>
TSV:n ratkaisu PHP-skriptiLukee & käy läpi excel-muotoisen (.csv) luettelon artikkeleista. Hyödyntää ilmaista pdftk (The pdf toolkit) –ohjelmaa. Pilkkoo PDF-tiedostot artikkeleihin. Muodostaa yhden XML-tiedoston vietäväksi OJS-järjestelmään.