180 likes | 298 Vues
Mari Kleemola. Tutkimusaineistojen metadata. ”Tietoa tiedosta - Tietoa metatiedosta” Tilastokeskus 10.4.2003. Aiheeni tänään. Yhteiskuntatieteellisen tietoarkiston (FSD) esittely DDI-kuvailuformaatti ja sen hyödyntäminen. mari.kleemola@uta.fi Yhteiskuntatieteellinen tietoarkisto
E N D
Mari Kleemola Tutkimusaineistojen metadata ”Tietoa tiedosta - Tietoa metatiedosta” Tilastokeskus 10.4.2003
Aiheeni tänään • Yhteiskuntatieteellisen tietoarkiston (FSD) esittely • DDI-kuvailuformaatti ja sen hyödyntäminen mari.kleemola@uta.fi Yhteiskuntatieteellinen tietoarkisto 33014 TAMPEREEN YLIOPISTO
Yhteiskuntatieteellinen tietoarkisto (FSD) • perustettu 1999 • Tampereen yliopiston erillinen laitos • perustehtävät: • arkistoi yhteiskuntatiet. tutkimusaineistoja • antaa niihin liittyvää tietopalvelua • edistää olemassaolevien koti- ja ulkomaisten tutkimusaineistojen käyttöä • asiakkaina tutkijat ja opiskelijat Suomessa ja ulkomailla • peruspalvelut maksuttomia
DDI Data Documentation Initiative • http://www.icpsr.umich.edu/DDI/ • komitea perustettiin 1995 • tavoite: formaatti kvantitatiivisten yhteiskuntatieteellisten tutkimusaineistojen kuvailuun • kehitystyössä tehtiin ja tehdään vertailuja muihin formaatteihin (mm. MARC, ISO690-2, Dublin Core)
DDI:n tavoite ”... an effort to establish an international criterion and methodology for the content, presentation, transport, and preservation of "metadata" about datasets in the social and behavioral sciences. Metadata (data about data) constitute the information that enables the effective, efficient, and accurate use of those datasets.”
DDI Data Documentation Initiative • ensimmäinen versio ilmestyi 17.3.2000 • tuorein kehitysversio 1.3 • versio 2.0 tänä keväänä • käytössä myös kvalitatiivisten aineistojen kuvailussa • sopii myös muiden kuin yhteiskunta-tieteellisten aineistojen kuvailuun • laajennuksia lisätään
DDI ja XML • DDI-aineistonkuvaukset tehdään XML-kielellä • XML on dokumenttirakenteiden määrittely- ja esitystapakieli • XML-dokumentissa sallitut elementit ja niiden väliset suhteet, järjestys ja toistettavuus määritellään dokumenttityyppimäärittelyssä (DTD)
DDI:n rakenne • DDI:n DTD koostuu viidestä osasta 1. Dokumentaation kuvaus 2. Tutkimuksen kuvaus 3. Datatiedoston kuvaus 4. Muuttujien kuvaus 5. Muu tutkimukseen liittyvä materiaali • yhteensä noin 300 elementtiä • kaikkia ei tarvitse käyttää
Pala DDI-DTD:n rakennetta | |---- 2.2 stdyInfo* (ATT == ID, xml:lang, source) | | | | | |---- 2.2.1 subject? (ATT == ID, xml:lang, source) | | | | | | | |---- 2.2.1.1 keyword* (ATT == ID, xml:lang, source, vocab, vocabURI) | | | +---- 2.2.1.2 topcClas* (ATT == ID, xml:lang, source, vocab, vocabURI) | | | | | |---- 2.2.2 abstract* (ATT == ID, xml:lang, source, date) | | | | | |---- 2.2.3 sumDscr* (ATT == ID, xml:lang, source) | | | | | | | |---- 2.2.3.1 timePrd* (ATT == ID, xml:lang, source, event, date) | | | |---- 2.2.3.2 collDate* (ATT == ID, xml:lang, source, event, date) | | | |---- 2.2.3.3 nation* (ATT == ID, xml:lang, source, abbr) | | | |---- 2.2.3.4 geogCover* (ATT == ID, xml:lang, source) | | | |---- 2.2.3.5 geogUnit* (ATT == ID, xml:lang, source) | | | |---- 2.2.3.6 anlyUnit* (ATT == ID, xml:lang, source, unit)
DDI:tä hyödyntävät... • tietoarkistot eri maissa (http://www.nsd.uib.no/cessda/europe.html) • Nesstar (http://www.nesstar.com) • Madiera (http://www.madiera.org) • Counting California (http://countingcalifornia.cdlib.org/) • Virtual Data Center (Harvard & MIT) (http://thedata.org/)
DDI:n ”kehityslistalla” • DDI-DTD:n laajentaminen: • monimutkaisten tiedostojen kuvaaminen • spatial data • aineistosarjojen kuvailun kehittäminen • kontrolloidut sanastot attribuuteille • DDI-dokumenttien luomista tukevien ohjelmistojen kehittäminen (”DDI-editori”) • erilaisten datanjakelujärjestelmien yhteensopivuuden varmistaminen
DDI:n tulevaisuus • DDI vapaasti käytettävissä • DDI Alliance • jäsenyyteen perustuva ylläpito- ja rahoitusmalli • kansainvälinen koalitio • isäntäorganisaatiot ICPSR ja Roper Center • jokaisella jäsenellä yksi edustaja Expert Committeessa, joka vastaa DDI:n kehitystyöstä
MADIERA (http://www.madiera.org) • kesto: 2002-2005 • rahoitus: EU:n 5. puiteohjelma • tavoite: monikielinen www-portaali yhteiskuntatiet. tutkimusaineistojen hakuun, selaamiseen ja imurointiin • FSD:n vastuulla: • ELSST-tesaurus suomeksi • tiedotus
MADIERAssa mukana Osallistujat: • NSD, Norja (koord.) • UKDA, Iso-Britannia • DDA, Tanska • FSD, Suomi • SIDOS, Sveitsi • EKKE, Kreikka • ZA, Saksa