1 / 9

Využitie prepojených dát v digitálnej knižnici

Využitie prepojených dát v digitálnej knižnici. Michal Holub školiteľka: prof. Mária Bieliková. holub@fiit.stuba.sk. FIIT STU. Motivácia. Digi tálne knižnice – rozsiahla doména, veľa dát Problémy s vyhľadávaním – tvorba a odporúčanie dopytov navigovaním – získanie prehľadu oblasti

Télécharger la présentation

Využitie prepojených dát v digitálnej knižnici

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Využitie prepojených dátv digitálnej knižnici Michal Holub školiteľka: prof. Mária Bieliková holub@fiit.stuba.sk FIIT STU

  2. Motivácia • Digitálne knižnice – rozsiahla doména, veľa dát • Problémy s • vyhľadávaním – tvorba a odporúčanie dopytov • navigovaním – získanie prehľadu oblasti • Potrebujeme • doménový model s rôznymi typmi vzťahov • model používateľa Holub, Bieliková - WIKT 2012

  3. Digitálne knižnice • Články, autori, časopisy, konferencie • Organizácie • Vydavateľstvá • Pracoviská (fakulty, ústavy) • Reprezentácia pomocou LinkedData • Pracujeme s ACM DigitalLibrary Holub, Bieliková - WIKT 2012

  4. Získavanie meta(dát) • Webový preliezač – sťahúň • Podľa ID získavame články • 1 článok = 1 HTML stránka • Zacielenie na aktivitu používateľa • Annota – sledujeme navštívené stránky v ACM • Sťahujeme primárne okolie navštívených ID • Parsovanie HTML na serveri • Získame • údaje o článku, abstrakt, referencie, KW, ACM triedy Holub, Bieliková - WIKT 2012

  5. Reprezentácia meta(dát) • RDF rámec: subjekt – predikát – objekt • Slovník BIBO – TheBibliographicOntology rdf:Resource book ID bibo:authorList property partOf link bibo:Article rdf:Resource author ID Holub, Bieliková - WIKT 2012

  6. Model používateľa • Aktivity pri práci s DL • Používame nástroj Annota • Zaznamenávame • Čas, skrolovanie • Vyznačený a skopírovaný text • Vyhľadávané výrazy • Zoznam zobrazených výsledkov • Zisťovanie záujmu o daný článok Holub, Bieliková - WIKT 2012

  7. Aplikácie – vyhľadávanie • SPARQL – náročný pre bežné vyhľadávanie • KW – nedostatočná vyjadrovacia sila • Preklad pseudo-prirodzeného jazyka do SPARQL • Articles by Peter Brusilovskyaboutadaptivelearning • Predspracovaniedatasetu • Rozloženie dopytu na časti • Konštrukcia SPARQL dopytu a vyhľadanie Holub, Bieliková - WIKT 2012

  8. Vyhľadávanie – kroky • Predspracovanie datasetu • Subjekty – konštrukcia slovníka prípustných entít • WordNet na rozšírenie termov o príbuzné slová • Keď hľadám paper a v datasete mám article • LinkedDatadatasety (DBpedia, YAGO) • Objekty – konštrukcia slovníka prípustných hodnôt • Prepájanie slov z dopytu na predikáty • Rozloženie dopytu • Stanford NLP na určenie slovných druhov Holub, Bieliková - WIKT 2012

  9. Zhrnutie • Hľadanie vzťahov – doménový model • Doména digitálnych knižníc • Linked Data • Jednoduchšie vzťahy • Získané z webu (RDF) • Zložitejšie vzťahy • Analýza správania používateľov • Použitie pri navigácii a vyhľadávaní Holub, Bieliková - WIKT 2012

More Related