60 likes | 162 Vues
Zjednotené vyhľadávanie nad prepojenými dátami na webe. Bc. Peter Macko. Vedúci: Ing. Michal Holub. Aké tu máme problémy?. Písanie dopytov pre sémantický web SPARQL – príliš zložitý Slabá podpora vyhľadávačov Kľúčové slová nedostatočné Vyhľadávanie na základe grafu náročné. Známe riešenia.
E N D
Zjednotené vyhľadávanie nad prepojenými dátami na webe Bc. Peter Macko Vedúci: Ing. Michal Holub
Aké tu máme problémy? • Písanie dopytov pre sémantický web • SPARQL – príliš zložitý • Slabá podpora vyhľadávačov • Kľúčové slová nedostatočné • Vyhľadávanie na základe grafu náročné Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub
Známe riešenia Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Sig.ma • Spájanie dátových zdrojov (Sindice, OKKAM) • Hľadanie cez kľúčové slová • OntoPath • Nápovedapre používateľa • Pevne zadaná štruktúra • Panteo • Použitie NLP StandfordParser • Slabá rýchlosť / absencia nápovede pre používateľa
Ako to chceme riešiť? Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Predspracovanie prepojených dát • Zvýšenie rýchlosti dopytov • Vyhľadávanie bez nutnosti poznania štruktúry • Spracovanie semi-prirodzenéhojazyka • Zapojenie synoným • Poskytnutie nápovedy pokračovania dopytu
Overenie Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • 1. fáza – expert • Porovnanie so SPARQL • Rýchlosť konštrukcie • presnosti dopytu • 2. fáza – bežný používateľ • Prestriedanie výstupov metódy a vyhľadávača • Porovnanie „klikov“ na výstupy
Zhrnutie Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Prepojenie s projektom • hľadanie súvisiacich článkov, konferencií, výskumníkov • Využitie možností NLP • Použitie projektu StandfordParser pre NLP • Práca so synonymami • Použitie slovníka WordNet • Stemming