1 / 23

S émantický web

S émantický web. Martin Švihla svihlm1 @fel.cvut.cz (január 2004). Obsah. Čo je sémantický web ? Motivácia pre vznik sémantického webu Používané technológie Využitie sémantického webu Súčasný stav Rozvoj – predpoklady a postupy Záver. Čo je to Sémantický web?.

kenyon
Télécharger la présentation

S émantický web

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Sémantický web Martin Švihla svihlm1@fel.cvut.cz (január 2004)

  2. Obsah • Čo je sémantický web? • Motivácia pre vznik sémantického webu • Používané technológie • Využitie sémantického webu • Súčasný stav • Rozvoj – predpoklady a postupy • Záver

  3. Čo je to Sémantický web? Sémantický web je rozšírenie súčasného webu, v ktorom sú dáta popísané tak, aby ich významu rozumeli aj počítače. To by malo umožniť lepšiu spoluprácu medzi ľuďmi a strojmi.

  4. Motivácia Problém: docent X. sa má zúčastniť na vedeckej konferencii v Pekingu Postup riešenia: • docent X. zadá svojmu softvérovému agentovi základné údaje o konferencii • softvérový agent vyhľadá najvhodnejšie letenky • zistí z internetových stránok rozvrh konferencie • v osobnom profile docenta X. nájde jeho záujem: čínsku operu • zistí predstavenia čínskej opery v Pekingu v dňoch konferencie • všetky informácie poskytne docentovi X. • docent X. požiada svojho digitálneho asistenta o rezerváciu vybraných leteniek a lístkov do opery

  5. Súčasný web Stav • obrovské množstvo informácií • informácie sú určené pre ľudí, ich významu stroje nerozumejú • metadáta sú obmedzené: keywords, title Dôsledky • neefektívne a nepresné vyhľadávanie • obrovské znalostné domény sú náročné na údržbu • obmedzené možnosti automatickej výmeny informácií

  6. Vízia sémantického webu (zjednodušený pohľad) • dáta sú popísané tak, aby bol ich význam zrozumiteľný počítačom • agenti môžu týmito dátami prechádzať, vyhľadávať v nich podľa významu informácií • agenti môžu navzájom komunikovať, dokážu nájsť spoločnú reč • agent sa môže učiť rozumieť pojmom z nových znalostných domén

  7. Štruktúra sémantického webu • syntax XML • RDF vrstva (obsahuje metadáta) • ontológie - popis pojmov a vzťahov • logické odvodzovanie (inference) na základe pravidiel • zabezpečenie vierohodnosti (trust layer)

  8. XML syntax • pridáva (stromovú) štruktúru do dokumentov • každý môže vytvárať vlastné tagy • štruktúra XML nevypovedá o význame dát <Person Id=“xxxx”> <Name>docentX</Name> <Age> <value>66</value> <unit>year</unit> </Age> <Person> … počítač rozumie štruktúre, ale nie významu tagov

  9. RDF metadáta • zapísané v XML • na vyjadrenie informácie používa tvrdenia (statements) vo forme tripletov (triples) • triplet má formu jednoduchej vety – podmet, prísudok, predmet docentX hasAge 66

  10. RDF metadáta • zapísané v XML • na vyjadrenie informácie používa tvrdenia (statements) vo forme tripletov (triples) • triplet má formu jednoduchej vety – podmet, prísudok, predmet • predmet môže byť ďalším podmetom 33 docentX hasFriend hasAge hasAge 66 docentY

  11. RDF metadáta • zapísané v XML • na vyjadrenie informácie používa tvrdenia (statements) vo forme tripletov (triples) • triplet má formu jednoduchej vety – podmet, prísudok, predmet • predmet môže byť ďalším podmetom a tak vzniká sieť informácií 33 docentX hasFriend ... hasAge hasAge ... 66 docentY

  12. Ontológie • Ontológia poskytuje zdieľaný slovník, ktorý popisuje vybranú doménu. • Popisuje typy objektov a/alebo pojmy, ich vlastnosti a vzťahy medzi nimi. <rdfs:Class rdf:about="Person" rdfs:label="Person"> <rdfs:subClassOf rdf:resource="Human"/> </rdfs:Class> <rdf:Property rdf:about="hasSon"> <rdfs:domain rdf:resource="Person"/> <rdfs:range rdf:resource="Person"/> <rdfs:subPropertyOf rdf:resource="hasRelative"/> </rdf:Property>

  13. Logické odvodzovanie (inference) • Súčasťou ontológie je súbor odvodzovacích pravidiel • Podľa týchto pravidiel dokáže odvodzovací mechanizmus zistiť informácie, ktoré neboli v metadátach uvedené

  14. Logické odvodzovanie (inference) • Súčasťou ontológie je súbor odvodzovacích pravidiel • Podľa týchto pravidiel dokáže odvodzovací mechanizmus zistiť informácie, ktoré neboli v metadátach uvedené Ak docentX je inštancia triedy Person a jeho syn je PeterX... <Person> <Name>docentX</Name> <hasSon>PeterX</hasSon> <Person> ... potom odvodzovací mechanizmus dokáže zistiť, že docentX aj PeterX sú z triedy Human a žesú príbuzní(hasRelative).

  15. Záruka pravdivosti Problém: • odvodzovanie nemusí byť spoľahlivé • v prípade pochybností by mal existovať mechanizmus overenia pravdivosti informácií Možné riešenia: • agent je schopný doložiť informáciu aj postupom jej získania (odvodenia) • digitálny podpis

  16. Výsledok (z pohľadu strojov) Súčasný web

  17. Výsledok (z pohľadu strojov) Súčasný web Sémantický web livesIn docentX hasWife livesIn hasProblem worksAt hasProblem (inferred)

  18. Použitie sémantického webu • správa znalostí (knowledge management) • vyhľadávanie informácií • štrukturalizácia skladov informácií • adaptácia informačných zdrojov • Enterprise Application Integration • eCommerce (B2B) • snaha o štandardizáciu formátu zdieľaných informácií

  19. Súčasný stav 1/2 • semantický web zatiaľ nie je masovo rozšírený • technológia je považovaná za veľmi perspektívnu • prebieha vývoj a úprava štandardov (RDF, OWL...) • do výskumu sa investuje (EU, HP, NASA, Microsoft...) • používajú sa niektoré jednoduché štandardy • RSS • DublinCore • RedHat’s Update Agent • ... nevyužívajú naplno možnosti konceptov SW

  20. Súčasný stav 2/2 • Sú vytvorené aplikácie: • parsery a validátory RDF, čiastočne aj OWL • anotácia HTML • tvorba, ukladanie a distribúcia ontológií • RDF servery • ... • Chýbajú „killer apps“

  21. Rozvoj - predpoklady • vyhovujúce (open source) štandardy • systémy musia byť tolerantné voči chybám (Error 404, nelogické odvodzovanie) • masové vytváranie metadát a ontológií • vytvorenie praktických aplikácií

  22. Rozvoj - postup Smer rozvoja • Zdola nahor - vývoj štandardov, architektúry a infraštruktúry (W3C) • Zhora dolu- tvorba ontológií, metadát a aplikácií Generovanie metadát • generovanie RDF metadát popri HTML prezentáciách • poskytovanie informácií priamo vo forme RDF metadát (knižnice, elektronické obchody...)

  23. Záver • Sémantický web nie je doposiaľ rozšírený • Koncept je považovaný za perspektívny • Štandardy sú vo fáze dokončenia • Začínajú vznikať ontológie a metadáta • Objavujú sa prvé aplikácie Najzaujímavejšie na sémantickom webe nie je to, čo si vieme predstaviť s ním robiť, ale to, čo si predstaviť nevieme. Rovnako ako sme si pred desiatimi rokmi nevedeli predstaviť možnosti súčasného webu. (Tim Berners-Lee)

More Related