500 likes | 1.07k Vues
Web Engineering 2010 Pertemuan ke-14. Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress.com. Outline. Dari Web ke Web Semantik Pendekatan Web Semantik Arsitektur Web Semantik Contoh-contoh Implementasi Roadmap Aplikasi Web (1990 – 2030) Rangkuman.
E N D
Web Engineering 2010 • Pertemuan ke-14 • Web Semantik • Husni • husni@if.trunojoyo.ac.id • Husni.trunojoyo.ac.id • Komputasi.wordpress.com
Outline • Dari Web ke Web Semantik • Pendekatan Web Semantik • Arsitektur Web Semantik • Contoh-contoh Implementasi • Roadmap Aplikasi Web (1990 – 2030) • Rangkuman
Mengapa kita memerlukan Web Semantik? Dari web ke web semantik
Web Hari Ini • Web kini mendeskripsikan informasi menggunakan • Bahasa alami (Inggris, Jerman, Indonesia,…) • Gambar, multimedia, layout halaman • Orang dapat memroses ini dengan mudah • Dapat menarik kesimpulan fakta dari informasi parsial • Dapat membuat asosiasi mental • Digunakan untuk berbagai informasi yang berhubungan dengan panca-indera • (… orang dengan keterbatasan mungkin punya masalah serius pada web yang kaya media!)
Web Hari Ini • Kita sering harus memadukan banyak data pada Web • Informasi hotel dan travel mungkin datang dari situs berbeda • Pencarian dalam pustaka digital berbeda • Dll... • Lagi, orang menggabungkan informasi ini dengan mudah • Bahkan jika digunakan terminologi berbeda!
Namun… • Mesin itu bodoh! • Informasi parsial tak dapat dimanfaatkan • Sulit untuk membangun pengertian dari, misal: suatu gambar (image) • Penggambaran analogi secara otomatis sulit • Susah memadukan informasi secara otomatis • Apakah <foo:creator> sama denga <bar:author>? • Bagaimana menyatukan hirarki XML berbeda? • …
Bagaimana Meningkatkan Web Kini? • Meningkatkan linking otomatis antar data • Menaikkan recall & precisionpencarian • Meningkatkan otomasi dalam integrasi data • … • Menyertakan semantika ke data dan layanan adalah solusi!
5 Pendekatan Semantika • Tagging • Statistics • Linguistics • Semantic Web • Artificial Intelligence
Pendekatan Tagging • Pro & Kontra • Pengguna mudah menambahkan & membaca tag • Tag hanya berupa string • Tak ada algoritma atau ontologi yang perlu ditangani • Tak ada teknologi yang harus dipelajari • Del.icio.us • Flickr • Wikipedia
Pendekatan Statistik • Pro • Algoritma matematika murni • Sangat Scalable • Tak tergantung bahasa • Kontra • Tak ada pemahaman dari content • Sulit merumuskan query yang bagus • Paling baik untuk mendapatkan hal yang benar-benar popular – tidak baik untuk memperoleh yang penting dalam tumpunan • Tidak bagus bagi data terstruktur • Google • Lucene • Autonomy
Pendekatan Linguistik • Pro • Pemahaman bahasa sejati • Mengekstrak pengetahuan dari teks • Paling baik untuk mencari fakta atau hubungan tertentu • Query lebih tepat • Kontra • Intensif secara komputasional • Sulit diskalakan (unscalable) • Banyak errornya • Tergantung pada bahasa • Powerset • Hakia • Inxight • Attensity • …
Pendekatan Web Semantik • Pro • Query lebih tepat • Aplikasi lebih cerdas, kerja lebih sedikit • Tidak sebagai komputasional intensif • Share & link data antar aplikasi • Bekerja terhadap data terstruktur maupun tidak • Kontra • Kurangnya perangkat (tool) • Sulit diskalakan • Who makes all the metadata? • FOAF Project • DBpedia Project • Metaweb • … • Kontra akan terpecahkan, hanya masalah waktu!
Pendekatan Kecerdasan Buatan • Pro • Cerdas dalam domain yang sempit • Menjawab pertanyaan secara cerdas • Penalasan dan pembelajaran • Kontra • Intensif secara komputasional • Sulit diskalakan • Sangat sulit diprogram • Tidak bekerja baik diluar dari domain yang sempit • Traning mengambil banyak pekerjaan • Cycorp
Ayo kita nikmati “daging” sebenarnya hari ini! Arsitektur web semantik
Apa itu Web Semantik? • “The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.” T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”, Scientific American, May 2001
… “well-defined meaning” … • “An ontology is an explicitspecification of a conceptualization” Gruber, “Toward principles for the design of ontologies used for knowledge sharing?” , Int. J. Hum.-Comput. Stud., vol. 43, no. 5-6,1995. • Ontologi adalah fondasi pemodelan untuk Web Semantik • Menyediakan pengertian yang terdefinisi baik bagi informasi
… explicit, …specification, … conceptualization, … Ontologi adalah... • Konseptualisasi: Model dari konsep yang paling relevan dari suatu fenomena dari dunia nyata • Explicit: Model secara eksplisit menyatakan jenis dari konsep, hubungan antar konsep dan batasan yang digunakan • Formal: Ontologi harus bersifat machine readable (tidak memanfaatkan natural language) • Shared: Pengetahuan yang terkandung dalam ontologi bersifat consensual, yaitu telah diterima oleh kelompok orang. Studer, Benjamins, D. Fensel, “Knowledge engineering: Principles and methods”, Data Knowledge Engineering, vol. 25, no. 1-2, 1998.
Web Semantik adalah mengenai.... • Anotasi data Web • Menghubungkan (sintaktis) obyek Web, seperti potongan teks, image, … ke maksud semantiknya (Misal: ini ini mengenai Innsbruck, Dieter Fenseladalah professor) • Linking Data di Web (Web Data) • Jaringan pengetahuan global melalui URI, RDF dan SPARQL (Misal: menghubungkan kalender saya dengan rss feedsaya, gambar-gambar saya, ...) • Integrasi data di Web • Integrasi data berdasarkan model konseptual yang berbeda (misalnya, mengintegrasikan data yang berasal dari dua penjual buku favorit saya )
Menganotasi Data Web http://www.ontoprise.de/
Data Linking pada Web As of Septemer2007 Linking Open Data Project: http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
Integrasi Data di Web URI Sama = Resource sama http://www.w3.org/People/Ivan/CorePresentations/RDFTutorial
Arsitektur Web • Sesuatu dilambangkan dengan URI. • Gunakan URI untuk menunjukkan sesuatu. • Sajikan informasi yang berguna pada URI. • Dereference-kan URI.
Arsitektur Web Semantik • Memberikan konsep penting URI. • Setiap URI memperkenalkan satu konsep. • Share simbol-simbol ini antara banyak bahasa • Dukung URI lookup
Stack pada Web Semantik Topik yang sering dibahas!
URI dan XML • Uniform Resource Identifier (URI) adalah dual dari URL di WebSemantik • Sasarannya adalah untuk mengidentifikasi sumber daya • eXtensible Markup Language (XML) adalah suatu bahasa markup yang digunakan untuk menstrukturkan informasi • Landasan darirepresentasi data pada Web Semantik • Tag tidak menyampaikan informasi semantik
RDF dan OWL • Resource Description Framework (RDF) adalah dual dari HTML dalam Web Semantik • Cara sederhana mendeskripsikan sumber daya di Web • Jenis bahasa ontologu sederhana (RDF-S) • Berpijak pada triple (subject; predicate; object) • Serialisasi adalah berbasis XML • Ontology Web Language (OWL) adalah suatu bahasa ber-layer berdasarkan pada DL • Bahasa ontologi yang jauh lebih kompleks • Mengatasi beberapa batasan pada RDF(S)
SPARQL & Bahasa Rule • SPARQL • Bahasa Query bagi triple RDF • Suatu protokoluntuk mengquery data RDF di Web • Bahasa Rule (Misal: SWRL) • Mengextend predikat dasar dalam bahasa ontologi dengan predikat proprietary • Berpijak pada logika berbeda • Logika deskripsi • Logika pemrograman
Tidak Hanya Tentang Data Publik • Web Semantic tidak hanya tentang data publik. • Juga data tentang pribadi, kelompok, instansi dan perusahaan. • Secara historis, server intranet mendahului server ekstranet
Dari Halaman Web ke Layanan Web Intelligent Web Services Web Services UDDI, WSDL, SOAP Dynamic Semantic Web RDF, RDF(S), OWL WWW URI, HTML, HTTP Static Syntactic Semantic
Industri & Web Semantik • Perusahaan besar menawarkan (atau akan menawarkan) Sistem atau tool Web Semantik: Adobe, Oracle, IBM, HP, Software AG, GE, Northrop Gruman, Altova, Microsoft, Dow Jones, … • Pihak lain menggunakannya (atau mempertibangkan untuk menggunakannya) sebagai bagian dari operasinya : Novartis, Boeing, Pfizer, Telefónica, … • Beberapa nama aktif dalam W3C SW: ILOG, HP, Agfa, SRI International, Fair Isaac Corp., Oracle, Boeing, IBM, Chevron, Siemens, Nokia, Pfizer, Sun, Eli Lilly, …
Contoh IMenemukan Pakar yang tepat di NASA • Hampir 20.000 pegawai NASA menggunakan teknik RDF yang mengintegrasikan lebih dari 6 atau 7 database, sumber data dan layanan web yang terdistribusi secara geografis… From Kendall Clark, Clark & Parsia, LLC
Contoh IIVodafone live! • Mengintegrasikan deskripsi produk berbagai vendor via RDF • ring tone, game, wallpaper • Mengelola kompleksitas handset, format biner • Portal dibuat untuk menawarkan content yang tepat • Download content naik signifikan setelah diperkenalkan From Kevin Smith, Vodafone Group R&D
Annotated Content Contoh IIIKIM Browser Plugin • Content web dianotasi menggunakan ontologi • Contentdapat dicari & dijelajah secara cerdas Select one or more concepts from the ontology… … send the currently loaded web page to the Annotation Server
Contoh IVDisco Hyperdata Browser • Menavigasi Web Semantik sebagai himpunan sumber data yang tidak terikat Deferenceable URI
Contoh VFaceted DBLP Kategorisasi topik otomatis berdasarkan pada keyword yang disediakan dalam anotasi metadata
Contoh Lain • Studi kasus dan kasus pemanfaatan Web Semantik dapat dilihat di: http://www.w3.org/2001/sw/sweo/public/UseCases • Cultural Heritage • Health Care • Life Sciences • eCommerce • B2B integration • …
Roadmap Web (Nova Spivack) Intelligent Web Intelligent personal agents Web 4.0 Web OS 2020 - 2030 Distributed Search Web 3.0 Semantic Web SWRL Koneksi Antar Informasi OWL 2010 - 2020 SPARQL Semantic Databases AJAX OpenID Semantic Search Social Web ATOM Widgets RSS RDF Mashups P2P Web 2.0 Office 2.0 Javascript Flash SOAP XML Weblogs Social Media Sharing 2000 - 2010 The Web Java HTML SaaS Social Networking HTTP Directory Portals Wikis VR Keyword Search Lightweight Collaboration Web 1.0 The PC BBS Websites Gopher 1990 - 2000 MacOS SQL MMO’s Groupware SGML Databases Windows File Servers The Internet PC Era Email IRC 1980 - 1990 FTP USENET PC’s File Systems Koneksi Antar Orang
That’s almost all for day… Ringkasan
Rangkuman • Semantic Web bukanlah suatu replacementdari web kini, tetapi suatu evolution-nya • Bertujuan mengotomatiskantugas yang saat ini dilakukan oleh manusia • Semantic Web bukanlah AI 2.0 • Web Semantik menjadi real (mungkin tidak seperti yang awalnya direncanakan, tetapi begitulah)
Referensi • Bacaan Utama • Bab 14 • GrigorisAntoniou and Frank van Harmelen,A Semantic Web Primer, MIT Press • Bab 1 • Bacaan lanjutan • Meletakkan Web kembali ke dalam Web Semantik • http://www.w3.org/2005/Talks/1110-iswc-tbl