230 likes | 519 Vues
Intro til Semantiske Teknologier/ Semantisk Interoperabilitet. Øyvind Aassve NorStella. Hva er Semantisk Interoperabilitet?.
E N D
Intro til Semantiske Teknologier/ Semantisk Interoperabilitet Øyvind Aassve NorStella
Hva er Semantisk Interoperabilitet? • Semantikk er studiet av mening i språk. Semantikk er ofte definert som ut fra sin relasjon til syntax, som i stedet for å si noe om hva noe betyr, sier noe om hvordan noe uttrykkes (f.eks. skriftlig eller muntlig). • Interoperabilitet beskriver evnen til IKT-systemer og og de forretningsprosessene de støtter for å utveksle data for deling av informasjon og kunnskap. See http://europa.eu.int/ida/en/document/2319
Områder for interoperabilitet(fra European Interoperabilty Framework) Organisatorisk Interoperablilitet(modellere og koordinere forretningsprosesser, konsistens med interne mål, gjøre tjenester lett tilgjenglige og brukervennlige) Semantisk Interoperablilitet(sikre presis mening og lik oppfattelse av betydning av informasjon av begge parter) Teknisk Interoperablilitet(tekniske løsninger for å linke systemer – område for WebServices og SOA)
Kommunikasjon og semantikk Mellom mennesker Mellom mennesker og maskiner Mellom maskiner A B Communication Hvordan kan vi være sikre på at A og B mener det samme? MeaningA MeaningB
Den semantiske løsningen • Fra systemer hvor semantikken er • Implisitt/ bakt inn • Usystematisk • Uformell • Ikke-standard • Til systemer der semantikken er: • Eksplisitt og modifiserbar • Systematisk • Formell (mer eller mindre) • Standardisert
Hvorfor bry seg om semantikk? • Internett/ økt elektronisk samhandling gjør at bedrifter må utveksle informasjon definert for en intern kontekst med et nettverk av partnere. • Informasjonsmengden i verden vokser eksponentielt og nesten alt må tolkes av mennesker for å være av nytte • Estimater indikerer at 35%-65% av de USD 300 milliarder brukt årlig på systemintegrasjon skyldes semantisk mismatch mellom systemer.
XML løste ikke alle problemer • Standarder har blitt utviklet internt av selskaper, bransjeorganisasjoner, løsningsleverandører og teknologigrupperinger – forskjell i både design og semantiske referenter. • XML er et teknologisk verktøy som muliggjør enklere og billigere integrasjon – ikke en universalløsning for interoperabilitet.
XML og interoperabilitet • Forskjellig innhold <Amount>NOK100 <Amount><Amount>HundreKroner<Amount> • Forskjellig struktur <Amount>NOK100 <Amount> <Currency>NOK<Currency><Amount>100<Amount> • Forskjellig semantikk <Amount>NOK100 <Amount><Price>NOK100<Price>
Nivå for formalisering av semantikk Thesaurus Controlled vocabulary Taxonomy Ontology/ metamodel Level of expression
Ontologi og semantikk • Ontologier/ Metamodeller spesifiserer konsepter og strukturer for å uttrykke kunnskap. • Kunnskap uttrykkes i formelt eller uformelt språk • Semantikk definerer meningen i ved referanser til den virkelige verden Concepts Ontology/metamodel Knowledge Semantics (meaning) Ontology/metamodel Ontology/Metamodel
Informasjonshierarkiet • legger attributter til informasjonen for å beskrive hvordan den faktisk kan brukes. Kunnskaps- modell Kunnskap Informasjons- modell • legger kontekst til dataene – analyserer relasjoner og forbindelser mellom dataene. Informasjon Datamodell • tall, bokstaver, bilder som i seg selv ikke gir mening – råobservasjoner. Data
Tidslinje for betydningen av data GIGO/minis/micros www / Netscape Web services OWL Age of Proprietary Data Age of Semantic Models Age of Programs Age of Open Data Age of Open Metadata Program-Data Text, Office Docs Databases (proprietary schema) HTML, XML (open schema) Namespaces, Taxonomies, RDF 1945 -1970 1970 - 1994 1994 - 2000 2000 - 2003 2003 - Procedural Programming Object-Oriented Programming Model-Driven Programming “Data is less important than code” “Data is as important as code” “Data is more important than code”
Aktuelle standardiseringsorganisasjoner • UN/CEFACT – fokus på prosess, metodologi og semantiske definisjoner • W3C – basis WS-teknologier og semantiske teknologier relatert til semantisk web. • OASIS – mest fokus på teknisk interoperabilitet – nye WS-standarder
RDF – Resource Description Framework • Formell modell for metadata som beskriver ressurser på Web’en på maskinlesbar form • En ressursbeskrivelse består av • Et eller flere utsagn (statement), der hvert utsagn er et trippel: <subjekt, objekt, verdi> • Verdi kan være en annen ressurs eller en literal • RDF utsagn uttrykkes i XML syntaks
OWL – Web Ontology Language • RDF uttrykker metadata ”instanser”, men ikke begrepeneinstansene bruker => ontologier • OWL er et språk for å definere ontologier • Hovedbegrepene i OWL • Klasser/subklasser (taksonomier) • Egenskaper (arving av egenskaper) • Datatyper (lovlige verdier av egenskaper) • OWL er basert på logikk (DL - Description Logic) og åpner for resonnering over semantisk innhold
Web Services Semantic Web Services UDDI, WSDL, SOAP Dynamisk Semantic Web RDF, RDF(S), OWL Semantikk WWW - Veikart videre? WWW URI, HTML, HTTP Statisk Syntaks
Core Components - del av en større UN/CEFACT rammeverk • Inngår i en formell arbeidsmetodikk basert på ideene fra ebXML – nå under vingene til UN/CEFACT • Etablerer et tydelig skille mellom funksjonalitet (modell) og realisering (EDIFACT/XML) • Bidrar til harmonisering (felles forståelse mellom ulike domener/bransjer) som en integrert del av en utviklingsprosess
Core Components • Også publisert som ISO TS 15000 – 5: • – Core Component Technical Spesification – part 8 of the ebXML framework • Beskriver en metodikk for • – utvikling av et omforent sett av semantiske byggeklosser • – å identifisere, beskrive og maksimere gjenbruk av forretningsinformasjon til støtte for semantisk interoperabilitet på tvers av ulike forretningsdomener • • Følger prinsippene i ISO 11179 • • Tilrettelegger for • – semantisk interoperabilitet på tvers av forretningsdomener • – konsistent bruk av felles semantiske enheter • – konsistent bruk på tvers av ulike språk • • Støttes av en rekke prosjekter/initiativ • – Rosettanet, OAG, SWIFT, EAN, UBL, .... • • Det første bibliotek/ registry med harmoniserte komponenter er nå publisert. • NorStella lanserer nasjonalt bibilotek/ registry for BIEer med norsk kontekst neste år.