1 / 35

Emnekart i praksis

Emnekart i praksis. Hvordan komme igang Lars Marius Garshol Ontopia Emnekart Norge 2002. Oversikt over foredraget. Forsøk på å forklare hvordan man kommer igang med et emnekartprosjekt Svar på spørsmål som hva slags prosjekt bør man starte med? hva må man ta hensyn til? hva trenger man?

awen
Télécharger la présentation

Emnekart i praksis

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Emnekart i praksis Hvordan komme igang Lars Marius GarsholOntopia Emnekart Norge 2002

  2. Oversikt over foredraget • Forsøk på å forklare hvordan man kommer igang med et emnekartprosjekt • Svar på spørsmål som • hva slags prosjekt bør man starte med? • hva må man ta hensyn til? • hva trenger man? • hva slags verktøy finnes? • Sannheten er at 45 minutter ikke er nok til å besvare alle spørsmål

  3. #1: Det er lettere enn du tror! • Nå som dette er nytt virker det kanskje komplisert og vanskelig • Sannheten er at emnekart er utrolig enkelt • Alle emnekart består av • ting • forhold mellom ting • ressurser om tingene • navn på tingene • Du trenger ikke mer for å lage et nyttig emnekart!

  4. Ting, forhold, ressurser forhold TING TING Dette er ikke ordentlig tekst, bare noe jeg skrive for at dette skal se ut som et dokument, selv om det altså egentlig ikke er noe dokument, men bare juks som jeg skal bruke i denne presentasjo|nen. Nuvel. ressurs

  5. Erfaring er den beste lærer • Hvis du er litt teknisk anlagt • velg et tema du synes er interessant • last ned Omnigator • sett i gang med en teksteditor og LTM • en kveld er nok til å lage et enkelt utkast • Hvis du ikke er teknisk anlagt overhodet • bruk papir og blyant • rundinger er ting, streker er forhold, bokser er ressurser • se hva du får til! • En tredje mulighet • 1-2 dager kurs hjelper • særlig dersom en interaktiv "lag et emnekart"-sesjon inngår

  6. Du kan velge ambisjonsnivå • Du trenger ikke lage "alle leksikons mor" med én gang • Du kan godt starte med en liten del av informasjonsmengden • Dersom denne er interessant i seg selv kan du • gjøre et komplett prosjekt på denne delen • som neste skritt velge et annet utvalg av informasjonen • resultatet fra neste skritt kan hektes inn i det første emnekartet • Emnekartet kan med andre ord vokse organisk etter behov

  7. Smått er trygt • Et lite prosjekt er tryggere enn et stort • kompleksiteten er mindre • prislappen er mindre • ambisjonene som regel mindre • Etter første prosjektet har man lært mer om • hva som er realistisk å få til • hvor man får mest ut av emnekart • hva som fungerer og ikke fungerer i egen organisasjon • Det er fullt mulig å gjennomføre en pilot uten å betale en krone! • ved å bruke gratisverktøy og ikke leie inn hjelp • mange har gjort det allerede

  8. Emnekartet er et register

  9. #2: Du trenger en ontologi! • "Ontologi" høres skummelt og vanskelig ut • Det er bare typene av ting, forhold, og ressurser • "person, barn-av, fødselsdato" er en minimal ontologi • Ontologien bestemmer hva du kan si i emnekartet ditt • Dette er på samme måten som • DTD-en (eller XML Schema) for XML • databaseskjemaet for en relasjonsdatabase • kolonneoppsettet i et Excel-regneark

  10. Ontologier kan gjenbrukes • Ontologien kan du • utvikle selv, • gjenbruke om det finnes en kilde, • eller litt av begge deler (som forsking.no gjorde) • Ofte kan mye løftes rett ut av offentlige emnekart • employed-by, located-in, part-of, created-by, ... • Kan være lurt å be om hjelp • konsulenter kan designe hele greia for deg • eller de kan vurdere det dere har laget • Har du eksisterende data kan idéer hentes derfra

  11. Eksempel på inspirasjon <gcapaper> <title>Topic Maps, The Business Case</title> <author> <fname>Kal</fname> <surname>Ahmed</surname> <jobtitle>Founder</jobtitle> <address><affil>Techquila</affil> <city>Oxford</city> [...] Artikkel skrevet-av Person har-stilling Stilling ansatt-i Firma har-kontor-i By

  12. Ontologier biter ikke! • Ofte vanskelig å lage ontologien med en gang • hvilke typer ting og forhold har vi egentlig? • Du kan velge hvor presis du vil være • det går an å bare ha én forholdstype: har-forhold-til • mer presisjon er bedre, men vanskeligere • Det går an å forandre ontologien underveis • eksisterende data ødelegges ikke av en endring • RDBMS-er har et rigid skjema, emnekart er mye lettere slik • Siden emnekartet ligger utenfor dataene det snakker om... • Ofte starter man nokså upresist • presisjonen økes ved behov

  13. Emnet som knutepunkt, #1 Guidance topic Parent topic Child topic

  14. Emnet som knutepunkt, #2 Master topic Guidance topic Parent topic Child topic Derived topic

  15. Emnet som knutepunkt, #3 Master topic Guidance topic Parent topic Child topic Derived topic Responsible person Concept Workflow state

  16. Forfatterne må kunne ontologien! • Dersom mennesker skal produsere emnekartet • må de vite hvordan den fungerer • hva som er tanken bak • Ellers blir det umulig for dem å bruke den riktig • Et inkonsistent emnekart er... • Løsninger • opplæring • selv-dokumentasjon

  17. #3: Kjenn dine data! • I alle informasjonsprosjekter er det dataene som bestemmer • All funksjonalitet lages på dataenes premisser • Dette kan bety ett av to ting • det avgjørende er temaene du vil beskrive, eller • det avgjørende er hvilke data du allerede har • Dette er det aller viktigste og det du bør fokusere på først • hva skal emnekartet handle om? • hva skal det si om disse tingene? • Nå har du råmateriale til en ontologi allerede...

  18. Informasjon oppstår ikke av seg selv prosjektet og ut informasjon inn

  19. Kjenn dine kilder • Dette er det nest viktigste spørsmålet • hvor kommer informasjonen fra? • Som regel er det fire muligheter • den skrives inn av mennesker (fra andre kilder) • den genereres av maskiner (fra andre kilder) • den skrives av mennesker, og annoteres av maskiner • den genereres av maskiner, og annoteres av mennesker

  20. Garbage in, garbage out • Ved automatisk generering er formen på data uhyre viktig • Å speile formen på inndata i emnekart er veldig lett • Med veldig strukturerte data er det en lek å lage emnekart • Med helt flate data er det fortsatt mulig • maskiner kan skjønne at "Lars Marius" er navnet på en person og at "Ontopia A/S" er et firma • Maskinene kan gjøre en bedre jobb hvis du allerede har et emnekart • hvis emnekartet sier "topic maps er en teknologi" kan maskiner skjønne at dokument X handler om teknologien topic maps

  21. Litt manuell innsats kan oppnå mye • Det er mulig å lage emnekart fra dokumenter helt automatisk • Selv uten å ha en god ontologi på forhånd • Men, hvis du • skaffer deg en god ontologi først, og • har noen til å finpusse det maskinen produserer • kan du ofte få et mye bedre resultat

  22. Identitet • Det sentrale i alle emnekart er identitet • Du kommer mye lenger hvis du kan identifisere emnene • Bruk identifikatorer! • i eksisterende data, se etter hva som identifiserer ting • kommunenummer, postnummer, epostadresser, fagkoder, ... • i nye data, få med identifikatorer der det går an • Med identifikatorer har du et mye bedre grunnlag

  23. #4: Bruk emnekart-programvare! • Det går an å gjøre emnekartprosjekter uten • Noen har f.eks klart seg med Excel, XML og XSLT • Med emnekartprogramvare er det dog mye lettere • Siden utviklingen blir lettere kan du også få til mye mer

  24. Emnekartmotor • Sentralt i all emnekartprogramvare står emnekartmotoren • Forholder seg til emnekartprogramvare som en motor til en bil • bilen fungerer ikke uten • du kan ikke se den uten å åpne panseret • du forholder deg ikke til den med mindre du er mekaniker • Typisk motorfunksjonalitet er • innlesing av emnekartfiler • fletting av emnekart • oppslag av informasjon • tilby API til utviklere • lagring i database • En god motor kan puttes inn i hva som helst

  25. Visualisering og redigering • Visualiseringsverktøy brukes for å lage framvisning av emnekart • som nettsted • i vindusgrensesnitt • grafisk med sirkler og streker • Bygger på motoren, men gir den ekstra funksjonalitet • To typer • generisk: kan vise alle emnekart, men viser dem på samme måte • rammeverk: kan brukes for å utvikle egne visualiseringer • Omnigator er generisk • Redigeringsverktøy legger til muligheten for å endre emnekartet

  26. Automatisk generering • Verktøy for å lage emnekart automatisk fra kildedata • Kildedata kan være alt mulig • strukturert: regneark, databaser, CSV-filer, XML, ... • ustrukturert: websider, Word-dokumenter, epost, ... • Typisk funksjonalitet • kan settes opp for å konvertere fra kildedata til din ontologi • oppsett kan innebære alt fra programmering til bare konfigurasjon • Ustrukturert informasjon håndteres av NLP-programvare • dette er "magisk" programvare som leser og "forstår" tekst • med begrenset presisjon kan man få til en god del

  27. De tre lagene Ontology Mennesker Mennesker/ maskiner Instances Mennesker/ maskiner Resources

  28. #5: Se framover! • Når emnekartprosjektet er i drift vil du oppdage anvendelser du ikke hadde forestilt deg i forkant • Informasjonen som ligger i emnekartet har en verdi i seg selv • Jo mer presis ontologien er, jo mer kan du bruke den til • Å tenke litt rundt dette vil ofte betale seg

  29. Eksempel #1: Biprodukt • Kunde A er et amerikansk forlag som foredler og republiserer offentlig informasjon • Et stort område er lovinformasjon, og domsavsigelser • Domsavsigelser kommer inn i bolker • en ansatt fører opp dommene i et Excel-regneark • dette regnearket gir en del bakgrunn og setter opp arbeidsflyten • etter at dommen er ferdigbehandlet kastes regnearket • bakgrunnsinformasjonen kastes samtidig! • Løsning: prosessér regnearket til et emnekart...

  30. Eksempel #2: Starbase • Produserer verktøy for å støtte store grupper utviklere • Bruker emnekart for å sy sammen egne programvareprodukter • verktøy for oppfølging av kravspesifikasjon • database over feil og ønskede forbedringer i programvare • versjonskontrollsystem for kildekode • Disse produktene er utviklet av ulike oppkjøpte firmaer • De snakker derfor ikke sammen • Starbase bruker emnekart for å sy sammen informasjonen • Fra dette lager de en portal til all informasjonen i hele systemet

  31. Real SmartTags!

  32. Real SmartTags!

  33. Eksempel #3: Department of Energy, USA • Energidepartementet driver med både kjernekraft og kjernevåpen • Derfor produserer de håndbøker til klassifisering av informasjon om disse temaene • Hovedhåndbøkene produseres sentralt i Washington • nye håndbøker spesialiserer disse for forskjellige avdelinger • laboratorier rundt om i landet spesialiserer dem igjen • Dette systemet har hittil vært svært primitivt • DOE jobber med et innholdssystem for å håndtere denne informasjonen der alt lagres som et emnekart

  34. Emnet som knutepunkt Master topic Guidance topic Parent topic Child topic Derived topic Responsible person Concept Workflow state

  35. Automatisk sensur • "Guidance topics" kobles mot ulike konsepter som omtales i dem • Konseptene kobles videre mot slutningsregler • Dette brukes av en slutningsmotor som kalles Ferret til å • lese epost og automatisk sensurere den i henhold til retningslinjene • prosessere dokumenter ved publisering for å fjerne klassifisert informasjon • Med andre ord, emnekart kan ikke bare formidle informasjon, de kan også stoppe den...

More Related