1 / 17

Wissenstechnologien am Beispiel “Goethe-Tour”

Wissenstechnologien am Beispiel “Goethe-Tour”. Dr.-Ing. Katja Hose <hose@mpi-inf.mpg.de> Steffen Metzger <smetzger@mpi-inf.mpg.de> PD Dr.-Ing. Ralf Schenkel <schenkel@mpi-inf.mpg.de>. Max-Planck-Institut für Informatik. Tourismus-Projekt „Goethe-Tour“.

aglaia
Télécharger la présentation

Wissenstechnologien am Beispiel “Goethe-Tour”

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Wissenstechnologien am Beispiel “Goethe-Tour” Dr.-Ing. Katja Hose <hose@mpi-inf.mpg.de> Steffen Metzger <smetzger@mpi-inf.mpg.de> PD Dr.-Ing. Ralf Schenkel <schenkel@mpi-inf.mpg.de> Max-Planck-Institut für Informatik

  2. Tourismus-Projekt „Goethe-Tour“ • Use-Case unter Einbeziehung von Umwelt-Community und Text-Grid • Ziel: Wirkungsstätten Goethes in Sachsen zu einer Reiseroute zusammenstellen • Erste Teilaufgabe: alle relevanten Orte finden • Später weitere Informationen über Orte sammeln

  3. Aufwendige Suche • Problematische Aspekte: • Verschiedene Quellen mit verschiedenen Such-Interfaces • Diverse Schreibweisen z.B. „Goethe“, „Johann Wolfgang von Goethe“ • Eingrenzung der Suche schwierig • zusätzliches Schlüsselwort „Aufenthalt“, „Reise“ ,… ? • Relevante Ergebnisse könnten ausgeschlossen werden • Dokumente müssen alle gelesen werden zur Extraktion des interessanten Wissens: • Orte, an denen Goethe war • Weitere Informationen zu den Orten, z.B. • Befindet sich der Ort in Sachsen? • Gibt es dort interessante Sehenswürdigkeiten?

  4. Föderierte Suche: WisNetGrid als Vermittler Automatische Anfrageerweiterung: „Goethe“→ „Johann Wolfgang von Goethe“ ? • Keywordsuche (z.B. „Goethe Dresden“) • Metadatensuche (z.B. nach „Autor=Goethe“) ? ? ? ? Community Grids ? Öffentliche Daten WWW

  5. Anbindung neuer Quellen • Einheitliche Schnittstelle für Datenzugriff • Siehe Vortrag zur Datenanbindung • Kenntnis über lokale Metadatenschemata zur Umwandlung bei Metadatensuche • z.B. Autor → owner; Erstellungsdatum → date • 2 Möglichkeiten: • Sicherstellung der Kompatibilität lokaler Suchkomponenten (in Kooperation mit Community) • Installation von WisNetGrid bereit gestellter Komponenten • → Einfache Anbindung

  6. Manuelle Textanalyse • Durch die Suche erhaltene Daten müssen manuell verarbeitet werden • → Zeit- und damit kostenintensiv • Weite Teile des Textes für eigentliche Suche uninteressant • Lässt sich manuelle Textanalyse beschleunigen? • → Querlesen! • Ist das Auffinden wichtiger Passagen automatisch unterstützbar? • → Hervorherbung wichtiger Entitäten

  7. Beispiel Entitätserkennung Im April 1770 setzte Goethe sein Studium in Straßburg fort. Diesmal widmete er sich zielstrebiger den juristischen Studien, fand aber auch Zeit, eine ganze Reihe persönlicher Bekanntschaften anzuknüpfen. Die wichtigste davon war die mit dem Theologen, Kunst- und Literaturtheoretiker Johann Gottfried Herder. Der Ältere öffnete ihm die Augen für die ursprüngliche Sprachgewalt von Autoren wie Homer, Shakespeare und Ossion sowie der Volkspoesie und gab so entscheidende Impulse für Goethes dichterische Entwicklung. Später sollte er auf Goethes Fürsprache hin in weimarische Dienste berufen werden. Auf einem Ausritt in die Umgebung lernte Goethe in Sesenheim die Pfarrerstochter Friederike Brion kennen und lieben. Bei seiner Abreise aus Straßburg beendete der bindungsscheue junge Goethe die Beziehung; die an Friederike gerichteten Gedichte, waren in ihrer Ausdruckskraft „der revolutionäre Beginn einer neuen lyrischen Epoche“. = Orte = Daten = Goethe = Personen

  8. Redundanz und Heterogenität Goethe verließ Dresden… Bei einem Besuch in Dresden… Anschließend reiste Goethe nach Dresden …am 25. war Goethe wieder in Dresden… Goethe besuchte Dresden mehrmals…

  9. Faktensuche Bei einem Besuch in Dresden… Goethe verließ Dresden… …am 25. war Goethe wieder in Dresden… Goethe besuchte Dresden mehrmals… Anschließend reiste Goethe nach Dresden „Goethe war_in Dresden“ Abstrakter Fakt: Suche nach abstrakten Fakten

  10. Suche auf Fakten Anfrage: „Goethe war_in X“ Quelldokumente Ergebnisliste: 50 Dokumente „Goethe war_in Frankfurt“ 46 Dokumente „Goethe war_in Dresden“ „Goethe war_in Dresden“ 42 Dokumente „Goethe war_in Straßburg“ … 22 Dokumente „Goethe war_in Sesenheim“ …

  11. Wissensextraktion Fakt extrahieren Textmustererkennung „Goethe war_in Frankfurt“ Im April 1770 verließ Goethe Frankfurt, um dem Wunsch seines Vaters entsprechend sein Studium zu beenden. Hinzulernen Wissensverwaltung (Ontologie) Bekannte Muster verließ X Y Musterbedeutung erkennen „X war_in Y“

  12. Wissensextraktion Bekannter Fakt 1771 kehrte Goethe nach Frankfurt zurück, um dort eine kleine Anwaltskanzlei zu eröffnen. „Goethe war_in Frankfurt“ Musterbedeutung ableiten Wissensverwaltung (Ontologie) kehrte X nach Y zurück Hinzulernen „X war_in Y“

  13. Ontologien • Ontologien sind eine Repräsentationsform von Wissen • Unterteilung in Konzepte, Instanzen von Konzepten und Beziehungen zwischen diesen • Modellierung als Tripel der Form • (Goethe,war_in,Dresden) Person Stadt ist_Instanz_von ist_Instanz_von war_in Goethe Dresden

  14. Ontologien Welche Ontologie? Woher Basiswissen nehmen? Ontologie Stellt Mappings zur gemeinsamen Nutzung zur Verfügung Ontologievermittlung Historische Reiserouten- ontologie von Community 2 Landschafts- ontologie von Community 1 Basis-Ontologie (Musterverwaltung ...) Ontologiesuche Ontologieverwaltung Erlaubt Verwaltung und Anpassung von Ontologien

  15. Schlussfolgerungen Anfrage: „Goethe war_in Sachsen“? Antwort: nein Antwort: ja Ontologieschlussfolgerung „Goethe war_in Sachsen“ „Goethe war_in Dresden“ „Dresden gehört_zu Sachsen“ Ontologie

  16. Community-spezifische Lösungen • Sehr heterogene Daten in Communitys • → Extraktionskomponenten modular und generisch → Anpassbarkeit über Parameter→ Austausch einzelner Komponenten möglich → u.U. Vorverarbeitung von Daten sinnvoll • Wiederverwendung von Anpassungen • Ontologiesuche, um existente Ontologien mit Themenwissen einzubinden • Dienstesuche siehe Vortrag zu Diensten • Existierende Dienste suchen/verwalten/koppeln • z.B. zur Vorverarbeitung der Daten

  17. WisNetGrid-Dienste zur Wissenssuche • Föderierte Suche über angebundenen Quellen • Automatische semantische Anpassung bzw. Erweiterung von Suchanfragen • Entitätenerkennung (Named-Entity-Recognition) • Ontologieverwaltung und -suche sowie automatische Ontologieerweiterung • Wissensextraktion, um in Daten enthaltenes Wissen abstrakt zusammengefasst in Ontologien abzulegen • Suche auf den extrahierten Fakten

More Related