1 / 10

Volltextsuche Sequentielle Suche und interviertes Dateisystem

Volltextsuche Sequentielle Suche und interviertes Dateisystem. Spree SoSe 2011. Wie funktioniert die Suche in einer Datenbank ?. Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004. Spree SoSe 2011.

rivka
Télécharger la présentation

Volltextsuche Sequentielle Suche und interviertes Dateisystem

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. VolltextsucheSequentielle Suche und interviertes Dateisystem Spree SoSe 2011

  2. Wie funktioniert die Suche in einer Datenbank ? Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree SoSe 2011 Graphik: Winfried Gödert: Konzepte, Methoden und Verfahren des Information Retrieval, Folie 6 Suchproblem Treffer Modell der sequenziellen Suche mit Musterabgleich

  3. Sequentielle Suche / Mustererkennung im Dokument 01010110 01010110 01010110 01010110 01010110 01010110 1101001110110001010101100111011010101000010101111.. Treffer Nein Nein Nein Nein Nein • Methode: • Die Zeichenkette wird nacheinander im gesamten Dokument gesucht: • Probleme: • Zeitaufwändig • Nur möglich, wenn der gesamte Datenbestand vollständig vorliegt. Quelle: teilweise übernommen von Gödert

  4. Wie funktioniert die Indexsuche in Datenbanken? Gesuchter Eintrag Nein Eintrag01 Eintrag02 Eintrag03 Eintrag04 Eintrag05 Eintrag06 Eintrag07 Eintrag08 Eintrag09 Eintrag10 Eintrag11 Eintrag12 Eintrag13 Eintrag14 Eintrag15 Eintrag16 Eintrag17 Eintrag18 Eintrag19 Eintrag20 Eintrag21 Eintrag21 Eintrag22 Eintrag23 Eintrag24 Nein Suche sequenziell ? Nein Nein Nein Nein Nein Nein Nein Nein Nein Nein Nein Nein Nein Nein Kann das sein? Nein Nein Nein Nein Nein Nein Nein Fast wörtlich übernommen: Winfried Gödert: Konzepte, Methoden und Verfahren des Information Retrieval, Folie 8 Nein Nein

  5. Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree SoSe 2009  Numerischer und alphabetischer Index Gliederung Dok. 1:<p> Das ist eine Banane</p> Numerischer Index Alphabetischer Index 1 das 2 ist 3 eine 4 Banane Banane 4 Das 1 Eine 3 Ist 2 Dok. 2: <h1>Das ist eine grüne Banane</h1> 1 das 2 ist 3 eine 4 Banane 5 grüne Wenn ein neues Dokument hinzukommt, muss der alphabetische Index nur ergänzt werden. grüne wird als neuer Eintrag ergänzt.

  6. Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree SoSe 2011  Index aufbauen und ergänzen Gliederung grüne Es wird lediglich eine Zeile ergänzt Alle Einträge unterhalb von eine ändern ihre Position, der Index wird bei jedem Neuzugang neu aufgebaut

  7. Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree SoSe 2011  Invertiertes Dateisystem Einführung Alphabetischer Index/ Zugangsliste Invertierte Liste Banane 4 das 1 eine 3 grüne 5 ist 2 Dok.3 <h3>grüne Banane</hr´3>

  8. Und noch ein Trick: schnelle Suche im alphabetischen Index Eintrag01 Eintrag02 Eintrag03 Eintrag04 Eintrag05 Eintrag06 Eintrag07 Eintrag08 Eintrag09 Eintrag10 Eintrag11 Eintrag12 Eintrag13 Eintrag14 Eintrag15 Eintrag16 Eintrag17 Eintrag18 Eintrag19 Eintrag20 Eintrag21 Eintrag21 Eintrag22 Eintrag23 Eintrag24 Bildung von Hälften Test, ob gesuchter Eintrag in der ersten Häfte Nein oder in der zweiten Häfte Ja Fast wörtlich übernommen: Winfried Gödert: Konzepte, Methoden und Verfahren des Information Retrieval, Folie 9

  9. Das Verfahren wird mit der zutreffenden Hälfte fortgesetzt Eintrag19 Eintrag20 Eintrag21 Eintrag21 Eintrag22 Eintrag23 Eintrag24 Eintrag13 Eintrag14 Eintrag15 Eintrag16 Eintrag17 Eintrag18 Eintrag19 Eintrag20 Eintrag21 Eintrag21 Eintrag22 Eintrag23 Eintrag24 Ja Nein Ja Eintrag19 Eintrag20 Eintrag21 Eintrag21 Ja Nein Eintrag19 Eintrag20 Ja Das Verfahren folgt einem binären Entscheidungsbaum und kommt auch bei großen Indizes sehr schnell zu einem Ergebnis Fast wörtlich übernommen: Winfried Gödert: Konzepte, Methoden und Verfahren des Information Retrieval, Folie 10

  10. Seminar I-Prax: Inhaltserschließung visueller Medien, 5.10.2004 Spree SoSe 2011  Ressourcen Einführung CROFT 2011 Croft, Bruce. W; Metzler, Donald; Strohman, Trevor GerhardBegleitmaterialien zum Buch: Search Engines : Information Retrieval in Practice. Abruf: 2011-04-05. Download unter: http://dg3rtljvitrle.cloudfront.net/slides/chap5.pdf GÖDERT 2009 Gödert, Winfried: Konzepte, Methoden und Verfahren des Information Retrieval. Vorlesungsskript SS 2009. Fachhochschule Köln : Institut für Informationswissenschaft. Abruf: 2011-04-05. Download unter: http://www.fbi.fh-koeln.de/institut/personen/goedert/goedert_lehre.php

More Related