Data Indexing

RohanSah Data Indexing

Focus • Used Lucene (Indexing Lib.) via Eclipse • Store data • Categories • Types • File names • Easy recall ==city.txt== Chicago city Illinois New York city popular hot dogs Index Chicago city Illinois New York city popular Hot dogs

Why? • Mentor: Data mining & context guesses • Over text, guess nouns and descriptions related to them • (Astronaut – space, moon, NASA, etc…) • Indexing allows easier recall • Running searches over extremely large files takes up too much time • Simpler format

Algorithm • 2-pass algorithm ==city.txt== (Multiple list/text files) Chicago city Illinois New York city popular hot dogs Make preliminary index Store category names to Hash Map -Remove dups. Use terms in hash map and query prelim index Create final index

Shortcomings • List format requires large storage • Hash map and preliminary index consume resources • Specific syntax for lists: • Index can be specific [category] \t [description] \t [description]…

Data Indexing

Data Indexing

Presentation Transcript

Data Indexing

Indexing Semistructured Data

Physical Data Organization and Indexing

Indexing Trajectory Data

Indexing Multidimensional Data

Data Indexing for Stateful , Large-scale Data Processing

Multidimensional Indexing: Spatial Data Management &amp; High Dimensional Indexing

Indexing of XML Data

Indexing Biological Sequence Data

Physical Data Organization and Indexing

Indexing data-oriented overlay networks

Indexing Spatio-Temporal Data Warehouses

Indexing Scientific Data With FastBit

Indexing OLAP Data Sunita Sarawagi

Indexing Data Relationships

Archiving and Indexing Services,data backup services,document indexing services

Indexing Spatial Data

Indexing data-oriented overlay networks

Indexing Multidimensional Data

Indexing Time Series Data

Indexing Spatio-Temporal Data Warehouses

Data Indexing

Data Indexing

Presentation Transcript

Data Indexing

Indexing Semistructured Data

Physical Data Organization and Indexing

Indexing Trajectory Data

Indexing Multidimensional Data

Data Indexing for Stateful , Large-scale Data Processing

Multidimensional Indexing: Spatial Data Management &amp;amp; High Dimensional Indexing

Indexing of XML Data

Indexing Biological Sequence Data

Physical Data Organization and Indexing

Indexing data-oriented overlay networks

Indexing Spatio-Temporal Data Warehouses

Indexing Scientific Data With FastBit

Indexing OLAP Data Sunita Sarawagi

Indexing Data Relationships

Archiving and Indexing Services,data backup services,document indexing services

Indexing Spatial Data

Indexing data-oriented overlay networks

Indexing Multidimensional Data

Indexing Time Series Data

Indexing Spatio-Temporal Data Warehouses

Multidimensional Indexing: Spatial Data Management & High Dimensional Indexing