Enhancing Join Processing Efficiency for Uncertain Data in Databases

Efficient Join Processing over Uncertain Data - By Reynold Cheng, et all. Presented By Lydia & Usha

Main Idea The main key point addressed in this paper is extending traditional join techniques to DBs with uncertain attributes. Improving the efficiency of join based algorithms to address some of the complexities faced by DB management in handling joins over uncertain data. Efficient pruning techniques involving both uncertainty interval and uncertainty pdf.

Importance of the problem • Often spatial DB applications have to deal with uncertain data. For example • GPS data which calculates nearest neighbour • Sensor data from realtime applications • Scientific data corresponding to weather.

Key concepts Addresses the semantic complexities of uncertain data Using probabilistic threshold joins. Define uncertainty comparison operators & probabilistic join queries. Proposes novel techniques like page and index level joins which incorporates efficient pruning techniques and evaluating the performance of those algorithmsover uncertain data.

Probabilistic uncertainty model Uncertainty interval & uncertainty pdf.

Item Level Join

Page level pruning

Index level Join Used to improve IO throughput When combined with node level pruning technique, this improves performance as well as IO throughput. In this pages are organized in an ordered tree structure, allowing one to use MBR which tightly encloses the interval within the subtree.

Experimental Result.

Enhancing Join Processing Efficiency for Uncertain Data in Databases

Enhancing Join Processing Efficiency for Uncertain Data in Databases

Presentation Transcript

Reynold Bailey

Uncertain Data Management

Processing Data by Blocks

Efficient Join Processing over Uncertain Data - By Reynold Cheng, et all.

Efficient Processing of Top- k Queries in Uncertain Databases

Model-Based Query Processing Over Uncertain Data (in ICDE 2011)

OLAP over Uncertain and Imprecise Data

OLAP Over Uncertain and Imprecise Data

Clustering Uncertain Data

Efficient Temporal Join Processing using Indices

Parallel Star Join + DataIndexes : Efficient Query Processing in Data Warehousing and OLAP

EFFICIENT RANK BASED K-NN QUERY PROCESSING OVER UNCERTAIN DATA

By: Justin Cheng

Bandwidth-Efficient Continuous Query Processing over DHTs

Managing Uncertain Data

Probabilistic Threshold Range Aggregate Query Processing over Uncertain Data

Towards efficient processing of RDF data streams

Efficient Evaluation of XQuery over Streaming Data

India export data is collected by all over countries

Analysis of Uncertain Data: Tools for Representation and Processing

Efficient Probabilistic Reverse Nearest Neighbor Query Processing on Uncertain Data

Uncertain Data