Algorithm to Find Frequent Itemsets

Algorithm to Find Frequent Itemsets

Association Rules Goal: Provide an overview of basic Association Rule mining techniques • Association Rules Problem Overview • Large itemsets • Association Rules Algorithms • Apriori • FP-Growth • Index-BitTableFI

Association Rule Techniques Step1: Find Large Frequent Itemsets. Step 2: Generate rules from frequent itemsets.

Apriori Scan DB

Scan DB

FP-growth • การหา Frequent Itemsetsด้วยอัลกอริทึม FP-growth ประกอบไปด้วย 2 ขั้นตอน คือ • สร้าง FP-tree จากฐานข้อมูลที่กำหนดโดยจะมีการอ่านฐานข้อมูล 2 ครั้ง • อ่านฐานข้อมูลครั้งที่ 1 เพื่อนับค่าความถี่ของแต่ละ items และทำการตัด items ที่มีค่าความถี่ขั้นต่ำออก หลังจากนั้นนำ items ที่เหลือมาเรียงลำดับตามค่าความถี่ของแต่ละ items จากมากไปน้อยในตารางที่เรียกว่า Hash Table • อ่านฐานข้อมูลครั้งที่ 2 เพื่อสร้าง FP-tree • หา Frequent Itemsetsจาก FP-tree

อ่านฐานข้อมูลครั้งที่ 1 เพื่อนับค่าความถี่ของแต่ละ items และทำการตัด items ที่มีค่าความถี่ขั้นต่ำออก หลังจากนั้นนำ items ที่เหลือมาเรียงลำดับตามค่าความถี่ของแต่ละ items จากมากไปน้อยในตารางที่เรียกว่า Hash Table ตัด 4 ออกแล้ว

Index-BitTableFI • อ่านฐานข้อมูลเพียง 1 ครั้ง • ลงรหัสโดยแปลงข้อมูลให้อยู่ในรูปแบบบิตแมปเวกเตอร์ เรียกว่าตาราง BitTable • นับค่าความถี่ของแต่ละ items และทำการตัด items ที่มีค่าความถี่ขั้นต่ำออก จะได้ Frequent 1-itemsets • หา Index array ของแต่ละ Frequent item โดยการดำเนินการ AND ระหว่างบิตแมปเวกเตอร์ของทรานแซคชั่นที่ Item นั้นปรากฎ • นำ Index array ไปหา Frequent k-itemsets

(1,3) (2,3) (2,5) (2,3,5) (3,5)

Algorithm to Find Frequent Itemsets