210 likes | 414 Vues
Algorithm to Find Frequent Itemsets. Association Rules. Goal: Provide an overview of basic Association Rule mining techniques Association Rules Problem Overview Large itemsets Association Rules Algorithms Apriori FP-Growth Index- BitTableFI. Association Rule Techniques.
E N D
Association Rules Goal: Provide an overview of basic Association Rule mining techniques • Association Rules Problem Overview • Large itemsets • Association Rules Algorithms • Apriori • FP-Growth • Index-BitTableFI
Association Rule Techniques Step1: Find Large Frequent Itemsets. Step 2: Generate rules from frequent itemsets.
Apriori Scan DB
Scan DB
Scan DB
FP-growth • การหา Frequent Itemsetsด้วยอัลกอริทึม FP-growth ประกอบไปด้วย 2 ขั้นตอน คือ • สร้าง FP-tree จากฐานข้อมูลที่กำหนดโดยจะมีการอ่านฐานข้อมูล 2 ครั้ง • อ่านฐานข้อมูลครั้งที่ 1 เพื่อนับค่าความถี่ของแต่ละ items และทำการตัด items ที่มีค่าความถี่ขั้นต่ำออก หลังจากนั้นนำ items ที่เหลือมาเรียงลำดับตามค่าความถี่ของแต่ละ items จากมากไปน้อยในตารางที่เรียกว่า Hash Table • อ่านฐานข้อมูลครั้งที่ 2 เพื่อสร้าง FP-tree • หา Frequent Itemsetsจาก FP-tree
อ่านฐานข้อมูลครั้งที่ 1 เพื่อนับค่าความถี่ของแต่ละ items และทำการตัด items ที่มีค่าความถี่ขั้นต่ำออก หลังจากนั้นนำ items ที่เหลือมาเรียงลำดับตามค่าความถี่ของแต่ละ items จากมากไปน้อยในตารางที่เรียกว่า Hash Table ตัด 4 ออกแล้ว
Index-BitTableFI • อ่านฐานข้อมูลเพียง 1 ครั้ง • ลงรหัสโดยแปลงข้อมูลให้อยู่ในรูปแบบบิตแมปเวกเตอร์ เรียกว่าตาราง BitTable • นับค่าความถี่ของแต่ละ items และทำการตัด items ที่มีค่าความถี่ขั้นต่ำออก จะได้ Frequent 1-itemsets • หา Index array ของแต่ละ Frequent item โดยการดำเนินการ AND ระหว่างบิตแมปเวกเตอร์ของทรานแซคชั่นที่ Item นั้นปรากฎ • นำ Index array ไปหา Frequent k-itemsets
(1,3) (2,3) (2,5) (2,3,5) (3,5)