1 / 22

Chapter 10 ALGORITME for ASSOCIATION RULES

Chapter 10 ALGORITME for ASSOCIATION RULES. Market Basket Analysis. Apriori. Case. Sulidar Fitri , M.Sc. REFERENCES. Budi Santosa . Data Mining: Teknik Pemanfaatan Data Untuk Keperluan Bisnis . 2007. Graha Ilmu Yogyakarta

Télécharger la présentation

Chapter 10 ALGORITME for ASSOCIATION RULES

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Chapter 10ALGORITME for ASSOCIATION RULES Market Basket Analysis Apriori Case SulidarFitri, M.Sc

  2. REFERENCES Budi Santosa. Data Mining: TeknikPemanfaatan Data UntukKeperluanBisnis. 2007. GrahaIlmu Yogyakarta Jiawei Han and Micheline Kamber. Data Mining: Concepts and Techniques. 2006. Department of Computer Science University of Illinois at Urbana-Champaign. www.cs.uiuc.edu/~hanj Ian H. Witten,Eibe Frank,Mark A. Hall. Data Mining Practical Machine Learning Tools and Techniques Third Edition.2011. Elsevier WEKA

  3. INTNRODUCTION • DATA MINING • Proses untuk menemukan dataset baru pada dataset yang sangat besar. • TOPIK • ASSOCIATION RULES (ATURAN ASOSIASI) • FREQUENT ITEMSETS

  4. ATURAN ASOSIASI Menggunakan algoritme klasik : IF - THEN

  5. ATURAN ASOSIASI • Analisis Afinitas = “apa bersama apa” • Bisa digunakan untuk menentukan kebiasaan “ suatu produk apa akan dibeli bersama apa” • Market Basket Analysis • Contoh: • Studi transaksi di supermarket • Jika membeli Susu Bayi makan akan membeli Sabun Mandi

  6. ATURAN ASOSIASI DALAM TRANSAKSI • Menemukan asosiasi produk dalam database transaksi suatu supermarket. (database Market Basket) • Contoh Kasus: • Para manajer ingin mengetahui kelompok items apa yang sering dibeli untuk membuat layout katalog belanja. • Solusi: • Gunakan aturan asosiasi dalam hubungan “if-then” atau “jika-maka”. • Aturan tersebut dihitung dari data yang sifatnya probabilistic berdasarkan data market basket

  7. KASUS Suatu toko yang menjual pakaian olah raga, sedang melakukan promosi padapenjualan topi. Jika seorang pelanggan membeli lebih dari satu macam topi dari 6 pilihan yang ada akan mendapat diskon. Manajer toko tersebut ingin melihat warna apa yang dibeli bersama oleh pelanggan, mengumpulkan data dan menyimpan dalam database.

  8. Data items Topi tersebut berupa: Catatantransaksipembelian

  9. Ide dari Aturan Asosiasi: • Periksasemuakemungkinan“IF - THEN” • Pilih yang paling mungkin (most likely) sebagai indicator darihubunganketergantunganantar item. • Antecedent =“Jika” danconsequent = “maka” • Kemungkinanaturan: • “JikaMerah, makaPutih ” • {Merah, Putih} = {Biru}

  10. Secara praktis,Hanya kombinasi yang terjadi dengan frekuensi yang sangat tinggi yang akan diperhatikanitu yang disebut:FREQUENT ITEM SET

  11. FREQUENT ITEM SET • Berhubungan dengan SUPPORT • SUPPORT: jumlah transaksi yang mengandung item • Support digunakan untuk mengukur seberapa tingkat dukungan data terhadap validitas aturan yang dikembangkan. • Dinyatakan dalam prosentase (%) • Contoh: • {Merah, Putih} adalah 4/10 atau 40%

  12. Mengukur Aturan yang Kuat

  13. Contoh Confidence • Suatu supermarket memiliki 100.000 titik transaksi. Dari jml tersebut ada 1000 transaksi yang mengandung jeruk dan obat flu. Dari 1000 transaksi ada 800 yang mengandung mie instant. • Aturan asosiasi jika jeruk dan obat flu dibeli maka mie instant juga dibeli pada belanja yang bersamaan => • Support= 800/100.000 • Confidence = 800/1000

  14. SUPPORT: Peluang transaksi yang dipilih secara random dari database akan mengandung semua item dalam antecendent maupun consequent atau P (antecedent dan consequent).

  15. P (consequent | antecedent)

  16. Lift Ratio

  17. Susunlah aturan asosiasi dari set item {merah, putih, hijau} !!

  18. JikakitaTerapkansyarat minimum confidence 75%, makahanyaaturan 2,3, dan 6 yang akanmemenuhi

  19. Ada beberapa algoritme yang sudah dikembangkan mengenai aturan asosiasi, namun ada satu algoritme klasik yang sering dipakai yaitu algoritma apriori (Shmueli et al., 2007)

  20. Apriori: A Candidate Generation-and-Test Approach • Apriori pruning principle: If there is any itemset which is infrequent, its superset should not be generated/tested! (Agrawal & Srikant @VLDB’94, Mannila, et al. @ KDD’ 94) • Method: • Initially, scan DB once to get frequent 1-itemset • Generate length (k+1) candidate itemsets from length k frequent itemsets • Test the candidates against DB • Terminate when no frequent or candidate set can be generated Data Mining: Concepts and Techniques

  21. The Apriori Algorithm—An Example Supmin = 2 Database TDB L1 C1 1st scan C2 C2 L2 2nd scan L3 C3 3rd scan Data Mining: Concepts and Techniques

  22. Any Queries ?

More Related