350 likes | 528 Vues
Clustering. Clustering. Cluster : a collection of objects which are simmilar between them and dissimilar to the objects belonging to other cluster Clustering : the process of organizing objects into groups whose members are similar in some way. Ilustrasi. Classification vs Clustering.
E N D
Clustering • Cluster : a collection of objects which are simmilar between them and dissimilar to the objects belonging to other cluster • Clustering : the process of organizing objects into groups whose members are similar in some way
Classification vs Clustering • Classification
Classification vs Clustering • Clustering
Partitioning Clustering • Disebutjuga Exclusive Clustering • Memungkinkansetiap data untukmasukkedalam cluster tertentupadasuatutahapanproses clustering danpadatahapanberikutnyaberpindahke cluster lain. • Contoh : K-Means
Hierarchical Clustering • Suatu data yang masukkedalamsuatu cluster padasuatutahapanprosestidakbisaberpindahke cluster lain padatahapanprosesberikutnya. • Contoh : Agglomerative Clustering.
Overlapping Clustering • Setiap data dapatmenjadianggotadaribeberapa cluster sekaligusberdasarkannilai/derajatkeanggotaannya. • Contoh : Fuzzy C-Means, Gaussian Mixture
Hierarchical Clustering • Clustering denganpendekatanhirarkimengelompokkan data yang memilikikemiripankarakteristikdalamhirarki yang samadan yang tidakmiripdalamhirarki yang berbeda.
Algoritma Agglomerative Clustering • MulaidenganN cluster, setiap cluster mengandungentititunggaldansebuahmatrikssimetrikdarijarak (similarities) D = {dik} dengantipeNxN. • Carimatriksjarakuntukpasangan cluster yang terdekat (paling mirip). Misalkanjarakantara cluster U dan V yang paling miripadalahduv. • Gabungkancluster U dan V. Label cluster yang barudibentukdengan (UV).
Algoritma Agglomerative Clustering (lanjutan) Updateentries pada matrikjarakdengan cara : • Hapus baris dan kolom yang bersesuaian dengan cluster U dan V • Tambahkanbarisdankolom yang memberikanjarak-jarakantaracluster (UV) dan cluster-cluster yang tersisa. • Ulangi langkah 2 dan 3 sebanyak (N-1) kali. (Semua objek akan berada dalam cluster tunggalsetelahalgoritmaberahir). Catatidentitasdari cluster yang digabungkandantingkat-tingkat (jarakatausimilaritas) dimanapenggabunganterjadi.
dist( (p3, p6), p1 ) = MIN ( dist(p3, p1) , dist(p6, p1) ) = MIN ( 0.22 , 0.23 ) = 0.22
dist( (p3, p6), (p2, p5) ) = MIN ( dist(p3, p2) , dist(p6, p2), dist(p3, p5), dist(p6, p5) ) = MIN ( 0.15 , 0.25, 0.28, 0.39 ) = 0.15