130 likes | 303 Vues
Aglomeracyjne metody grupowania. Mamy n obiektów i p cech opisujących te obiekty (czyli n punktów w przestrzeni p -wymiarowej). Cel: utworzenie grup (klastrów) grupujących obiekty podobne. n = 46, p = 3. Przykład:. Etapy grupowania:.
E N D
Aglomeracyjne metody grupowania Mamy n obiektów i p cech opisujących te obiekty (czyli n punktów w przestrzeni p-wymiarowej) Cel: utworzenie grup (klastrów) grupujących obiekty podobne n = 46, p = 3 Przykład:
Etapy grupowania: Przed rozpoczęciem grupowania standaryzujemy cechy!!! 1. Obliczenie miary odległości (niepodobieństwa) dla każdej pary obiektów (jednoelementowe klastry, liczba par = n(n-1)/2), 2. Połączenie dwóch obiektów charakteryzujących się najmniejszą odległością w klaster, 3. Obliczenie odległości między nowym zestawem klastrów (klastry jednoelementowe + jeden dwuelementowy - po pierwszym kroku) Czynności opisane w punktach 2 i 3 powtarzamy aż do momentu kiedy wszystkie obiekty zostaną połączone w jeden klaster, lub kiedy uznamy, że łączymy obiekty zbyt od siebie różne. Uwaga: licząc stopień niepodobieństwa między klastrami, które zawierają więcej niż jeden obiekt, należy zastosować określoną metodę amalgamacji.
Trzy najczęściej używane miary odległości Odległość euklidesowa Kwadrat odl. euklidesowej Odległość „city-block”, „manhattan”
Metody amalgamacji Metoda najbliższego sąsiada (pojedynczego wiązania) Metoda najdalszego sąsiada (pełnego wiązania) Metoda średnich połączeń
Struktura podobieństwa - dendrogram Odcięcie dendrogramu
2 (1,2) 3 4 5 1
4 2 (1,2) 3 (4,5) 5 1
4 2 5 1 3
Zadanie Emisja zanieczyszczeń ze źródeł punktowych w województwie łódzkim w roku 2003
Etapy analizy 1. Standaryzacja cech w grupie 6 obiektów, 2. Policzenie macierzy odległości euklidesowych między obiektami, 3. Łączenie obiektów (lub klastrów) o minimalnej odległości, 4. Punkty 2 i 3 powtarzamy dopóki nie powstanie jeden klaster 5. Łącząc klastry wieloelementowe korzystamy z metody średnich połączeń 6. Konstrukcja dendrogramu 7. Odcięcie dendrogramu, tak aby otrzymać 3 klastry 8. Obliczenie średnich wartości cech dla każdego klastra 9. Charakterystyka wyróżnionych klastrów