1 / 12

Aglomeracyjne metody grupowania

Aglomeracyjne metody grupowania. Mamy n obiektów i p cech opisujących te obiekty (czyli n punktów w przestrzeni p -wymiarowej). Cel: utworzenie grup (klastrów) grupujących obiekty podobne. n = 46, p = 3. Przykład:. Etapy grupowania:.

todd-hinton
Télécharger la présentation

Aglomeracyjne metody grupowania

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Aglomeracyjne metody grupowania Mamy n obiektów i p cech opisujących te obiekty (czyli n punktów w przestrzeni p-wymiarowej) Cel: utworzenie grup (klastrów) grupujących obiekty podobne n = 46, p = 3 Przykład:

  2. Etapy grupowania: Przed rozpoczęciem grupowania standaryzujemy cechy!!! 1. Obliczenie miary odległości (niepodobieństwa) dla każdej pary obiektów (jednoelementowe klastry, liczba par = n(n-1)/2), 2. Połączenie dwóch obiektów charakteryzujących się najmniejszą odległością w klaster, 3. Obliczenie odległości między nowym zestawem klastrów (klastry jednoelementowe + jeden dwuelementowy - po pierwszym kroku) Czynności opisane w punktach 2 i 3 powtarzamy aż do momentu kiedy wszystkie obiekty zostaną połączone w jeden klaster, lub kiedy uznamy, że łączymy obiekty zbyt od siebie różne. Uwaga: licząc stopień niepodobieństwa między klastrami, które zawierają więcej niż jeden obiekt, należy zastosować określoną metodę amalgamacji.

  3. Miary odległości - niepodobieństwa

  4. Trzy najczęściej używane miary odległości Odległość euklidesowa Kwadrat odl. euklidesowej Odległość „city-block”, „manhattan”

  5. Metody amalgamacji Metoda najbliższego sąsiada (pojedynczego wiązania) Metoda najdalszego sąsiada (pełnego wiązania) Metoda średnich połączeń

  6. Struktura podobieństwa - dendrogram Odcięcie dendrogramu

  7. 1 2 3 4 5

  8. 2 (1,2) 3 4 5 1

  9. 4 2 (1,2) 3 (4,5) 5 1

  10. 4 2 5 1 3

  11. Zadanie Emisja zanieczyszczeń ze źródeł punktowych w województwie łódzkim w roku 2003

  12. Etapy analizy 1. Standaryzacja cech w grupie 6 obiektów, 2. Policzenie macierzy odległości euklidesowych między obiektami, 3. Łączenie obiektów (lub klastrów) o minimalnej odległości, 4. Punkty 2 i 3 powtarzamy dopóki nie powstanie jeden klaster 5. Łącząc klastry wieloelementowe korzystamy z metody średnich połączeń 6. Konstrukcja dendrogramu 7. Odcięcie dendrogramu, tak aby otrzymać 3 klastry 8. Obliczenie średnich wartości cech dla każdego klastra 9. Charakterystyka wyróżnionych klastrów

More Related