1 / 10

Разработка системы анализа алгоритмов кластеризации

Разработка системы анализа алгоритмов кластеризации. Любимов Дмитрий Александрович, 541 группа Научный руководитель: Шалымов Дмитрий Сергеевич Рецензент: Граничин Олег Николаевич 26 мая 2009 г. Введение.

pakuna
Télécharger la présentation

Разработка системы анализа алгоритмов кластеризации

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Разработка системы анализа алгоритмов кластеризации Любимов Дмитрий Александрович, 541 группа Научный руководитель: Шалымов Дмитрий Сергеевич Рецензент: Граничин Олег Николаевич 26 мая 2009 г.

  2. Введение • Кластеризация - задача разбиения заданного множества объектов (данных) на различные подмножества, называемые кластерами, таким образом, чтобы кластеры были непересекающимися и состояли из схожих по свойствам объектов, при этом объекты разных классов отличались. • Применяется в очень широком спектре научных областей: статистика, финансовая математика, оптимизация, в частности для "интеллектуального" анализа данных , распознавания образов, сжатия данных и др. • Возникает необходимость в программных средствах, предоставляющих гибкие возможности для анализа, как данных, так и работы алгоритмов, а так же для удобного представления результатов.

  3. Существующие средства • Частные некоммерческие разработки, как правило, реализованные в рамках пакетов прикладных вычислительных программ (Matlab, Mapleи т. д.) , и, как следствие, сильно зависящие от них. • Дорогостоящие приложения , предназначенные для статистического анализа, ориентированные на корпоративных клиентов.

  4. Постановка задачи Требуется реализовать систему: • находящуюся в свободномдоступе, • позволяющую анализировать результаты работы алгоритмов кластеризации на различных данных, в том числе через графическое представление • поддерживающую загрузку пользовательских алгоритмов и данных.  

  5. Алгоритмы • итеративные методы разделения исходных данных • устойчивы к шумам, выбору метрики • работают для заранее заданного количества кластеров • Например, один из самых распространенных алгоритмов k-means: • на каждой итерации перевычисляетсяцентр масс, для каждого кластера, затем векторы разбиваются на новые классы

  6. Индексные методы оценки • Алгоритм выполняется для k ∈{2,3,...,kmax} . Для каждого разбиения вычисляются индексы, оценивающие его качество, значения которых могут быть сравнены в дальнейшем.

  7. Индексы Krzanowski and Lai index: Сaliński-Harabaszindex: Dunn index:

  8. CAMA (Clustering Algorithms Meta Applier) • Система для анализа алгоритмов кластеризации индексными методами

  9. CAMA (Clustering Algorithms Meta Applier)

  10. Заключение • В ходе написания дипломной работы были рассмотрены итеративные алгоритмы кластеризации, а так же индексные методы их оценки . Была разработанасистема, реализующая данные методы. • Существенным отличием от подобных  систем является то, что система  находится в свободном доступе и не требует от пользователя установки дополнительного программного обеспечения, делает доступным анализ собственных алгоритмов.  

More Related