1 / 23

Fuzzy c-Means 法による クラスター分析に関する研究

Fuzzy c-Means 法による クラスター分析に関する研究. 畜産経営管理学講座 統計研究室 久田純司. クラスター分析とは. クラスター分析とはデータ以外に基準を設定することなくデータの集まりをいくつかのグループに分ける方法. 目的. 1.HCM と FCM のクラスタリング精度の比較 2.FCM の特徴である帰属度の考察. HCM. クラスタリングする対象を最も近いクラスター中心に割り当て中心を更新する方法 ある個体が属するクラスターは 1 つ ある個体  がクラスター  に属する           = 1

sook
Télécharger la présentation

Fuzzy c-Means 法による クラスター分析に関する研究

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Fuzzy c-Means法によるクラスター分析に関する研究 畜産経営管理学講座 統計研究室 久田純司

  2. クラスター分析とは • クラスター分析とはデータ以外に基準を設定することなくデータの集まりをいくつかのグループに分ける方法

  3. 目的 1.HCMとFCMのクラスタリング精度の比較 2.FCMの特徴である帰属度の考察

  4. HCM • クラスタリングする対象を最も近いクラスター中心に割り当て中心を更新する方法 • ある個体が属するクラスターは1つ • ある個体  がクラスター  に属する           =1 ある個体  がクラスター  に属さない          =0

  5. FCM • FCMは個体がクラスターに帰属する度合いにあいまいさを認めあいまいさを帰属度で表す • 変数  に0から1までの値をとることを許しその値を帰属性の度合い,つまり帰属度とする • 各個体について全てのクラスターに対する帰属度を加えたものが1になる

  6. 目的関数の導入 • FCMはこの目的関数を最適化し収束させることでクラスタリングを行う •   は    1を満たす適当なパラメータ •   を大きくすると帰属性の度合いはよりあいまいになる • はクラスター   と個体   との距離

  7. シミュレーション実験 • HCMとFCMのクラスタリング精度の評価 • それぞれ違う特徴をもつ2つのデータ群を2つのクラスターに分類し誤判別の割合で評価を行う • FCMでは帰属度の一番大きいクラスターへ各個体を帰属させた

  8. 2つの2次元正規分布

  9. (1)(    )=( 0.5, 0.5 ) (2)(    )=( -0.5, -0.5 ) (3)(    )=( 0.5, -0.5) HCM各20個,計40個       FCM(m=2,…,6)       乱数を発生 を適用し2個の クラスターに分類

  10. 一方から発生したデータを他方のクラスターへ分類一方から発生したデータを他方のクラスターへ分類 • 誤判別として個数を数える • 1つの  の値について10000回繰り返し誤判別の割合を求める

  11. (1)の場合のデータ分布イメージ

  12. (1)の場合の結果

  13. (2)の場合のデータ分布イメージ

  14. (2)の場合の結果

  15. (3)の場合のデータ分布イメージ

  16. (3)の場合の結果

  17. クラスタリング精度の評価 FCMによる帰属度の大きいクラスターに各個体を帰属させるクラスタリングの精度が良いという傾向を得た

  18. 実際のデータへの適用

  19. 作家のMISIMA氏,NAKAJIMA氏,INOUE氏の 作品において2種類の助詞が使用されている相対頻度を表すデータを3個のクラスターに分類するクラスタリングを行う作家のMISIMA氏,NAKAJIMA氏,INOUE氏の 作品において2種類の助詞が使用されている相対頻度を表すデータを3個のクラスターに分類するクラスタリングを行う • 彼等の作品に助詞の使用頻度による特徴があれば彼等の作品によるクラスターが作成されるはず • HCMとFCM(m=2)を適用

  20. 分析結果

  21. まとめ • FCMの帰属度の大きいクラスターへ各個体を帰属させるクラスタリング技法の精度の良さを示す傾向を得た • 各クラスターでの各個体の帰属順位を決定することに帰属度を用いることでFCMの有用性を示すことができた

  22. 帰属度による帰属順位

More Related