- 著者
-
加藤 聡
堀内 匡
伊藤 良生
- 出版者
- Japan Society for Fuzzy Theory and Intelligent Informatics
- 雑誌
- 知能と情報 : 日本知能情報ファジィ学会誌 : journal of Japan Society for Fuzzy Theory and Intelligent Informatics (ISSN:13477986)
- 巻号頁・発行日
- vol.21, no.4, pp.452-460, 2009-08-15
- 被引用文献数
-
5
自己組織化マップ(SOM)を用いたクラスタリングは,k-means法などと比較して,任意形状のクラスタ抽出を比較的容易に行えることが特長の「距離ベース」の手法である.一方,個々のデータ同士の距離に注目するのではなく,データ集合の分布の状態に注目した「分布ベース」のクラスタ抽出法があり,具体的にはベイズ型情報量基準(BIC)をk-means法のアルゴリズムに適用するx-means法などを挙げることができる.この情報量規準を用いたクラスタ抽出のアプローチは,SOMを用いたクラスタリング手法にも比較的容易に適用可能であると考えられる.そこで本論文では,SOMによって初期のクラスタ候補群を生成し,これらを情報量規準に基づく判定手法によって徐々に併合するクラスタリング手法を提案する.提案手法に対して,人工的に作成したデータセットおよびUCI Machine Learning Repositoryのデータセットを用いた評価実験を行い,SOMのみを用いたクラスタリングと比較して,より本来のクラスタ分割に近いクラスタリング結果が安定的に得られること,情報量規準としてはBICよりも赤池情報量規準(AIC)が提案手法には適していること,クラスタ数の自動推定が可能であることなどの知見を得た.