著者
渡部 秀文 南雲 拓 一宮 和正 斎藤 隆文 宮村(中村) 浩子
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.48, no.15, pp.176-188, 2007-10-15
参考文献数
7
被引用文献数
3

本論文では,階層的クラスタリング結果の安定性を解析するための新しい数理モデルを提案する.また安定性とクラスタ要素の広がり度合いを可視化してクラスタの最適な分割数を求める手法について提案する.階層的クラスタリングは,未知のデータ集合から意味のある分類を得る目的でしばしば用いられる.しかし,結果の安定性に関する研究は十分なされているとはいえず,安定性を手軽に求める手法も開拓されていない.本論文では,従来手法のような統計的処理を用いずに,仮想要素の追加によって幾何学的に安定性を測る手法を提案する.この手法では,要素を1個追加して階層的クラスタリングを行い,得られた結果の階層構造変化に着目する.追加要素の位置によって,本質的な階層構造変化が起こる場合と起こらない場合とがある.そのうち,構造変化が起こらない要素の割合を算出することで階層安定度を得る.一方,クラスタ分割を決定するための指標として,クラスタ要素の広がり度合いについて述べる.さらに,階層安定度と要素の広がり度合いを樹形図上に可視化する手法についても提案する.また,提案手法と従来手法にサンプルデータを適用し,提案手法の有効性および問題点について比較検証する.We propose a new mathematical model for analyzing the stability of hierarchical clustering results. In this paper, a method for deciding the most suitable number of clusters with visualization of stability and density of cluster elements is also proposed. Hierarchical clustering is often used in order to obtain meaningful classification from an unknown dataset. However, the stability of the clustering results is not studied enough, and the techniques for simply calculating the stability measure have never been developed. In this paper, the stability is measured geometrically by adding a temporary element, without using a statistical analysis. In this method, we focus on the change of hierarchical structures when an element is added. If there is more stable region of the added element without structure change, the structure is more stable. In this context, the hierarchical stability is obtained by calculating the ratio of the stable area. On the other hand, the density of clusters elements as an indicator for deciding the dividing of the cluster is presented. Moreover, the method to visualize stability and density of the elements of the clusters is proposed. We demonstrate the effectiveness and problems of the proposed method by applying it to the sample data.