著者
市村 直幸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.8, pp.1184-1195, 1995-08-25
被引用文献数
5

パターン認識などにおいて収集されるパターン集合には,主たるクラスタがいくつあるかわからず,更に,はずれ値(outlier)を含むようなものがある.本論文の目的は,そのようなパターン集合から,適切なクラスタ数を推定することである.パターンの分布を記述するモデルを設定すると,それに含まれるパラメータの最ゆう推定と, Akaike Information Criterion (AIC)やMinimum Description Length (MDL)を用いたパラメータ数の最適化からクラスタ数を推定できる. しかし,パターン集合にはずれ値が含まれる場合には,それらがパラメータ推定に影響を与え, よって,クラスタ数の推定にも影響を及ぼす.本論文では,はずれ値の影響を軽減するために,多変数混合正規分布モデルを用いた,最ゆう法に基づく二つのロバストクラスタリング(MARC1およびMARC2)を提案する.そして,そのクラスタリングの結果得られるパラメータを用いて, AICおよびMDLによるクラスタ数の推定を試みた.実験を通じ,各クラスタの45%のパターンがはずれ値に置き換えられても,それらがパラメータ推定に与える影響を小さくでき,適切なクラスタ数の推定が行えることを確認した. また,提案手法の適用限界についても考察した.更に,画像の領域分割への適用結果を示した.

言及状況

はてなブックマーク (1 users, 1 posts)

[研究][*あとで読む]

収集済み URL リスト