- 著者
-
市村 直幸
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
- 巻号頁・発行日
- vol.78, no.8, pp.1184-1195, 1995-08-25
- 被引用文献数
-
5
パターン認識などにおいて収集されるパターン集合には,主たるクラスタがいくつあるかわからず,更に,はずれ値(outlier)を含むようなものがある.本論文の目的は,そのようなパターン集合から,適切なクラスタ数を推定することである.パターンの分布を記述するモデルを設定すると,それに含まれるパラメータの最ゆう推定と, Akaike Information Criterion (AIC)やMinimum Description Length (MDL)を用いたパラメータ数の最適化からクラスタ数を推定できる. しかし,パターン集合にはずれ値が含まれる場合には,それらがパラメータ推定に影響を与え, よって,クラスタ数の推定にも影響を及ぼす.本論文では,はずれ値の影響を軽減するために,多変数混合正規分布モデルを用いた,最ゆう法に基づく二つのロバストクラスタリング(MARC1およびMARC2)を提案する.そして,そのクラスタリングの結果得られるパラメータを用いて, AICおよびMDLによるクラスタ数の推定を試みた.実験を通じ,各クラスタの45%のパターンがはずれ値に置き換えられても,それらがパラメータ推定に与える影響を小さくでき,適切なクラスタ数の推定が行えることを確認した. また,提案手法の適用限界についても考察した.更に,画像の領域分割への適用結果を示した.