- 著者
-
新村 秀一
- 出版者
- 日本計算機統計学会
- 雑誌
- 計算機統計学 (ISSN:09148930)
- 巻号頁・発行日
- vol.19, no.1, pp.31-45, 2007-07-31
- 被引用文献数
-
2
Miyake & Shinmura (1978)は,最少誤分類数(Minimum Misclassification Number,略してMMNを判別基準とする最適線形判別関数(Optimal Linear Discriminant Function,略してOLDF)を提案した.この基準は,多くの統計家にとって過剰推定(オーバーエスティメイト)あるいはパターン認識でいうOver Learningが考えられ受け入れがたいものであった.しかし,判別する2群がFisherの線形判別関数(LDF)の理論的前提を満たせば, LDFの誤分類数(Misclassification Number,略してMN)はMMNと等しくなる.そこで,教師データでこの差が大きいほど,この理論的前提より乖離する指標になることが期待される.そこで,ヒューリスティック手法(ヒューリスティックOLDF)を開発し研究したが,計算時間や評価法などで壁に突き当たった(三宅・新村(1979)).新村(1998)は,この問題が数理計画法(MP)の研究者が,計算時間がかかるということで嫌っている整数計画法(IP)で定式化できることに気づき,IP-OLDFと命名し研究を再開した.計算の爆発というブラックホールに分け入り大変であったが,MMNの集合である最適凸多様体でもってこれまで判別分析の理論で説明できないことが幾つか分かった.しかし,「学生の生活実態調査データ」でIP-OLDFの致命的な欠陥が見つかった.今回改訂IP-OLDFというモデルを考えたことで,この問題のほか,計算時間の短縮,最適凸多様体のどの内点を最終的に判別関数の計数に用いればよいか,そしてそれを用いて評価データによる汎化能力の検証が可能となった.これによって,1970年代から延々と行われてきた数理計画法による判別モデル(Stam, 1997)と既存の判別手法の比較を今後客観的に行う目処がついた.