- 著者
-
金子 拓也
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
- 巻号頁・発行日
- vol.88, no.4, pp.675-686, 2005-04-01
- 参考文献数
- 12
本論文は, データに含まれる欠損値の対処に際し, 有力な補完方法を提案するものである.この提案する補完方法は, 実際のデータを用いた数値実験から, いくつかの既存法よりも, 判定精度, 平均対数ゆう度の二つの観点から最も優れた対処法であることが確認された.理論的な背景は, この補完法が, 欠損ではないデータの内部的な構造に依存せずに処置を施すためである.これによって, 学習用データに対するオーバフィットを回避し, 結果として実証用データに対しても判定精度の高いモデルを構築することが可能となった.本論文の構成は, まず, 削除法, 平均値補完法, k-NN法, 重み付きk-NN法, の既存4手法と, 提案する新しい手法の概要を紹介する.次に欠損値をもたない実際の医療データに対し, 様々な割合で任意の位置に故意に欠損を発生させ, 先に紹介した5手法によりデータを整備する.そしてこれらのデータに基づいてモデルを構築し, 判定精度, 平均対数ゆう度の二つの観点から5手法の有効性を判定する.最後に, これらの結果が得られた理論背景について各手法の特性を比較しながら検討するという内容となっている.