- 著者
-
石岡 恒憲
- 出版者
- Japanese Society of Applied Statistics
- 雑誌
- 応用統計学 (ISSN:02850370)
- 巻号頁・発行日
- vol.40, no.3, pp.193-209, 2011-12-30
- 被引用文献数
-
2
Breimanによって提案された分類や非線形回帰のための集団学習の方法の一つであるRandom Forest(RF)が,欠測を多く含む大量データに対して安定してかつ精度のよいデータ補完(imputation)を実施することを示す.本報告では,RFによるデータ補完の方法について解説し,ある年度のセンター試験の理科および社会の科目間難易比較についての応用例を示す.説明変数が全て同等もしくは同列ではなく,幾つかの説明変数がグループにまとめられ,またそのグループの中から一つが排他的に選択されるような場合には本報告の手順は有効であろう.