著者
塚本 浩司 颯々野 学
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. NL,自然言語処理研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.146, pp.81-88, 2001-11-20
被引用文献数
2

本稿では、テキスト分類のタスクに対し、AdaBoostを用いた能動学習の手法を適用した結果を報告する。対象文書としてReutesr-21578コレクションを用いたところ、能動学習なしのAdaBoostの精度を、約1/10の正解データ量で実現できた。また、文書の表現を語の出現回数を特徴値とするベクトルから、語が出現したかどうかのbinary値を特徴値とするベクトルに変えるとにより、能動学習で観察されることのあるサンプル数の増加に伴う精度の劣化について考察した。