著者
鳴海 建太 西田 京介 山内 康一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.605, pp.1-6, 2007-03-08
被引用文献数
2

現在スパムメールが問題化しており,メールの内容を基にスパムメールか否かを分類するスパムメールフィルタが多数考案されている.その中でもNaive Bayesなどの統計的学習機械を利用したフィルタは多く実用化されており非常に高い精度を実現しているが,多数のメールの学習を行った後はこれまでの傾向とは違うメールの学習が進みにくくなってしまう.日々変わり続けるスパムメールに対処するにはこの問題を解決しなければならない.一方,学習に即応性があるフィルタとしてはNearest Neighborに代表されるインスタンスベースの学習機械を用いたフィルタがあるが,計算量や使用メモリ量が大きいため多くのメールを保持して分類に使用することができない.そこで本研究では,即時的な学習を行うインスタンスベースの学習機械と,過去の大量の知識を記憶する多数の統計的学習機械を組み合わせて分類を行うことで,スパムメールの変化に対応できるフィルタを提案する.また,計算機実験による他の学習機械のフィルタとの比較によって,提案フィルタが変化に対応して優れた分類精度を実現することを示す.