著者
王 卉歓 中谷 直司 小池 竜一 厚井 裕司 朴 美娘
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.48, no.9, pp.3125-3136, 2007-09-15
参考文献数
24

近年スパムによる被害に対抗するため,ベイズ学習アルゴリズムを用いたスパムフィルタが注目されている.また,同様にメールを媒介として多くの被害をもたらすコンピュータウイルスにおいても,既存の手法では対応困難な未知ウイルスに対し,ベイズ学習アルゴリズムを用いたウイルスフィルタの研究が行われている.しかし,ベイズ理論に基づくウイルスフィルタに関する研究は,十分な検討が行われたとはいえない状況である.そこで本論文では,現在スパムフィルタとして広く用いられているPaul Graham 方式,Gary Robinson 方式,naive 方式の3 種類のベイズ方式を用いたスパムおよびウイルスフィルタとしての性能に関する考察と,メールに対しスパム検出と同時にウイルス検出を行ううえで実装コストの面で有利になる,スパムとウイルス両方のフィルタで高い性能を示す新しいベイズ方式の提案を行う.実験により提案方式は従来方式によるベイジアンフィルタよりも,同等あるいはより低い誤検出率を維持したまま,より高い検出率をスパムとウイルス両方において実現可能であることが示された.The spam filter that used Bayes learning algorithm was paid attention in recent years as the countermeasure for damages of spam. In computer virus that causes a lot of damage through the medium of mail, the existing technique is difficult to take the countermeasure against the unknown virus. Some researches including us have studied and developed the virus filter that use the Bayes learning algorithm. But it seems that the enough research has been not done until now. In this paper, we compare the performance of spam filters and virus filters that use Paul Graham method, Gary Robinson method, naive method which have previously shown a good performance and widely have been used as spam filter. We also propose the new Bayes method that shows best performance of both spam filter and virus filter. It has advantage that we can detect a number of virus and spam mails at the same time in respect of the mounting cost. As the result, it is possible that the proposed method outperforms three original methods in exterminating both spam and virus with the same or lower false detection rate.