- 著者
-
柳瀬 隆史
仲尾 由雄
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告自然言語処理(NL)
- 巻号頁・発行日
- vol.2000, no.29, pp.151-158, 2000-03-21
本稿では、メールマガジンサービスから配信されるニュース情報を対象にして、注目ニュースを自動抽出する手法を提案する。同時期に複数のメールマガジンから配信された記事内容を分析した結果、多くの記事で報じられた話題には注目に値するものが多く、同一話題を扱った記事の多くは記事見出しの比較で判定可能なことが分かった。そこで、見出しの類似性に基づいて配信記事群をグループ化し、各グループ中の記事数などをもとに話題性が高いと思われるグループを選別する実験を試みた。グループ化の結果により抽出した注目ニュースと週刊メールマガジンの掲載記事との比較などにより、各グループに含まれる記事数を適切に制御すれば、話題性の高い情報を含んだ注目ニュースを効率的に抽出できる見込みが得られた。In this paper, we propose a method of automatic extraction of noteworthy topics using news articles delivered by e-mail newsletter services. At first we manually analyzed a set of articles delivered in a week by several e-mail newsletter services, and found that most of the topics reported in many different articles are noteworthy ones and it is possible to judge the semantic identity of articles with comparison of their headlines. Then we made an experiment of automatic extraction of noteworthy topics. In the experiment we classifyed delivered articles into groups based on the similarity of their headlines, and choose some groups based on the number of articles in each group.