著者
中村 健二 田中 成典 古田 均 吉村 智史 北野 光一
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.49, no.7, pp.2480-2492, 2008-07-15

近年,インターネットを利用した日常的な情報収集活動において,即時性と信頼性に優れたWebニュースは人々の情報源として広く活用されている.しかし,日々時々刻々と増加する膨大な数のWebニュースから特定のトピックだけを抽出することは困難である.そのため,文書間の類似度を利用してトピックを分類する研究や時系列的な特性に基づきトピックを抽出する研究が活発に行われている.しかし,これら既存研究では,文書中に出現する単語群に依存した分類しかできず,また任意の期間に発生するトピックに適切な単語を関連付けできないという課題がある.そこで,本研究では,時系列的な特性に基づいて抽出したバースト語を用いて,バースト語間の関連を考慮した最新のトピックを抽出する手法を提案する.そして,既研究の従来手法と比較実験を行い,本提案手法の有用性を実証する.