- 著者
-
邱 起仁
櫨山 淳雄
- 雑誌
- 研究報告データベースシステム(DBS)
- 巻号頁・発行日
- vol.2013-DBS-158, no.22, pp.1-6, 2013-11-19
本論文では,Twitter からニュース記事に関連する tweets を収集することを目的とし,Twitter の投稿とニュース記事の類似度の計算手法を提案する.Twitter の投稿には 140 文字という長さの制限がある.従来の TF-IDF 法だけでは比較的に短文である Twitter の投稿の特徴語を抽出するのが困難である.そこで本論文では,確実にニュース記事に関連する Twitter の投稿 (そのニュース記事への URL を引用する投稿) に出現した語は,同じニュース記事を言及する他の Twitter の投稿にも使用される可能性が高いと考え,それらの語を特徴語として抽出する.また,Twitter の投稿とニュース記事の内容類似度のみではなく,時間類似度も考慮することで,類似度計算の精度を向上させる.