- 著者
-
宮西 大樹
関 和広
上原 邦昭
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会論文誌データベース(TOD) (ISSN:18827799)
- 巻号頁・発行日
- vol.7, no.2, pp.1-10, 2014-06-30
マイクロブログ検索には,単語を用いた疑似適合フィードバックによるクエリ拡張が有効である.しかし,単語は意味的・時間的な曖昧性を持つため,単語を用いたクエリ拡張は有効に機能しない場合がある.そこで,本稿では,単語や2語以上の単語の組合せであるコンセプトを用いた疑似適合フィードバックによるクエリ拡張手法を提案する.さらに,提案手法は検索クエリと同時期に出現するコンセプトの頻度の時間遷移に関する情報を疑似適合フィードバックに組み入れることで,マイクロブログサービスのリアルタイム性を考慮する.代表的なマイクロブログデータであるTweets2011コーパスを用いた実験から,提案するコンセプトを用いたクエリ拡張によって,検索クエリに適合し,かつ情報量の豊富な文書を効果的に検索できることを示す.Incorporating the temporal property of words into query expansion methods based on relevance feedback has been shown to have a significant positive effect on microblog searching. In this paper, we propose a concept-based query expansion method based on a temporal relevance model that uses the temporal variation of concepts (e.g., terms or phrases) on microblogs. Our model naturally extends an extremely effective existing concept-based relevance model by tracking the concept frequency over time. Moreover, the proposed model produces important concepts that are frequently used within a particular time period associated with a given topic, which have more power to discriminate between relevant and non-relevant microblog documents than words. Our experiments using a corpus of microblog data (the Tweets2011 corpus) show that the proposed concept-based query expansion method improves search performance significantly, especially when retrieving highly relevant documents.