著者
森國 泰平 吉田 光男 岡部 正幸 梅村 恭司 Morikuni Taihei Yoshida Mitsuo Okabe Masayuki Umemura Kyouji
出版者
情報処理学会
雑誌
情報処理学会論文誌(トランザクション)データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.8, no.4, pp.16-26, 2015-12-28

ツイートに含まれる特徴と位置情報を対応させることで,実世界を観測するセンサとしてTwitterを活用することができる.しかし位置情報が付加されたツイートは少なく,Twitterをセンサとして活用するときの問題の1つとなる.そこで本研究では,ツイートの投稿位置を推定し,より多くのツイートに正確な位置情報を付与することを目的とする.この目的を達成するために,ツイート中のノイズとなる単語を除去するためのフィルタリング手法を提案する.また,単語の地理的分布を平滑化するためのスムージング手法も提案する.これらの提案手法が従来手法よりも有効に機能することを示し,その考察を行う.Twitter can be considered as a real-time sensor that responds to real-world events by combining the content and location information of tweets. However, a problem persists: tweets containing location information are too small. To overcome this problem, we estimate the location where a tweet was posted. Our main method involves using word filters called AF filter and TF-IAF filter that detect stop words. In addition, we propose a smoothing method called Distance smoothing for overcoming sparsity of words. We show that both our methods improve location estimation accuracy and discuss the features of the results.
著者
Yoshida Mitsuo Arase Yuki
出版者
Springer Berlin Heidelberg
雑誌
Information Retrieval Technology (ISSN:03029743)
巻号頁・発行日
vol.7675, pp.138-149, 2012-12
被引用文献数
1

We propose a method for classifying queries whose frequency spikesin a search engine into their topical categories such as celebrities and sports. Unlikeprevious methods using Web search results and query logs that take a certainperiod of time to follow spiking queries, we exploit Twitter to timely classifyspiking queries by focusing on its massive amount of super-fresh content. Theproposed method leverages unique information in Twitter—not only tweets butalso users and hashtags. We integrate such heterogeneous information in a graphand classify queries using a graph-based semi-supervised classification method.We design an experiment to replicate a situation when queries spike. The resultsindicate that the proposed method functions effectively and also demonstrate thataccuracy improves by combining the heterogeneous information in Twitter.