著者
森國 泰平 吉田 光男 岡部 正幸 梅村 恭司 Morikuni Taihei Yoshida Mitsuo Okabe Masayuki Umemura Kyouji
出版者
情報処理学会
雑誌
情報処理学会論文誌(トランザクション)データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.8, no.4, pp.16-26, 2015-12-28

ツイートに含まれる特徴と位置情報を対応させることで,実世界を観測するセンサとしてTwitterを活用することができる.しかし位置情報が付加されたツイートは少なく,Twitterをセンサとして活用するときの問題の1つとなる.そこで本研究では,ツイートの投稿位置を推定し,より多くのツイートに正確な位置情報を付与することを目的とする.この目的を達成するために,ツイート中のノイズとなる単語を除去するためのフィルタリング手法を提案する.また,単語の地理的分布を平滑化するためのスムージング手法も提案する.これらの提案手法が従来手法よりも有効に機能することを示し,その考察を行う.Twitter can be considered as a real-time sensor that responds to real-world events by combining the content and location information of tweets. However, a problem persists: tweets containing location information are too small. To overcome this problem, we estimate the location where a tweet was posted. Our main method involves using word filters called AF filter and TF-IAF filter that detect stop words. In addition, we propose a smoothing method called Distance smoothing for overcoming sparsity of words. We show that both our methods improve location estimation accuracy and discuss the features of the results.
著者
吉田 光男 荒瀬 由紀
出版者
情報処理学会
雑誌
情報処理学会論文誌(トランザクション)データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.9, no.1, pp.20-30, 2016-03-31

ソーシャルメディアでの言及量やウェブ検索エンジンでの検索頻度をもとに,トレンドキーワードを発見する研究開発が広く行われている.また,注目されているキーワードに対して情報を付与し,そのキーワードの理解を促すような試みもある.しかし,それらのトレンドキーワードが様々なウェブリソースでどのように振る舞うのかは必ずしも明らかではない.そこで本研究では,トレンドをとらえうるウェブリソースを対象に,収集したトレンドキーワードがどのように振る舞うのかを横断的に調査する.この調査により,大半のトレンドキーワードがオンライン辞書サービスに登録されていないこと,検索のトレンドは2日で50%未満の頻度に収束すること,ソーシャルメディア(Twitter)がほかのウェブリソースよりもトレンドに敏感であることなどを明らかにする.Many researchers work on studies for discovering trend keywords and queries on the web, i.e., search frequency and social media. Moreover, studies on trend query classifications are being conducted. However, the behavior of trend queries for various web resources is unclear. In this study, we investigate how trend queries appear in different resources on the web. We clarify the following. (1) Most trend queries are not registered with online dictionary services. (2) The trend converges in approximately two days. (3) Social media websites (such as Twitter) are responsive to trend queries.