著者
荒川 豊 田頭 茂明 福田 晃
雑誌
研究報告モバイルコンピューティングとユビキタス通信(MBL)
巻号頁・発行日
vol.2010-MBL-55, no.10, pp.1-6, 2010-08-26

本研究では,2009 年 12 月から 2010 年 6 月にかけて収集した位置情報付きツイート 50 万件の中から,位置依存性の高い文字列を抽出する手法を提案する.提案手法では,あるキーワードを含むツイート群に対して,緯度および経度の標準偏差をそれぞれ求め,ツイート群のばらつきの度合いから,そのキーワードの位置依存性を測る.しかし,この手法では,依存する位置が複数存在するキーワード (例えば,チェーン展開している有名店舗名など) を位置依存性の低い単語として判定してしまう.そこで,ある一定の割合以上のツイートを含むエリアを高速に抽出する二次元深さ優先探索を提案する.提案手法では,まず,エリアを 100 キロ四方のグリッドに分割し,それぞれのグリッド内のツイート含有率を計算する.次に,ツイート含有率がある閾値を超えたエリアを 10 キロ四方のグリッドに分割し,同様の判定を行い,最終的には 1 キロ四方のグリッドまで走査する.これらの分析により,1 つのキーワードに対して複数の位置依存性を抽出することが可能となる.

言及状況

Twitter (3 users, 3 posts, 3 favorites)

「Twitter分析に基づく位置依存文字列の抽出」をあとで読む。 http://id.nii.ac.jp/1001/00070242/

収集済み URL リスト