- 著者
-
荒川 豊
田頭 茂明
福田 晃
- 雑誌
- 研究報告モバイルコンピューティングとユビキタス通信(MBL)
- 巻号頁・発行日
- vol.2010-MBL-55, no.10, pp.1-6, 2010-08-26
本研究では,2009 年 12 月から 2010 年 6 月にかけて収集した位置情報付きツイート 50 万件の中から,位置依存性の高い文字列を抽出する手法を提案する.提案手法では,あるキーワードを含むツイート群に対して,緯度および経度の標準偏差をそれぞれ求め,ツイート群のばらつきの度合いから,そのキーワードの位置依存性を測る.しかし,この手法では,依存する位置が複数存在するキーワード (例えば,チェーン展開している有名店舗名など) を位置依存性の低い単語として判定してしまう.そこで,ある一定の割合以上のツイートを含むエリアを高速に抽出する二次元深さ優先探索を提案する.提案手法では,まず,エリアを 100 キロ四方のグリッドに分割し,それぞれのグリッド内のツイート含有率を計算する.次に,ツイート含有率がある閾値を超えたエリアを 10 キロ四方のグリッドに分割し,同様の判定を行い,最終的には 1 キロ四方のグリッドまで走査する.これらの分析により,1 つのキーワードに対して複数の位置依存性を抽出することが可能となる.