- 著者
-
荒川 豊
田頭 茂明
福田 晃
- 雑誌
- 研究報告システムLSI設計技術(SLDM)
- 巻号頁・発行日
- vol.2010-SLDM-144, no.50, pp.1-7, 2010-03-19
本研究では,コンテキストアウェアIME実現へ向けて,コンテキストと入力文字列との相関関係を明らかにするために,Twitter (ツイッター) のつぶやきを収集し分析を行った.ツイッターを分析対象とした理由は,位置情報が付加された文字列が大量に得られることと幅広いユーザ層の文字列が得られることからである.2009 年 12 月 15 日から 2010 年 2 月 1 日の位置情報付きの 13590 件のツイートに対して,位置情報から得られるランドマーク情報と,時間情報から得られるテレビ番組情報とのマッチングを行ない,取得したツイートのうち,4.83% が発言した位置を元に得られるランドマーク情報を含み,8.16% が発言した時間を元に得られるテレビ番組情報を含んでいることを明らかにした.また,一致した文字列は,2~3 文字であることや Web 検索結果の上位 10 件に約 45% が含まれていることを明らかにした.