著者
竹中 姫子 古宮 嘉那子 小谷 善行
出版者
情報処理学会
雑誌
研究報告情報基礎とアクセス技術(IFAT) (ISSN:21862583)
巻号頁・発行日
vol.2011, no.1, pp.1-6, 2011-03-21

Twitter ではハッシュタグという,自分の投稿 (ツイート) に則した内容のインデックスをつける機能が提供されている.本研究ではハッシュタグのついていないツイートにたいしてハッシュタグを推定することを目的とする.そこでハッシュタグのついたツイートを学習し,そしてあるツイートがどのハッシュタグに属するかの推定を行った.分類器としてベイジアンフィルターを使用し,それぞれのタグについて 2 値分類を行い,複数のハッシュタグの推定を行った.実験では 50 種類のハッシュタグのつきの約 4 万件のツイートを学習データとして使用した.ツイート文にベイジアンフィルターを適用する場合は既知語に限定して処理を行うことで良い結果が得られるとわかった.In this paper, we propose a method of discovering hashtags, which are indexes in Twitter. We estimate hashtags of tweets without hashtags using tweets with hashtags. Binary classifier was developed for every tweet so as to they have more than one tags, and Bayesian filtering was used to classify. In the experiment, about 40,000 tweets with 50 kinds of hashtags are classified. The result shows Baysian filtering with limiting known words is effective in estimating hashtags of tweets.

言及状況

はてなブックマーク (4 users, 4 posts)

Twitter (5 users, 5 posts, 0 favorites)

と思ったらハッシュタグに関してはこんな研究もあった。 http://t.co/5cFYT9yD
調べ物してたらグーグル先生が予測変換から導いてくれた産物.使えそうな気はする http://t.co/ggGCqF2c 

収集済み URL リスト