- 著者
-
荒牧 英治
増川 佐知子
森田 瑞樹
- 雑誌
- 研究報告音声言語情報処理(SLP)
- 巻号頁・発行日
- vol.2011, no.1, pp.1-8, 2011-05-09
近年のTwitterの普及とともに,そこから有益な情報を抽出する研究の需要が高まっている.本研究ではインフルエンザ流行予測の問題に焦点をあてる.まず,Twitterからインフルエンザに関連した発言を抽出する.次に,SVMを用いた分類器で,その発言者が実際にインフルエンザにかかっているかどうかを判定する.実験では,厚労省報告の症例数と比較し相関係数0.89の精度で流行予測することができ,提案手法の有効性を示した.特に,流行の開始時期においては,相関係数は0.97と高く,最先端の手法であるGoogle Fluトレンドと同等の精度が得られた.本研究によって,Twitter上のテキストが現実の疾病状態を反映していること,また,言語処理技術によって,その情報が抽出可能であることを示した.With the recent rise in popularity and size of social media, there is a growing need for systems that can extract useful information from this amount of data. We address the problem of detecting influenza epidemics. First, the proposed system extracts the influenza related tweets using Twitter API. Then, the SVM based classifies extracts only tweets that include real influenza patients. The experiments demonstrated the feasibility of the proposed approach (0.89 of the correlation to the gold standard). Especially in the rise of the influenza (early stage of the epidemics), the proposed method shows the high accuracy (0.97 correlation), which is the same accuracy to the state-of-the-art method. This paper demonstrated that Twitter texts reflect the real world, and Natural Language Processing (NLP) technique could extracts the information.