著者
藤田 俊之 小林 亜樹
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 B (ISSN:13444697)
巻号頁・発行日
vol.J106-B, no.1, pp.1-12, 2023-01-01

インターネットを介したサービスとしてソーシャルネットワーキングサービス(SNS)が普及し,特に短文を投稿するTwitterにはその時々の情報が投稿されており,災害時の状況収集ツールとしても期待されている.このとき,災害情報のみを抽出する採集手法が必要であり,本論文では採集者による教師データを必要としない自己教師あり準リアルタイムでの採集方式を提案する.本方式は,主題となる検索語のみを入力とし,ストリームデータであるtweet列から採集する自己教師あり分類器である.これまでのTweet分類では短文性による困難さが指摘され,災害情報の事後分析を目的とした研究では人手による検索語集合を用いたフィルタリングが主流であった.そこで,会話を文書と見做すことで判定精度を改善し,更に会話内の部分単位での分析過程を導入した.実データを用いた数種の実験で,既存手法に対して精度良く見落とし少なく,また,当初の自己教師生成待ち時間以後はほぼリアルタイムでの採集を行えることを確認し,会話内の部分単位での分析が有効であることも明らかにした.