著者
高橋 柊 菊地 悠 落合 桂一 深澤 佑介
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.58, no.8, pp.1376-1386, 2017-08-15

近年,Twitterなどのマイクロブログに代表されるSNSサービスのユーザ数増加により,実世界における情報がリアルタイムにweb上にアップロードされるようになった.そのため,マイクロブログ上の情報をセンシングすることで,実世界における事象を検知する研究が活発となっている.本研究では,マイクロブログ上に投稿される犯罪関連投稿に着目する.マイクロブログより,リアルタイムな犯罪関連投稿を抽出することができれば,犯罪事象に対し短時間で適切な防犯対策が可能となる.また,警察官によるパトロールなど既存のセンシング手法では抽出困難であった犯罪事象がマイクロブログ固有の情報より抽出可能となる.マイクロブログにおける投稿抽出には投稿テキスト情報を利用する手法があるが,犯罪という希少な事象を投稿テキスト情報から抽出するのは困難である.提案手法ではユーザの投稿内容,投稿関連位置情報および関連ステータス情報を用いることで,投稿内容の希少性および影響力について特徴量を生成し,投稿者が経験あるいは目撃した犯罪関連投稿を抽出する.Twitterの日本語投稿データに対し提案手法を適用したところ,投稿テキスト情報のみを利用した既存手法(AUC=0.6146)に対し,提案手法(AUC=0.7183)ではより高精度な犯罪関連情報の抽出が可能となった.
著者
高橋 柊 菊地 悠 落合 桂一 深澤 佑介
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.58, no.8, pp.1376-1386, 2017-08-15

近年,Twitterなどのマイクロブログに代表されるSNSサービスのユーザ数増加により,実世界における情報がリアルタイムにweb上にアップロードされるようになった.そのため,マイクロブログ上の情報をセンシングすることで,実世界における事象を検知する研究が活発となっている.本研究では,マイクロブログ上に投稿される犯罪関連投稿に着目する.マイクロブログより,リアルタイムな犯罪関連投稿を抽出することができれば,犯罪事象に対し短時間で適切な防犯対策が可能となる.また,警察官によるパトロールなど既存のセンシング手法では抽出困難であった犯罪事象がマイクロブログ固有の情報より抽出可能となる.マイクロブログにおける投稿抽出には投稿テキスト情報を利用する手法があるが,犯罪という希少な事象を投稿テキスト情報から抽出するのは困難である.提案手法ではユーザの投稿内容,投稿関連位置情報および関連ステータス情報を用いることで,投稿内容の希少性および影響力について特徴量を生成し,投稿者が経験あるいは目撃した犯罪関連投稿を抽出する.Twitterの日本語投稿データに対し提案手法を適用したところ,投稿テキスト情報のみを利用した既存手法(AUC=0.6146)に対し,提案手法(AUC=0.7183)ではより高精度な犯罪関連情報の抽出が可能となった.Recently, with increase of the SNS users such as Twitter, real world information is uploaded on the web in real time. By using the proposed method, it is possible to extract criminal related posts experienced or witnessed based on rarity and influence from users' posted contents, associated location information and status information. Crime events that were difficult to detected by existing methods such as patrol by police officers can be extracted from unique information of microblogs. By using the proposed method, it is possible to extract criminal related posts experienced or witnessed from users' posted contents, associated location information and status information. The proposed method applied on Japanese Twitter data shows higher AUC score (0.7183) compared to the existing methods which only use text information (0.6146).