著者
高橋 柊 菊地 悠 落合 桂一 深澤 佑介
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.58, no.8, pp.1376-1386, 2017-08-15

近年,Twitterなどのマイクロブログに代表されるSNSサービスのユーザ数増加により,実世界における情報がリアルタイムにweb上にアップロードされるようになった.そのため,マイクロブログ上の情報をセンシングすることで,実世界における事象を検知する研究が活発となっている.本研究では,マイクロブログ上に投稿される犯罪関連投稿に着目する.マイクロブログより,リアルタイムな犯罪関連投稿を抽出することができれば,犯罪事象に対し短時間で適切な防犯対策が可能となる.また,警察官によるパトロールなど既存のセンシング手法では抽出困難であった犯罪事象がマイクロブログ固有の情報より抽出可能となる.マイクロブログにおける投稿抽出には投稿テキスト情報を利用する手法があるが,犯罪という希少な事象を投稿テキスト情報から抽出するのは困難である.提案手法ではユーザの投稿内容,投稿関連位置情報および関連ステータス情報を用いることで,投稿内容の希少性および影響力について特徴量を生成し,投稿者が経験あるいは目撃した犯罪関連投稿を抽出する.Twitterの日本語投稿データに対し提案手法を適用したところ,投稿テキスト情報のみを利用した既存手法(AUC=0.6146)に対し,提案手法(AUC=0.7183)ではより高精度な犯罪関連情報の抽出が可能となった.
著者
落合 桂一 鳥居 大祐
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.7, no.2, pp.51-60, 2014-06-30

本研究では,Twitterなどの文章が短いマイクロブログを対象として,位置に関する特徴語を利用した地名の曖昧性解消手法を提案する.従来,同名地名の曖昧性解消には地理的に近い地名との共起が用いられていた.しかし,マイクロブログは文章が短いため,地名以外の単語も曖昧性解消に利用すべきである.そこで,マイクロブログの投稿にはその場所特有のトピックが存在することが多いと考え,地名ごとにその場所特有の単語(特徴語)を利用することで地名の曖昧性解消を行う.特徴語は季節変動などに依存しない定常的なものと,時間の経過によって変化する非定常的なものが存在する.そのため,定常的な特徴語(静的特徴語)を観光案内やWikipediaの説明文のような静的な文書から抽出し,地名と静的特徴語の共起により曖昧性解消を行う.ここでは季節変動や時期に依存しない特徴語を利用する.一方,非定常的な特徴語(動的特徴語)はマイクロブログの特徴であるリアルタイム性を反映し,場所のトピックが時間とともに変化すると考え,従来手法により曖昧性解消された投稿から地名ごとの特徴語を動的に生成し曖昧性解消に利用する.提案手法の有効性を確認するため,再現率および適合率を評価した.地名に対して人手により正解ラベルを付与し正しく抽出できる数を調査した.その結果,従来手法の地理的に近い地名との共起をベースラインとして,提案手法の有効性を確認した.
著者
落合 桂一 赤塚 裕人 山田 渉 寺田 雅之
雑誌
研究報告データベースシステム(DBS) (ISSN:2188871X)
巻号頁・発行日
vol.2020-DBS-172, no.1, pp.1-5, 2020-12-14

台風や大雨などの自然災害が激甚化している.災害規模が大きくなるほど災害規模の把握に時間を要し,初動対応が遅れる可能性がある.そこで本研究では,リアルタイムな人口変動のデータを利用し災害規模を推定することを提案し,推定に有用な特徴量の検討を行う.
著者
落合 桂一 山田 渉 深澤 佑介 菊地 悠 松尾 豊
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.9, no.2, pp.11-22, 2016-06-29

本研究では,Twitterの投稿文章とプロフィール情報から生成した特徴量に基づき,機械学習によりPoint-of-Interest(POI)の公式アカウントを判定する方法を提案する.公式アカウントを判定するため,あらかじめ用意したPOIデータベースを使いPOI名称とTwitterのユーザ名を比較する方法では,1)POIデータベースにないPOIは抽出されないという課題,2)POI名称が正式名称のために通称や略称などが使われるユーザ名と一致しないという課題,3)一般ユーザがユーザ名にPOI名称を利用している場合があるという課題がある.そこで,Twitterの投稿内容やプロフィール情報に基づいてPOI公式アカウントを判定する手法を提案する.本研究では,POI公式アカウント抽出のための特徴量として,従来用いられていた投稿文章や自己紹介文のBag-of-Wordsに加え,POI固有特徴量(場所情報,営業時間,連絡先など),知名度に関する特徴量(フォロワ数やリストに登録されている数など),プロフィール画像の画像特徴量を提案する.実験によりPOIデータベースを利用した場合と比較し,約3倍のPOI公式アカウントが抽出可能であることを示した.また,提案した特徴量を利用した場合,従来手法の特徴量を利用した場合と比較し分類性能を表す再現率0.933,F値0.938で最大になることを示した.
著者
落合 桂一 山本 直樹 濱谷 尚志 深澤 佑介
雑誌
研究報告モバイルコンピューティングとパーベイシブシステム(MBL) (ISSN:21888817)
巻号頁・発行日
vol.2019-MBL-91, no.5, pp.1-6, 2019-05-16

スマートフォンの利用状況から利用者の状態推定を行う研究が盛んに行われている.従来研究ではカテゴリごとのアプリ利用回数や利用時間などの基本統計量が特徴量として利用されていた.しかしながら,アプリの使用履歴からは基本統計量に限らず,アプリの利用順序やアプリ間の関係性など多様な特徴表現が生成可能であると考えられる.そこで本研究では,深層学習によるアプリ利用ログからの特徴抽出を行い,分類問題により特徴抽出の有効性を評価する.深層学習モデルとして LSTM や Graph Convolutional Networks など複数のモデルを検証する.
著者
落合 桂一 深澤 佑介 松尾 豊
雑誌
研究報告マルチメディア通信と分散処理(DPS) (ISSN:21888906)
巻号頁・発行日
vol.2017-DPS-171, no.7, pp.1-7, 2017-05-25

スマートフォンの普及を背景に位置情報サービスが注目されている.位置情報サービスは現地に行くことで利用が可能となるものもありコンテンツ配置がユーザの行動に影響を与えると考えられる.そこで,本研究では Pokemon Go を例として位置情報サービスの利用によるユーザの行動変化を分析する.具体的には Foursquare のチェックインデータを用いて,チェックイン回数や時間帯,訪問したスポットの傾向やカテゴリの傾向,移動距離などを,サービス利用前後および利用者と非利用者で比較し特徴を分析する.
著者
高橋 柊 菊地 悠 落合 桂一 深澤 佑介
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.58, no.8, pp.1376-1386, 2017-08-15

近年,Twitterなどのマイクロブログに代表されるSNSサービスのユーザ数増加により,実世界における情報がリアルタイムにweb上にアップロードされるようになった.そのため,マイクロブログ上の情報をセンシングすることで,実世界における事象を検知する研究が活発となっている.本研究では,マイクロブログ上に投稿される犯罪関連投稿に着目する.マイクロブログより,リアルタイムな犯罪関連投稿を抽出することができれば,犯罪事象に対し短時間で適切な防犯対策が可能となる.また,警察官によるパトロールなど既存のセンシング手法では抽出困難であった犯罪事象がマイクロブログ固有の情報より抽出可能となる.マイクロブログにおける投稿抽出には投稿テキスト情報を利用する手法があるが,犯罪という希少な事象を投稿テキスト情報から抽出するのは困難である.提案手法ではユーザの投稿内容,投稿関連位置情報および関連ステータス情報を用いることで,投稿内容の希少性および影響力について特徴量を生成し,投稿者が経験あるいは目撃した犯罪関連投稿を抽出する.Twitterの日本語投稿データに対し提案手法を適用したところ,投稿テキスト情報のみを利用した既存手法(AUC=0.6146)に対し,提案手法(AUC=0.7183)ではより高精度な犯罪関連情報の抽出が可能となった.Recently, with increase of the SNS users such as Twitter, real world information is uploaded on the web in real time. By using the proposed method, it is possible to extract criminal related posts experienced or witnessed based on rarity and influence from users' posted contents, associated location information and status information. Crime events that were difficult to detected by existing methods such as patrol by police officers can be extracted from unique information of microblogs. By using the proposed method, it is possible to extract criminal related posts experienced or witnessed from users' posted contents, associated location information and status information. The proposed method applied on Japanese Twitter data shows higher AUC score (0.7183) compared to the existing methods which only use text information (0.6146).
著者
落合 桂一 鳥居 大祐
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.7, no.2, pp.51-60, 2014-06-30

本研究では,Twitterなどの文章が短いマイクロブログを対象として,位置に関する特徴語を利用した地名の曖昧性解消手法を提案する.従来,同名地名の曖昧性解消には地理的に近い地名との共起が用いられていた.しかし,マイクロブログは文章が短いため,地名以外の単語も曖昧性解消に利用すべきである.そこで,マイクロブログの投稿にはその場所特有のトピックが存在することが多いと考え,地名ごとにその場所特有の単語(特徴語)を利用することで地名の曖昧性解消を行う.特徴語は季節変動などに依存しない定常的なものと,時間の経過によって変化する非定常的なものが存在する.そのため,定常的な特徴語(静的特徴語)を観光案内やWikipediaの説明文のような静的な文書から抽出し,地名と静的特徴語の共起により曖昧性解消を行う.ここでは季節変動や時期に依存しない特徴語を利用する.一方,非定常的な特徴語(動的特徴語)はマイクロブログの特徴であるリアルタイム性を反映し,場所のトピックが時間とともに変化すると考え,従来手法により曖昧性解消された投稿から地名ごとの特徴語を動的に生成し曖昧性解消に利用する.提案手法の有効性を確認するため,再現率および適合率を評価した.地名に対して人手により正解ラベルを付与し正しく抽出できる数を調査した.その結果,従来手法の地理的に近い地名との共起をベースラインとして,提案手法の有効性を確認した.In this study, we propose a disambiguation method for toponyms using words related to the location. Conventionally, toponym ambiguition has been resolved by using nearby toponyms based on the hypothesis that geographically-closed toponyms are appeared frequently in the same contenxt. In the case of microblogs, however, words other than toponyms are preferable to be used because short texts of microblogs have less information. To this end, we consider that microblogs have a topic related to the location and propose a method which uses words related to the location ("location-related words") as disambiguators for each toponym. The location-related words are categorized into two groups. One is static words independent of seasonal variations and so on. The other is dynamic one which depends on seasonal variations etc. The dynamic location-related words reflect immediacy of microblog (i.e., the dynamic location-related words vary with time). We evaluated our proposed method by recall and precision using manually labeled data. The result showed that the recall of our proposed method is higher than that of the conventional method.