著者
古川 忠延 阿部 修也 安藤 剛寿 岩倉 友哉 志賀 聡子 高橋 哲朗 井形 伸之
雑誌
研究報告 デジタルドキュメント(DD)
巻号頁・発行日
vol.2011, no.3, pp.1-6, 2011-10-01

本研究では,センサーや統計等を通じては獲得できない社会的事象の抽出と活用の可能性調査を目的として,犯罪情報を対象に Twitter 投稿の分析をおこなった.分析を通じ,(1) Twitter 上の犯罪関連投稿には,投稿者自身の犯罪の目撃や被害に関する投稿,公共・公的機関が発表した情報等を引用した投稿,ニュース記事の引用という3種類が存在すること,(2) それらの間で記述されている犯罪種別傾向の違いから,Twitter からのみ抽出できる犯罪情報が存在していること,が分かった.また,犯罪関連投稿を自動抽出する実験結果についても報告する.We analyzed criminal Twitter posts. The purpose is to investigate the possibility of extraction of various social phenomena which can not be acquired by a sensor or statistical prediction. Through the analysis, our findings are: (1) There are three types of criminal tweets: user's experience, announce by public institution, and cited news article. (2) By analyzing the difference between these three types of criminal tweets, there may be criminal information existing only on Twitter. We also show the result of an experiment to extract criminal tweets automatically.
著者
古川 忠延 阿部 修也 安藤 剛寿 岩倉 友哉 志賀 聡子 高橋 哲朗 井形 伸之
雑誌
研究報告 デジタルドキュメント(DD)
巻号頁・発行日
vol.2011-DD-82, no.3, pp.1-6, 2011-10-01

本研究では,センサーや統計等を通じては獲得できない社会的事象の抽出と活用の可能性調査を目的として,犯罪情報を対象に Twitter 投稿の分析をおこなった.分析を通じ,(1) Twitter 上の犯罪関連投稿には,投稿者自身の犯罪の目撃や被害に関する投稿,公共・公的機関が発表した情報等を引用した投稿,ニュース記事の引用という3種類が存在すること,(2) それらの間で記述されている犯罪種別傾向の違いから,Twitter からのみ抽出できる犯罪情報が存在していること,が分かった.また,犯罪関連投稿を自動抽出する実験結果についても報告する.
著者
井形伸之
出版者
富士通
雑誌
Fujitsu
巻号頁・発行日
vol.64, no.5, 2013-09
著者
松井 くにお 難波 功 井形 伸之
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.50, no.1, pp.9-13, 2000
参考文献数
13
被引用文献数
1

全文検索技術は,統制語によるキーワード付けを行う方式と比較して,全処理を自動化できることによる低コスト性,検索量の増加による再現率の向上,という特徴を持つ。全文検索を実現するアルゴリズムには,文字列検索,シグネチャファイル,転置ファイルなどがある。日本語の全文検索システムでは特徴素の取り方として,形態素解析(単語)とN-gram(文字)があり,それぞれ得失がある。転置ファイルを用いた全文検索技術では,ランキング検索が用いられることが多いが,これには通常tf-idf法(文書中の単語頻度×文書DB中での単語の重要度)により関連度が計算される。