著者
古川 忠延 阿部 修也 安藤 剛寿 岩倉 友哉 志賀 聡子 高橋 哲朗 井形 伸之
雑誌
研究報告 デジタルドキュメント(DD)
巻号頁・発行日
vol.2011, no.3, pp.1-6, 2011-10-01

本研究では,センサーや統計等を通じては獲得できない社会的事象の抽出と活用の可能性調査を目的として,犯罪情報を対象に Twitter 投稿の分析をおこなった.分析を通じ,(1) Twitter 上の犯罪関連投稿には,投稿者自身の犯罪の目撃や被害に関する投稿,公共・公的機関が発表した情報等を引用した投稿,ニュース記事の引用という3種類が存在すること,(2) それらの間で記述されている犯罪種別傾向の違いから,Twitter からのみ抽出できる犯罪情報が存在していること,が分かった.また,犯罪関連投稿を自動抽出する実験結果についても報告する.We analyzed criminal Twitter posts. The purpose is to investigate the possibility of extraction of various social phenomena which can not be acquired by a sensor or statistical prediction. Through the analysis, our findings are: (1) There are three types of criminal tweets: user's experience, announce by public institution, and cited news article. (2) By analyzing the difference between these three types of criminal tweets, there may be criminal information existing only on Twitter. We also show the result of an experiment to extract criminal tweets automatically.
著者
高橋哲朗
出版者
一般社団法人情報処理学会
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2013, no.17, pp.1-7, 2013-11-07

twitter に代表されるマイクロブログは世の中の動向を知るためのセンサとしての活用が可能であるが,発言位置を特定できるユーザは一部でしかないため地理的な情報を用いた活用が難しいという課題がある.そこで本研究ではより網羅的にユーザの位置情報を推定するために,「雨」 のような局所性のあるイベントに対する発言の同期を集計することにより,発言位置を特定できないユーザの位置情報を推定する手法を提案する.実験の結果,約 41% の精度で都道府県単位の位置を推定できることを確認した.また位置情報が既知であるユーザの発言を元に 「雨」 以外に局所的な発言の同期が起きる語を抽出する手法を提案し,実験の結果,雨などの自然状況や花火などのイベントを含む複数のカテゴリの語が得られることを確認した.
著者
高橋 哲朗 野田 雄也
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.110, no.400, pp.43-48, 2011-01-20
参考文献数
7

Twitterには,ユーザの行動や思考,意見,感覚などが投稿されているため,大量のtweetを集約することで実世界で起きている現象をとらえるセンサーとして用いることができる可能性がある.これを検証するために,我々は,Twitterに投稿された「花粉症」に関するtweetを集め,それらを都道府県別にマッピングし可視化するシステムを作成した.そして,ここで得られた情報と,実際の花粉の飛散量との関係を分析し,Twitterのセンサーとしての利用の可能性について議論する.
著者
古川 忠延 阿部 修也 安藤 剛寿 岩倉 友哉 志賀 聡子 高橋 哲朗 井形 伸之
雑誌
研究報告 デジタルドキュメント(DD)
巻号頁・発行日
vol.2011-DD-82, no.3, pp.1-6, 2011-10-01

本研究では,センサーや統計等を通じては獲得できない社会的事象の抽出と活用の可能性調査を目的として,犯罪情報を対象に Twitter 投稿の分析をおこなった.分析を通じ,(1) Twitter 上の犯罪関連投稿には,投稿者自身の犯罪の目撃や被害に関する投稿,公共・公的機関が発表した情報等を引用した投稿,ニュース記事の引用という3種類が存在すること,(2) それらの間で記述されている犯罪種別傾向の違いから,Twitter からのみ抽出できる犯罪情報が存在していること,が分かった.また,犯罪関連投稿を自動抽出する実験結果についても報告する.
著者
福永 隼也 西川 仁 徳永 健伸 横野 光 高橋 哲朗
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2018-NL-236, no.12, pp.1-9, 2018-07-02

本論文は,データベース検索を行うタスク指向型対話を対象として,ユーザ発話中で明示的に述べられていないユーザ要求の解釈をおこなう手法を提案する.ユーザ発話において,検索条件としてデータベースフィールドとその値が明示的に指定されない場合,その発話を直接データベースへのクエリに変換することはできない.しかし,そのような発話中にも明示的に述べられないユーザ要求が含まれる場合があり,それを解釈することは,対話システムがより自然で効率的なデータベース検索対話をおこなうために重要である.本論文ではこのように明示的に述べられないユーザ要求を非明示的条件と呼ぶ.また,非明示的条件の解釈を,ユーザ発話を関連するデータベースフィールドに紐づけ,また同時にその根拠となるユーザ発話中の文字列を抽出する課題として定式化する.このような新しい課題を提案するとともに,課題に対する 2 つの手法として,サポートベクターマシンに基づく手法と,分類と根拠となる部分文字列の抽出を同時に行うニューラルネットワークによる手法を実装した.不動産に関する対話のコーパスを利用した評価実験の結果,サポートベクターマシンに基づく手法がより良好な結果を示すことがわかった.
著者
角森 唯子 東中 竜一郎 高橋 哲朗 稲葉 通将
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.35, no.1, pp.DSI-G_1-10, 2020-01-01 (Released:2020-01-01)
参考文献数
26
被引用文献数
1

The task of detecting dialogue breakdown, the aim of which is to detect whether a system utterance causes dialogue breakdown in a given dialogue context, has been actively researched in recent years. However, currently, it is not clear which evaluation metrics should be used to evaluate dialogue breakdown detectors, hindering progress in dialogue breakdown detection. In this paper, we propose finding appropriate metrics for evaluating the detectors in dialogue breakdown detection challenge 3. In our approach, we first enumerate possible evaluation metrics and then rank them on the basis of system ranking stability and discriminative power. By using the submitted runs (results of dialogue breakdown detection of participants) of dialogue breakdown detection challenge 3, we experimentally found that RSNOD(NB,PB,B) is an appropriate metric for dialogue breakdown detection in dialogue breakdown detection challenge 3 for English and Japanese, although NMD(NB,PB,B) and MSE(NB,PB,B) were found appropriate specifically for English and Japanese, respectively.
著者
立石 健二 福島 俊一 小林 のぞみ 高橋 哲朗 藤田 篤 乾 健太郎 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2004, no.93, pp.1-8, 2004-09-16
被引用文献数
14

本稿では、Web文書から意見を抽出し、それらをレーダーチャートの形式で要約/視覚化する意見抽出分類システムを提案する。Webの意見は、商品購入の際の情報収集、市場調査等のマーケティング、企業のリスク管理等、さまざまな目的での利用が考えられる。Webの意見の収集/分析に関する研究には2つの課題がある、対象とするWeb文書から意見に該当する箇所を抽出すること、抽出した意見を要約/視覚化することである。本システムは、この2つの課題を3つ組{対象物 属性 評価}のモデルと情報抽出の手法を用いて解決する。本システムを車に関するレビューサイトの100記事を対象として評価したところ抽出精度が適合率82% 再現率52%であり、システムが出力したレーダーチャートと人手で作成したレーダーチャートが類似することを確認した。This paper proposes an opinion extraction and classification system, which extracts people's opinions from Web documents and summarize/visualizes them in the form of "radar charts". People's opinions on the Internet are available for many purposes such as surveys before purchasing products, market research and risk management for enterprises. There are two issues on this area. One is to locate opinion sentences from Web documents, and the other is to summarize/visualize the extracted opinions. The proposed system solves them by employing an opinion model {object name, attribute expression, evaluative expression} and information extraction techniques. The experimental result conducted with 100 articles on the car domain showed that the system performed 82% on precision and 52% on recall, and that both radar charts created by the system and by the hand are similar to each other.