著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる.具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す.今回,30%の正解率を44%まで改善することができた.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
一般社団法人 人工知能学会
巻号頁・発行日
pp.2C102, 2018 (Released:2018-07-30)

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる. 具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた 深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す. 今回,30%の正解率を44%まで改善することができた.
著者
松崎 拓也 横野 光 宮尾 祐介 川添 愛 狩野 芳伸 加納 隼人 佐藤 理史 東中 竜一郎 杉山 弘晃 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 新井 紀子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.119-159, 2016-01-25 (Released:2016-04-25)
参考文献数
35

「ロボットは東大に入れるか」は,大学入試試験問題を計算機で解くという挑戦を通じ,言語処理を含む AI 諸技術の再統合と,知的情報処理の新たな課題の発見を目指すプロジェクトである.知的能力の測定を第一目的として設計された入試問題は,AI 技術の恰好のベンチマークであるとともに,人間の受験者と機械のエラー傾向を直接比較することが可能である.本稿では,大手予備校主催のセンター試験形式模試を主たる評価データとして,各科目の解答システムのエラーを分析し,高得点へ向けた今後の課題を明らかにするとともに,分野としての言語処理全体における現在の課題を探る.
著者
宮崎 千明 平野 徹 東中 竜一郎 牧野 俊朗 松尾 義博 佐藤 理史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
pp.DSF-515, (Released:2015-12-15)
参考文献数
13

Characterizing dialogue system utterances is important in making human-computer interaction systems more friendly and human-like. A method is described for achieving this by converting functional expressions according to their generation probabilities, which are calculated for specific characters. Experimental results show that the method can add characteristics of the target profiles (i.e., gender, age and closeness with a conversation partner) to dialogue system utterances and in so doing can generate a large variety of linguistic expressions.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 大和 淳司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

「ロボットは東大に入れるか」プロジェクトにおける英語科目の到達点と今後の課題について説明する.現状,短文問題については高精度に正解しつつも,複数文からなる問題(複数文問題)については深層学習などの手法を適用しても精度が伸び悩んでいる.本稿では,短文問題における成績向上のポイント,そして,複数文問題の難しさについて触れ,複数文問題・長文問題の解決に向けた今後の方向性を示す.
著者
東中 竜一郎 船越 孝太郎 荒木 雅弘 塚原 裕史 小林 優佳 水上 雅博
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.59-86, 2016-01-25 (Released:2016-04-25)
参考文献数
32

対話システムが扱う対話は大きく課題指向対話と非課題指向対話(雑談対話)に分けられるが,近年Webからの自動知識獲得が可能になったことなどから,雑談対話への関心が高まってきている.課題指向対話におけるエラーに関しては一定量の先行研究が存在するが,雑談対話に関するエラーの研究はまだ少ない.対話システムがエラーを起こせば対話の破綻が起こり,ユーザが円滑に対話を継続することができなくなる.しかし複雑かつ多様な内部構造を持つ対話システムの内部で起きているエラーを直接分析することは容易ではない.そこで我々はまず,音声誤認識の影響を受けないテキストチャットにおける雑談対話の表層に注目し,破綻の類型化に取り組んだ.本論文では,雑談対話における破綻の類型化のために必要な人・機械間の雑談対話コーパスの構築について報告し,コーパスに含まれる破綻について分析・議論する.
著者
杉山 弘晃 目黒 豊美 東中 竜一郎 南 泰浩
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.1, pp.183-194, 2015-01-06 (Released:2015-01-06)
参考文献数
18
被引用文献数
1

The development of open-domain conversational systems is difficult since user utterances are too flexible for such systems to respond properly. To address this flexibility, previous research on conversational systems has selected system utterances from web articles based on word-level similarity with user utterances; however, the generated utterances, which originally appeared in different contexts from the conversation, are likely to contain irrelevant information with respect to the input user utterance. To leverage the variety of web corpus in order to respond to the flexibility and suppress the irrelevant information simultaneously, we propose an approach that generates system utterances with two strongly related phrase pairs: one that composes the user utterance and another that has a dependency relation to the former. By retrieving the latter one from the web, our approach can generate system utterances that are related to the topics of user utterances. We examined the effectiveness of our approach with following two experiments. The first experiment, which examined the appropriateness of response utterances, showed that our proposed approach significantly outperformed other retrieval and rule-based approaches. The second one was a chat experiment with people, which showed that our approach demonstrated almost equal performance to a rule-based approach and outperformed other retrieval-based approaches.
著者
水上 雅博 東中 竜一郎1 2 川端 秀寿 山口 絵美 安達 敬武 杉山 弘晃
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

用例データ収集は雑談対話システムで最も重要なタスクの一つであり,用例データを効率よく収集するための手法がいくつも提案されている.そのうちの一つに,なりきり質問応答と呼ばれる一貫性のある用例データを収集する枠組みが提案されている.なりきり質問応答によって得られた用例データは,特にキャラクタづけされた雑談対話システムの構築において非常に有用であるが,集められたデータのみでなく,より幅広い質問文や発話文に対する応答文を収集することで,さらなる性能の向上が期待できる.そこで本研究では,なりきり質問応答で集められた用例データをもとに,応答文の一貫性を保持したまま,より多様な質問文や発話文と,なりきり質問応答の応答文が付いとなった大規模な用例へと拡張する手法を提案する.
著者
寺岡 丈博 東中 竜一郎 岡本 潤 石崎 俊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.28, no.3, pp.335-346, 2013 (Released:2013-04-12)
参考文献数
28

Metonymy is a figure of speech, where one item's name represents another item which usually has a close relation with the first one. Metonymic expressions need to be correctly detected and interpreted because sentences including such expressions have different meanings from literal ones; computer systems may output inappropriate results in natural language processing. In previous studies, detecting metonymies has been done mainly by taking one of the following two approaches: rule-based approach and statistical one. The former uses semantic networks and rules to interpret metonymy. The latter uses corpus-based metonymy resolution with machine learning techniques. One of the problems of the current metonymy detection is that using mainly syntactic and semantic information may not be enough to detect metonymic expressions because it has been pointed out that metonymic expressions have relations to associative relations between words. In this paper, we propose an associative approach for detecting them. By using associative information between words in a sentence, we train a decision tree to detect metonymic expressions in a sentence. We evaluated our method by comparing with four baseline methods based on previous studies that use a thesaurus or co-occurrence information. Experimental results show that our method has significantly better accuracy (0.83) of judging metonymic expressions than those of the baselines. It also achieves better recall (0.73), precision (0.85), and F-measure (0.79) in detecting Japanese metonymic expressions, achieving state-of-the-art performance.
著者
宮崎 千明 平野 徹 東中 竜一郎 牧野 俊朗 松尾 義博 佐藤 理史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.1, pp.DSF-E_1-9, 2016-01-06 (Released:2016-01-08)
参考文献数
13

Characterizing dialogue system utterances is important in making human-computer interaction systems more friendly and human-like. A method is described for achieving this by converting functional expressions according to their generation probabilities, which are calculated for specific characters. Experimental results show that the method can add characteristics of the target profiles (i.e., gender, age and closeness with a conversation partner) to dialogue system utterances and in so doing can generate a large variety of linguistic expressions.
著者
東中 竜一郎 船越 孝太郎
雑誌
情報処理
巻号頁・発行日
vol.57, no.1, pp.42-43, 2015-12-15

我々は Project Next NLP対話タスクの営みとして,対話システム,特に,雑談を行う対話システムのエラー分析を行った.具体的には,雑談対話コーパスを収集し,対話破綻個所を特定し,これらの対話破綻個所がどのようなシステムのエラーによって引き起こされたかを分析・類型化した.本稿では,我々が本分析に至った背景や得られた知見について解説する.
著者
杉山 弘晃 目黒 豊美 東中 竜一郎
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
pp.DSF-518, (Released:2015-12-15)
参考文献数
15

In conversational dialogue, a talker sometimes asks questions that relate to the other talker's personality, such as his/her favorites and experiences. This behavior also appears in conversational dialogues with a dialogue system; therefore, the system should be developed so that it responds to this kind of questions. Previous systems realized this function by creating question-answer pairs by hand. However, there is no work that examines the coverage of the created question-answer pairs over real conversations. This study analyzes a huge amount of question-answer pairs created by many question-generators, with one answer-generator for each character. Our analysis shows that 41% of personality questions that appeared in real conversations are covered by the created pairs. We also investigated the types of questions that are frequently asked.
著者
目黒 豊美 杉山 弘晃 東中 竜一郎 南 泰浩
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

人手で構築した発話生成ルールを用いる手法と,ユーザ発話の内容と係り受け関 にある内容を大量のテキストデータから抽出し発話生成に用いる統計的手法と の組み合わせに基づく対話システムの構築法を提案する.具体的には,二手法 が生成した発話から適切な発話を選択する手法を考案した.実験を通して本システ の有用性と課題を議論する.
著者
東中 竜一郎
雑誌
情報処理
巻号頁・発行日
vol.55, no.9, pp.904-907, 2014-08-15
著者
森田 一 奥村 学 東中 竜一郎 松尾 義博
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 自然言語処理研究会報告
巻号頁・発行日
vol.2012, no.3, pp.1-6, 2012-11-15

Twitter 上の対話はチャットのログ等とは異なり,発話にはリプライやリツイートといった明示的な形で他の発話と関連していることを示す情報が含まれる場合がある.そのため,これらの情報を積極的に利用することが Twitter 上の発話間の関係を同定する際には重要となる.関係の同定によく用いられている Markov Logic Network (MLN) 上で Twitter 特有の情報を利用し,発話間の関係の有無とその種類の同定を行うモデルを提案する.一方,発話系列には長さに制限がなく非常に長い対話となることもしばしば存在する.このような長い発話に MLN を適用する際に, MLN が大きな問題に対しては計算が困難であることが問題となる.本稿では MLN に対して SVM における動的素性に対応する動的述語を導入することにより,分割した系列に対して近似的に推論が行えるように MLN に対して拡張を行う.
著者
堂坂 浩二 奥 梓 東中 竜一郎 南 泰浩 前田 英作
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.25, 2011

対話ロボットがユーザの思考を喚起することにより,コミュニケーションを活 性化する思考喚起型対話の研究を進めている.そうした対話では,ロボットが 対話状況に応じて適応的に話題を選択することにより,ユーザ対話意欲を向上 させることが重要となる.本研究では,思考喚起型対話において,ロボットの 選択話題に対するユーザ反応等の対話状況とユーザ対話意欲の間の関係を分析 した結果について報告する.
著者
川中 翔 宮田 章裕 東中 竜一郎 星出 高秀 藤村 考
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.25, 2011

レビュー記事を用いてブランド間の競合関係を分析する手法を提案する.提案手法は,要因語出現分布の類似度を用いてブランド間の競合度を計算する.なお,本稿では,消費行動実施の決断にポジティブな影響を与えた事象や状態,条件を要因と定義し,個別の要因を抽象的に表現する語を要因語と定義する.提案手法はブランドペア毎に,Belkの消費者場面フレームワークに基づく5つの異なる競合度を計算する.