著者
成松 宏美 杉山 弘晃 菊井 玄一郎 平 博順 的場 成紀 東中 竜一郎
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.3C4J901, 2019 (Released:2019-06-01)

我々は,「ロボットは東大に入れるか?」プロジェクトにおいて英語問題に取り組んでいる.本稿では,不要文除去問題に着目し,本問題に対して,近年あらゆるタスクで最高スコアを達成したBERTを適用する.BERTをどのように解法に適用するかを紹介し,ベースラインを超えて最高スコアに到達したことを示す.さらに,エラー分析により,BERTでできていないことを明らかにする.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる.具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す.今回,30%の正解率を44%まで改善することができた.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回全国大会(2018)
巻号頁・発行日
pp.2C102, 2018 (Released:2018-07-30)

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる. 具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた 深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す. 今回,30%の正解率を44%まで改善することができた.
著者
水上 雅博 杉山 弘晃 有本 庸浩 東中 竜一郎 光田 航 小林 哲生
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.38, no.3, pp.B-MA2_1-14, 2023-05-01 (Released:2023-05-01)
参考文献数
18
被引用文献数
2

Local governments have high expectations for dialogue systems that provide residents and visitors with dialogue on multiple tasks, such as tourist information, town office information, and daily life information. In addition, there is also an expectation for such dialogue systems to be given the personalities of characters possessed by local governments and to provide chat dialogues for residents. However, to give the personality of a character to the dialogue system, task dialogue data and dialogue manager that reflect the personality are essential. Based on the study of role play-based question-answering dialogue systems that reproduce characters, we propose a method for collecting dialogue data that enables task dialogue and a method of dialogue manager and response selection that facilitates task dialogue. We constructed a dialogue system that imitated a certain local government character using the proposed method and evaluated its effectiveness through a laboratory experiment and demonstration experiment. The results showed that our dialogue system had statistically better performance in both task-oriented dialogue and chat oriented one.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 大和 淳司
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第31回全国大会(2017)
巻号頁・発行日
pp.2H21, 2017 (Released:2018-07-30)

「ロボットは東大に入れるか」プロジェクトにおける英語科目の到達点と今後の課題について説明する.現状,短文問題については高精度に正解しつつも,複数文からなる問題(複数文問題)については深層学習などの手法を適用しても精度が伸び悩んでいる.本稿では,短文問題における成績向上のポイント,そして,複数文問題の難しさについて触れ,複数文問題・長文問題の解決に向けた今後の方向性を示す.
著者
東中 竜一郎 荒木 雅弘 塚原 裕史 水上 雅博
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.29, no.2, pp.443-466, 2022 (Released:2022-06-15)
参考文献数
43

本稿では,雑談対話システムにおける対話破綻を生じさせる発話の類型を提案する.対話破綻の類型に関して先行研究では,「理論に基づいた類型」と「データに基づいた類型」が提案されてきた.前者は,依拠している人どうしの対話についての理論が,雑談対話システムの対話破綻現象を捉えるのに適さないことが多いという問題点がある.後者は,データを取得したシステムの対話破綻にしか対応できないという限界がある.本稿では,これら二つの類型の問題点をそれぞれが補い合う形で統合し,雑談対話システムにおける対話破綻を生じさせる発話の類型を新しく作成した.対話破綻類型アノテーション実験の結果,この統合的な類型は以前に提案された類型と比較して,Fleiss の κ 値において高い一致率を達成し,安定したアノテーションが行えることがわかった.
著者
東中 竜一郎 光田 航
雑誌
情報処理
巻号頁・発行日
vol.62, no.10, pp.e24-e31, 2021-09-15

人間と会話を行うコンピュータのことを対話システムと呼ぶ.スマートフォン上の音声エージェントやスマートスピーカが一般に普及し,対話システムは,より身近なものとなってきた.本稿では,ここ1年の対話システムに関する論文のサーベイに基づき,現在の対話システム研究を概観する.そして「対話システムでは今何が問題になっているのか」について述べる.
著者
光田 航 東中 竜一郎 李 廷軒 杉山 弘晃 水上 雅博 中村 竜太 安達 敬武 川端 秀寿 吉田 仙 杵渕 哲也
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.30, no.4, pp.1172-1205, 2023 (Released:2023-12-15)
参考文献数
53

本研究では,単一の人物の大規模な対話データを大規模言語モデルと組み合わせることで,対象人物を再現するチャットボット(なりきりAI)を構築した.さらに,構築したチャットボットの公開実験とそのエラー分析を行うことで,現状の到達点と問題を調査した.その結果,構築されたチャットボットは高い自然さとキャラクタらしさを持つことが明らかになった.さらに,対象人物を再現するチャットボットのエラーは,属性に関するエラーと関係に関するエラーに分けられ,また,自己に関するエラーと他者に関するエラーに分けられることが明らかになった.
著者
松崎 拓也 横野 光 宮尾 祐介 川添 愛 狩野 芳伸 加納 隼人 佐藤 理史 東中 竜一郎 杉山 弘晃 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 新井 紀子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.119-159, 2016-01-25 (Released:2016-04-25)
参考文献数
35

「ロボットは東大に入れるか」は,大学入試試験問題を計算機で解くという挑戦を通じ,言語処理を含む AI 諸技術の再統合と,知的情報処理の新たな課題の発見を目指すプロジェクトである.知的能力の測定を第一目的として設計された入試問題は,AI 技術の恰好のベンチマークであるとともに,人間の受験者と機械のエラー傾向を直接比較することが可能である.本稿では,大手予備校主催のセンター試験形式模試を主たる評価データとして,各科目の解答システムのエラーを分析し,高得点へ向けた今後の課題を明らかにするとともに,分野としての言語処理全体における現在の課題を探る.
著者
宮崎 千明 平野 徹 東中 竜一郎 牧野 俊朗 松尾 義博 佐藤 理史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
pp.DSF-515, (Released:2015-12-15)
参考文献数
13

Characterizing dialogue system utterances is important in making human-computer interaction systems more friendly and human-like. A method is described for achieving this by converting functional expressions according to their generation probabilities, which are calculated for specific characters. Experimental results show that the method can add characteristics of the target profiles (i.e., gender, age and closeness with a conversation partner) to dialogue system utterances and in so doing can generate a large variety of linguistic expressions.
著者
東中 竜一郎|古川 忠延
雑誌
人工知能
巻号頁・発行日
vol.31, no.6, 2016-11-01
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 大和 淳司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

「ロボットは東大に入れるか」プロジェクトにおける英語科目の到達点と今後の課題について説明する.現状,短文問題については高精度に正解しつつも,複数文からなる問題(複数文問題)については深層学習などの手法を適用しても精度が伸び悩んでいる.本稿では,短文問題における成績向上のポイント,そして,複数文問題の難しさについて触れ,複数文問題・長文問題の解決に向けた今後の方向性を示す.
著者
水上 雅博 東中 竜一郎1 2 川端 秀寿 山口 絵美 安達 敬武 杉山 弘晃
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

用例データ収集は雑談対話システムで最も重要なタスクの一つであり,用例データを効率よく収集するための手法がいくつも提案されている.そのうちの一つに,なりきり質問応答と呼ばれる一貫性のある用例データを収集する枠組みが提案されている.なりきり質問応答によって得られた用例データは,特にキャラクタづけされた雑談対話システムの構築において非常に有用であるが,集められたデータのみでなく,より幅広い質問文や発話文に対する応答文を収集することで,さらなる性能の向上が期待できる.そこで本研究では,なりきり質問応答で集められた用例データをもとに,応答文の一貫性を保持したまま,より多様な質問文や発話文と,なりきり質問応答の応答文が付いとなった大規模な用例へと拡張する手法を提案する.
著者
杉山 弘晃 目黒 豊美 東中 竜一郎 南 泰浩
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.1, pp.183-194, 2015-01-06 (Released:2015-01-06)
参考文献数
18
被引用文献数
1 1

The development of open-domain conversational systems is difficult since user utterances are too flexible for such systems to respond properly. To address this flexibility, previous research on conversational systems has selected system utterances from web articles based on word-level similarity with user utterances; however, the generated utterances, which originally appeared in different contexts from the conversation, are likely to contain irrelevant information with respect to the input user utterance. To leverage the variety of web corpus in order to respond to the flexibility and suppress the irrelevant information simultaneously, we propose an approach that generates system utterances with two strongly related phrase pairs: one that composes the user utterance and another that has a dependency relation to the former. By retrieving the latter one from the web, our approach can generate system utterances that are related to the topics of user utterances. We examined the effectiveness of our approach with following two experiments. The first experiment, which examined the appropriateness of response utterances, showed that our proposed approach significantly outperformed other retrieval and rule-based approaches. The second one was a chat experiment with people, which showed that our approach demonstrated almost equal performance to a rule-based approach and outperformed other retrieval-based approaches.
著者
光田 航 東中 竜一郎 富田 準二
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.35, no.1, pp.DSI-E_1-10, 2020-01-01 (Released:2020-01-01)
参考文献数
27

Understanding the various information from user utterances is important for chat-oriented dialogue systems. However, no study has yet clarified the types of information that should be understood by such systems. With this purpose in mind, we first collected information that humans perceive from each utterance (perceived information) in chat-oriented dialogue. We then categorized the types of perceived information. The types were evaluated on the basis of inter-annotator agreement, which showed substantial agreement and demonstrated the validity of our categorization. To the best of our knowledge, this study is the first attempt to clarify the types of information that a chat-oriented dialogue system should understand from varied user utterances.
著者
宮崎 千明 平野 徹 東中 竜一郎 牧野 俊朗 松尾 義博 佐藤 理史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.1, pp.DSF-E_1-9, 2016-01-06 (Released:2016-01-08)
参考文献数
13

Characterizing dialogue system utterances is important in making human-computer interaction systems more friendly and human-like. A method is described for achieving this by converting functional expressions according to their generation probabilities, which are calculated for specific characters. Experimental results show that the method can add characteristics of the target profiles (i.e., gender, age and closeness with a conversation partner) to dialogue system utterances and in so doing can generate a large variety of linguistic expressions.
著者
東中 竜一郎 船越 孝太郎 荒木 雅弘 塚原 裕史 小林 優佳 水上 雅博
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.59-86, 2016-01-25 (Released:2016-04-25)
参考文献数
32
被引用文献数
6

対話システムが扱う対話は大きく課題指向対話と非課題指向対話(雑談対話)に分けられるが,近年Webからの自動知識獲得が可能になったことなどから,雑談対話への関心が高まってきている.課題指向対話におけるエラーに関しては一定量の先行研究が存在するが,雑談対話に関するエラーの研究はまだ少ない.対話システムがエラーを起こせば対話の破綻が起こり,ユーザが円滑に対話を継続することができなくなる.しかし複雑かつ多様な内部構造を持つ対話システムの内部で起きているエラーを直接分析することは容易ではない.そこで我々はまず,音声誤認識の影響を受けないテキストチャットにおける雑談対話の表層に注目し,破綻の類型化に取り組んだ.本論文では,雑談対話における破綻の類型化のために必要な人・機械間の雑談対話コーパスの構築について報告し,コーパスに含まれる破綻について分析・議論する.