著者
成松 宏美 杉山 弘晃 菊井 玄一郎 平 博順 的場 成紀 東中 竜一郎
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.3C4J901, 2019 (Released:2019-06-01)

我々は,「ロボットは東大に入れるか?」プロジェクトにおいて英語問題に取り組んでいる.本稿では,不要文除去問題に着目し,本問題に対して,近年あらゆるタスクで最高スコアを達成したBERTを適用する.BERTをどのように解法に適用するかを紹介し,ベースラインを超えて最高スコアに到達したことを示す.さらに,エラー分析により,BERTでできていないことを明らかにする.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる.具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す.今回,30%の正解率を44%まで改善することができた.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回全国大会(2018)
巻号頁・発行日
pp.2C102, 2018 (Released:2018-07-30)

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる. 具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた 深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す. 今回,30%の正解率を44%まで改善することができた.
著者
水上 雅博 杉山 弘晃 有本 庸浩 東中 竜一郎 光田 航 小林 哲生
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.38, no.3, pp.B-MA2_1-14, 2023-05-01 (Released:2023-05-01)
参考文献数
18
被引用文献数
2

Local governments have high expectations for dialogue systems that provide residents and visitors with dialogue on multiple tasks, such as tourist information, town office information, and daily life information. In addition, there is also an expectation for such dialogue systems to be given the personalities of characters possessed by local governments and to provide chat dialogues for residents. However, to give the personality of a character to the dialogue system, task dialogue data and dialogue manager that reflect the personality are essential. Based on the study of role play-based question-answering dialogue systems that reproduce characters, we propose a method for collecting dialogue data that enables task dialogue and a method of dialogue manager and response selection that facilitates task dialogue. We constructed a dialogue system that imitated a certain local government character using the proposed method and evaluated its effectiveness through a laboratory experiment and demonstration experiment. The results showed that our dialogue system had statistically better performance in both task-oriented dialogue and chat oriented one.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 大和 淳司
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第31回全国大会(2017)
巻号頁・発行日
pp.2H21, 2017 (Released:2018-07-30)

「ロボットは東大に入れるか」プロジェクトにおける英語科目の到達点と今後の課題について説明する.現状,短文問題については高精度に正解しつつも,複数文からなる問題(複数文問題)については深層学習などの手法を適用しても精度が伸び悩んでいる.本稿では,短文問題における成績向上のポイント,そして,複数文問題の難しさについて触れ,複数文問題・長文問題の解決に向けた今後の方向性を示す.
著者
光田 航 東中 竜一郎 李 廷軒 杉山 弘晃 水上 雅博 中村 竜太 安達 敬武 川端 秀寿 吉田 仙 杵渕 哲也
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.30, no.4, pp.1172-1205, 2023 (Released:2023-12-15)
参考文献数
53

本研究では,単一の人物の大規模な対話データを大規模言語モデルと組み合わせることで,対象人物を再現するチャットボット(なりきりAI)を構築した.さらに,構築したチャットボットの公開実験とそのエラー分析を行うことで,現状の到達点と問題を調査した.その結果,構築されたチャットボットは高い自然さとキャラクタらしさを持つことが明らかになった.さらに,対象人物を再現するチャットボットのエラーは,属性に関するエラーと関係に関するエラーに分けられ,また,自己に関するエラーと他者に関するエラーに分けられることが明らかになった.
著者
松崎 拓也 横野 光 宮尾 祐介 川添 愛 狩野 芳伸 加納 隼人 佐藤 理史 東中 竜一郎 杉山 弘晃 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 新井 紀子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.119-159, 2016-01-25 (Released:2016-04-25)
参考文献数
35

「ロボットは東大に入れるか」は,大学入試試験問題を計算機で解くという挑戦を通じ,言語処理を含む AI 諸技術の再統合と,知的情報処理の新たな課題の発見を目指すプロジェクトである.知的能力の測定を第一目的として設計された入試問題は,AI 技術の恰好のベンチマークであるとともに,人間の受験者と機械のエラー傾向を直接比較することが可能である.本稿では,大手予備校主催のセンター試験形式模試を主たる評価データとして,各科目の解答システムのエラーを分析し,高得点へ向けた今後の課題を明らかにするとともに,分野としての言語処理全体における現在の課題を探る.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 大和 淳司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

「ロボットは東大に入れるか」プロジェクトにおける英語科目の到達点と今後の課題について説明する.現状,短文問題については高精度に正解しつつも,複数文からなる問題(複数文問題)については深層学習などの手法を適用しても精度が伸び悩んでいる.本稿では,短文問題における成績向上のポイント,そして,複数文問題の難しさについて触れ,複数文問題・長文問題の解決に向けた今後の方向性を示す.
著者
水上 雅博 東中 竜一郎1 2 川端 秀寿 山口 絵美 安達 敬武 杉山 弘晃
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

用例データ収集は雑談対話システムで最も重要なタスクの一つであり,用例データを効率よく収集するための手法がいくつも提案されている.そのうちの一つに,なりきり質問応答と呼ばれる一貫性のある用例データを収集する枠組みが提案されている.なりきり質問応答によって得られた用例データは,特にキャラクタづけされた雑談対話システムの構築において非常に有用であるが,集められたデータのみでなく,より幅広い質問文や発話文に対する応答文を収集することで,さらなる性能の向上が期待できる.そこで本研究では,なりきり質問応答で集められた用例データをもとに,応答文の一貫性を保持したまま,より多様な質問文や発話文と,なりきり質問応答の応答文が付いとなった大規模な用例へと拡張する手法を提案する.
著者
杉山 弘晃 目黒 豊美 東中 竜一郎 南 泰浩
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.1, pp.183-194, 2015-01-06 (Released:2015-01-06)
参考文献数
18
被引用文献数
1 1

The development of open-domain conversational systems is difficult since user utterances are too flexible for such systems to respond properly. To address this flexibility, previous research on conversational systems has selected system utterances from web articles based on word-level similarity with user utterances; however, the generated utterances, which originally appeared in different contexts from the conversation, are likely to contain irrelevant information with respect to the input user utterance. To leverage the variety of web corpus in order to respond to the flexibility and suppress the irrelevant information simultaneously, we propose an approach that generates system utterances with two strongly related phrase pairs: one that composes the user utterance and another that has a dependency relation to the former. By retrieving the latter one from the web, our approach can generate system utterances that are related to the topics of user utterances. We examined the effectiveness of our approach with following two experiments. The first experiment, which examined the appropriateness of response utterances, showed that our proposed approach significantly outperformed other retrieval and rule-based approaches. The second one was a chat experiment with people, which showed that our approach demonstrated almost equal performance to a rule-based approach and outperformed other retrieval-based approaches.
著者
藤田 早苗 小林 哲生 南 泰浩 杉山 弘晃
出版者
日本認知科学会
雑誌
認知科学 (ISSN:13417924)
巻号頁・発行日
vol.22, no.4, pp.604-620, 2015-12-01 (Released:2016-06-01)
参考文献数
30
被引用文献数
7

We aim to create gradual readability (or target age) measures from infants to elder children. For Japanese texts, several readability measures have been proposed, none of which is applied to texts for infants. Therefore, in this paper, we employ 123 pic-ture books which are clearly decided fine-grained target ages as criterial corpus. Then we investigate the applicability of two previous works to these picture books. Both works show modelate performance. Then we propose a method using new learner and features, and we achieved higher performance to guess the target age.
著者
北条 伸克 井島 勇祐 杉山 弘晃 宮崎 昇 川西 隆仁 柏野 邦夫
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.35, no.2, pp.A-J81_1-17, 2020-03-01 (Released:2020-03-01)
参考文献数
46

This paper aims at improving naturalness of synthesized speech generated by a text-to-speech (TTS) systemwithin a spoken dialogue system with respect to “how natural the system’s intention is perceived via the synthesizedspeech”. We call this measure “illocutionary act naturalness” in this paper. To achieve this aim, we propose toutilize dialogue-act (DA) information as an auxiliary feature for a deep neural network (DNN)-based speech synthesissystem. First, we construct a speech database with DA tags. Second, we build the proposed DNN-based speechsynthesis system based on the database. Then, we evaluate the proposed method by comparing its performance withtwo conventional hidden Markov model (HMM)-based speech synthesis systems, namely, the style-mixed modelingmethod and the style adaptation method. The objective evaluation results show that the proposed method overwhelmsthe style-mixed modeling method in the accuracy of reproduction of global prosodic characteristics of dialogue-acts.They also reveal that the proposed method overwhelms the style adaptation method in the accuracy of reproduction of sentence final tone characteristics of dialogue-acts. The subjective evaluation results also show that the proposed method improves the illocutionary act naturalness compared with the two conventional methods.
著者
杉山 弘晃 目黒 豊美 吉川 雄一郎 大和 淳司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

現在の雑談対話システムでは、雑談で観測される幅広い話題の間の連続性を正しく認識することが容易でないため、文脈とつながらない話題を発話し対話を破綻させてしまう問題がある。一方、ロボットを複数体化することで、ユーザ発話中の話題に対する応答義務が緩和されるため、話題の連続性に対する要求を低減させ、破綻を回避できると予想される。本研究では、このロボット複数体化による対話破綻回避効果について分析を行う。
著者
杉山 弘晃 南 泰浩
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J95-A, no.1, pp.74-84, 2012-01-01

本研究では,ユーザへ情報を提示するシステムのための,ユーザの潜在的な情報要求の推定に基づく新たな情報提示タイミング決定方策を提案する.この方策により,システムは早過ぎる情報提示を抑制し,ユーザへ煩わしさを感じさせることなく主体的に情報提示することが可能になる.本研究ではこの方策におけるマルチモーダル情報の寄与を検証するため,最初に人と人のインタラクション実験を行い,利用可能なモダリティが変化したときの人が行う情報要求推定精度の変化について分析する.分析を通して,人はマルチモーダル情報を利用できないときは対話の流れを利用し,利用可能なときはマルチモーダル情報を利用することが示された.この結果をもとに,人の情報要求推定を実現するためのモデルを提案し,ユーザの潜在的な情報要求を表出させるよう設計した連想クイズ対話実験を通してその有効性を示す.
著者
森脇 恵太 大野 瞬 杉山 弘晃 酒造 正樹 前田 英作
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.2L1GS204, 2022 (Released:2022-07-11)

本研究では,事実不整合検出の為の分類モデルと事実不整合修正の為の生成モデルとを組み合わせて,文章に含まれる事実不整合の修正を行い,ニューラルネットを用いた文章生成モデルの出力に事実不整合が含まれることを防ぐことを目的とする. 検出,修正モデルの学習には文章生成を行うモデルの学習データセットを改変した人工的なデータセットを用いる. 修正モデルのみを用いた場合と比較を行った結果,検出モデルを入れることで修正モデルによる整合文から不整合文への書き換えを防ぎつつ,事実不整合を含む文章の書き換えを行うことができることが示された. しかし,二つのモデルの解決可能,不可能な問題に同様の傾向が見られた. より性能を上げるために,それぞれのモデルが相補的に働くことができるような学習データを用意する必要があると考える.
著者
金田 龍平 芳賀 大地 杉山 弘晃 酒造 正樹 前田 英作
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.2L1GS203, 2022 (Released:2022-07-11)

ニューラル言語生成技術の進展により, 雑談などの非タスク指向型対話においてより自然な発話生成が可能になりつつある. そして,自然且つ多様な発話生成を実現するためには,それまでの発話履歴を参照するだけでなく 適切な外部知識を参照して,発話文生成を行うことが必要となる. このとき外部知識として, タスク指向型対話で用いられる構造化された情報(例えば旅行案内対話における料金・アクセス等)に加え BlogやWikipediaに代表される非構造化情報(同口コミテキスト等)の活用が期待される. しかしながら,構造化/非構造化情報の混在下において 文脈に応じて適切な外部知識を選択することは必ずしも容易ではない. そこで本研究では,BERTを利用した発話生成のための知識選択手法について検討を行い, 旅行案内ドメインを事例としてとりあげ, 適切な知識選択のための入力情報について検討を行った