著者
成松 宏美 杉山 弘晃 菊井 玄一郎 平 博順 的場 成紀 東中 竜一郎
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.3C4J901, 2019 (Released:2019-06-01)

我々は,「ロボットは東大に入れるか?」プロジェクトにおいて英語問題に取り組んでいる.本稿では,不要文除去問題に着目し,本問題に対して,近年あらゆるタスクで最高スコアを達成したBERTを適用する.BERTをどのように解法に適用するかを紹介し,ベースラインを超えて最高スコアに到達したことを示す.さらに,エラー分析により,BERTでできていないことを明らかにする.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる.具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す.今回,30%の正解率を44%まで改善することができた.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 喜多 智也 南 泰浩 風間 健流 大和 淳司
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回全国大会(2018)
巻号頁・発行日
pp.2C102, 2018 (Released:2018-07-30)

「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる. 具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた 深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す. 今回,30%の正解率を44%まで改善することができた.
著者
水上 雅博 杉山 弘晃 有本 庸浩 東中 竜一郎 光田 航 小林 哲生
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.38, no.3, pp.B-MA2_1-14, 2023-05-01 (Released:2023-05-01)
参考文献数
18
被引用文献数
2

Local governments have high expectations for dialogue systems that provide residents and visitors with dialogue on multiple tasks, such as tourist information, town office information, and daily life information. In addition, there is also an expectation for such dialogue systems to be given the personalities of characters possessed by local governments and to provide chat dialogues for residents. However, to give the personality of a character to the dialogue system, task dialogue data and dialogue manager that reflect the personality are essential. Based on the study of role play-based question-answering dialogue systems that reproduce characters, we propose a method for collecting dialogue data that enables task dialogue and a method of dialogue manager and response selection that facilitates task dialogue. We constructed a dialogue system that imitated a certain local government character using the proposed method and evaluated its effectiveness through a laboratory experiment and demonstration experiment. The results showed that our dialogue system had statistically better performance in both task-oriented dialogue and chat oriented one.
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 大和 淳司
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第31回全国大会(2017)
巻号頁・発行日
pp.2H21, 2017 (Released:2018-07-30)

「ロボットは東大に入れるか」プロジェクトにおける英語科目の到達点と今後の課題について説明する.現状,短文問題については高精度に正解しつつも,複数文からなる問題(複数文問題)については深層学習などの手法を適用しても精度が伸び悩んでいる.本稿では,短文問題における成績向上のポイント,そして,複数文問題の難しさについて触れ,複数文問題・長文問題の解決に向けた今後の方向性を示す.
著者
光田 航 東中 竜一郎 李 廷軒 杉山 弘晃 水上 雅博 中村 竜太 安達 敬武 川端 秀寿 吉田 仙 杵渕 哲也
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.30, no.4, pp.1172-1205, 2023 (Released:2023-12-15)
参考文献数
53

本研究では,単一の人物の大規模な対話データを大規模言語モデルと組み合わせることで,対象人物を再現するチャットボット(なりきりAI)を構築した.さらに,構築したチャットボットの公開実験とそのエラー分析を行うことで,現状の到達点と問題を調査した.その結果,構築されたチャットボットは高い自然さとキャラクタらしさを持つことが明らかになった.さらに,対象人物を再現するチャットボットのエラーは,属性に関するエラーと関係に関するエラーに分けられ,また,自己に関するエラーと他者に関するエラーに分けられることが明らかになった.
著者
松崎 拓也 横野 光 宮尾 祐介 川添 愛 狩野 芳伸 加納 隼人 佐藤 理史 東中 竜一郎 杉山 弘晃 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 新井 紀子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.119-159, 2016-01-25 (Released:2016-04-25)
参考文献数
35

「ロボットは東大に入れるか」は,大学入試試験問題を計算機で解くという挑戦を通じ,言語処理を含む AI 諸技術の再統合と,知的情報処理の新たな課題の発見を目指すプロジェクトである.知的能力の測定を第一目的として設計された入試問題は,AI 技術の恰好のベンチマークであるとともに,人間の受験者と機械のエラー傾向を直接比較することが可能である.本稿では,大手予備校主催のセンター試験形式模試を主たる評価データとして,各科目の解答システムのエラーを分析し,高得点へ向けた今後の課題を明らかにするとともに,分野としての言語処理全体における現在の課題を探る.
著者
坂本 彬 中川 致之 杉山 弘成 堀江 秀樹
出版者
Japanese Society of Tea Science and Technology
雑誌
茶業研究報告 (ISSN:03666190)
巻号頁・発行日
vol.2002, no.94, pp.45-55, 2002-12-31 (Released:2009-07-31)
参考文献数
21
被引用文献数
1 1

1. 煎茶の標準的な入れ方に近い湯温50℃,60℃,70℃,90℃(遊離アミノ酸類は90℃を除く),浸出時間は1煎目が60秒,2煎目,3煎目が10秒間の条件で,主要カテキン類4種,カフェイン,主要遊離アミノ酸類6種がどのように溶出するかを調べた。(1)カテキン類,カフェインは,ともに温度の上昇に伴って溶出量が増加した。カテキン類のうちで遊離型カテキン類は比較的溶出しやすく,エステル型カテキン類は溶出が遅かった。90℃3煎目で前者が90%以上溶出されたのに対し,後者は50%台であった。カフェインは遊離型カテキン類に近い溶出性を示した。(2)アミノ酸類はきわめて溶出されやすく,50~70℃の1煎目で半分近く溶出し,3煎目には,ほとんど100%溶出した。ただし, アルギニンは他のアミノ酸より溶出が遅い傾向にあった。2. 温度を変える入れ方,すなわち1煎目を5℃,10分,2煎目を50℃,1分,3煎目を95℃1分の条件で主要カテキン類4種,カフェイン,主要遊離アミノ酸類6種,ペクチン,カリウム,マグネシウム,カルシウム,リン酸がどのように溶出するかを調べた。(1)遊離型カテキン類は冷水でも比較的溶出しやすく,3煎目までで80~90%が溶出した。一方,エステル型カテキン類は低温では溶出されにくく,熱湯を用いた3煎目で急激に溶出したが,それでも50%程度であった。カフェインは低温でも1煎目で36%程度溶出し,熱湯を用いた3煎目までで84%に達した。(2)アミノ酸類は冷水でもよく溶出したが,アルギニンは他のアミノ酸類より溶出が遅かった。1煎目に冷水を使用する条件でも,アルギニンを除いて2煎目で70~80%が溶出した。(3)ペクチンは溶出しやすく,いずれの形態のものも煎を重ねるに従って段階的に溶出が減少した。(4)カリウムは溶出されやすく,3煎でほとんどが溶出した。マグネシウム,リン酸は煎を重ねるに従って溶出が減少した。ただし,カルシウムは1煎から3煎まで同程度の溶出量であり,溶出割合も3煎までで4%に満たなかった。(5)1煎液の濃厚な甘味,旨味にはアミノ酸類の濃度が高く,ペクチンを多く含むことが,また3煎液の強い苦味にはエステル型カテキン類の濃度の高いことが寄与していると推察される。
著者
東中 竜一郎 杉山 弘晃 成松 宏美 磯崎 秀樹 菊井 玄一郎 堂坂 浩二 平 博順 南 泰浩 大和 淳司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

「ロボットは東大に入れるか」プロジェクトにおける英語科目の到達点と今後の課題について説明する.現状,短文問題については高精度に正解しつつも,複数文からなる問題(複数文問題)については深層学習などの手法を適用しても精度が伸び悩んでいる.本稿では,短文問題における成績向上のポイント,そして,複数文問題の難しさについて触れ,複数文問題・長文問題の解決に向けた今後の方向性を示す.
著者
水上 雅博 東中 竜一郎1 2 川端 秀寿 山口 絵美 安達 敬武 杉山 弘晃
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

用例データ収集は雑談対話システムで最も重要なタスクの一つであり,用例データを効率よく収集するための手法がいくつも提案されている.そのうちの一つに,なりきり質問応答と呼ばれる一貫性のある用例データを収集する枠組みが提案されている.なりきり質問応答によって得られた用例データは,特にキャラクタづけされた雑談対話システムの構築において非常に有用であるが,集められたデータのみでなく,より幅広い質問文や発話文に対する応答文を収集することで,さらなる性能の向上が期待できる.そこで本研究では,なりきり質問応答で集められた用例データをもとに,応答文の一貫性を保持したまま,より多様な質問文や発話文と,なりきり質問応答の応答文が付いとなった大規模な用例へと拡張する手法を提案する.
著者
杉山 弘晃 目黒 豊美 東中 竜一郎 南 泰浩
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.1, pp.183-194, 2015-01-06 (Released:2015-01-06)
参考文献数
18
被引用文献数
1 1

The development of open-domain conversational systems is difficult since user utterances are too flexible for such systems to respond properly. To address this flexibility, previous research on conversational systems has selected system utterances from web articles based on word-level similarity with user utterances; however, the generated utterances, which originally appeared in different contexts from the conversation, are likely to contain irrelevant information with respect to the input user utterance. To leverage the variety of web corpus in order to respond to the flexibility and suppress the irrelevant information simultaneously, we propose an approach that generates system utterances with two strongly related phrase pairs: one that composes the user utterance and another that has a dependency relation to the former. By retrieving the latter one from the web, our approach can generate system utterances that are related to the topics of user utterances. We examined the effectiveness of our approach with following two experiments. The first experiment, which examined the appropriateness of response utterances, showed that our proposed approach significantly outperformed other retrieval and rule-based approaches. The second one was a chat experiment with people, which showed that our approach demonstrated almost equal performance to a rule-based approach and outperformed other retrieval-based approaches.
著者
藤田 早苗 小林 哲生 南 泰浩 杉山 弘晃
出版者
日本認知科学会
雑誌
認知科学 (ISSN:13417924)
巻号頁・発行日
vol.22, no.4, pp.604-620, 2015-12-01 (Released:2016-06-01)
参考文献数
30
被引用文献数
7

We aim to create gradual readability (or target age) measures from infants to elder children. For Japanese texts, several readability measures have been proposed, none of which is applied to texts for infants. Therefore, in this paper, we employ 123 pic-ture books which are clearly decided fine-grained target ages as criterial corpus. Then we investigate the applicability of two previous works to these picture books. Both works show modelate performance. Then we propose a method using new learner and features, and we achieved higher performance to guess the target age.
著者
北条 伸克 井島 勇祐 杉山 弘晃 宮崎 昇 川西 隆仁 柏野 邦夫
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.35, no.2, pp.A-J81_1-17, 2020-03-01 (Released:2020-03-01)
参考文献数
46

This paper aims at improving naturalness of synthesized speech generated by a text-to-speech (TTS) systemwithin a spoken dialogue system with respect to “how natural the system’s intention is perceived via the synthesizedspeech”. We call this measure “illocutionary act naturalness” in this paper. To achieve this aim, we propose toutilize dialogue-act (DA) information as an auxiliary feature for a deep neural network (DNN)-based speech synthesissystem. First, we construct a speech database with DA tags. Second, we build the proposed DNN-based speechsynthesis system based on the database. Then, we evaluate the proposed method by comparing its performance withtwo conventional hidden Markov model (HMM)-based speech synthesis systems, namely, the style-mixed modelingmethod and the style adaptation method. The objective evaluation results show that the proposed method overwhelmsthe style-mixed modeling method in the accuracy of reproduction of global prosodic characteristics of dialogue-acts.They also reveal that the proposed method overwhelms the style adaptation method in the accuracy of reproduction of sentence final tone characteristics of dialogue-acts. The subjective evaluation results also show that the proposed method improves the illocutionary act naturalness compared with the two conventional methods.
著者
杉山 弘晃 目黒 豊美 吉川 雄一郎 大和 淳司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

現在の雑談対話システムでは、雑談で観測される幅広い話題の間の連続性を正しく認識することが容易でないため、文脈とつながらない話題を発話し対話を破綻させてしまう問題がある。一方、ロボットを複数体化することで、ユーザ発話中の話題に対する応答義務が緩和されるため、話題の連続性に対する要求を低減させ、破綻を回避できると予想される。本研究では、このロボット複数体化による対話破綻回避効果について分析を行う。
著者
杉山 弘 斉藤 烈
出版者
京都大学
雑誌
重点領域研究
巻号頁・発行日
1994

本研究は、ブレオマイシン金属錯体による酸素活性化機構をモデル化合物や修飾オリゴヌクレオチドを用いて、有機化学的に詳細に検討し、錯体の構造、DNAの切断の分子機構の本質に迫り、その機能制御を行ない、新しいブレオマイシンを創製することを目的としている。今年度の研究によって以下に示す知見及び成果が得られた。1)ブレオマイシン金属錯体によるDNA切断機構の解明ラジカルの寿命を測定する化学プローブであるラジカルクロックを、ブレオマイシン金属錯体の反応サイトに導入し、それぞれの錯体により生成するラジカルの寿命について検討を行なった。その結果、コバルトによる反応においても鉄錯体と同様、4´位水素引きぬきにより4´位のラジカルが生成していることを世界に先がけて確認できた。この知見に基づいて新たな反応機構を提案した。2)ブレオマイシンコバルト錯体の構造解析錯体の構造が確定しにくい鉄錯体のモデルとして、コバルト-ブレオマイシンについてNMR,CDスペクトルなどの分光学的手段を用いて、総合的に配位構造についての検討を行なった。その結果、コバルトの錯形成により生成するグリーン、ブラウン錯体は錯体部分が逆の配位構造をとっていることが判明した。またこれに基づいて、ブレオマイシン-コバルト錯体とDNA6量体との結合モデルを構築し、AMBERによる力場計算を用いて、構造最適化を行ない、コンピューターグラフィックスにより視覚化した。
著者
杉山 弘晃 南 泰浩
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J95-A, no.1, pp.74-84, 2012-01-01

本研究では,ユーザへ情報を提示するシステムのための,ユーザの潜在的な情報要求の推定に基づく新たな情報提示タイミング決定方策を提案する.この方策により,システムは早過ぎる情報提示を抑制し,ユーザへ煩わしさを感じさせることなく主体的に情報提示することが可能になる.本研究ではこの方策におけるマルチモーダル情報の寄与を検証するため,最初に人と人のインタラクション実験を行い,利用可能なモダリティが変化したときの人が行う情報要求推定精度の変化について分析する.分析を通して,人はマルチモーダル情報を利用できないときは対話の流れを利用し,利用可能なときはマルチモーダル情報を利用することが示された.この結果をもとに,人の情報要求推定を実現するためのモデルを提案し,ユーザの潜在的な情報要求を表出させるよう設計した連想クイズ対話実験を通してその有効性を示す.
著者
森脇 恵太 大野 瞬 杉山 弘晃 酒造 正樹 前田 英作
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.2L1GS204, 2022 (Released:2022-07-11)

本研究では,事実不整合検出の為の分類モデルと事実不整合修正の為の生成モデルとを組み合わせて,文章に含まれる事実不整合の修正を行い,ニューラルネットを用いた文章生成モデルの出力に事実不整合が含まれることを防ぐことを目的とする. 検出,修正モデルの学習には文章生成を行うモデルの学習データセットを改変した人工的なデータセットを用いる. 修正モデルのみを用いた場合と比較を行った結果,検出モデルを入れることで修正モデルによる整合文から不整合文への書き換えを防ぎつつ,事実不整合を含む文章の書き換えを行うことができることが示された. しかし,二つのモデルの解決可能,不可能な問題に同様の傾向が見られた. より性能を上げるために,それぞれのモデルが相補的に働くことができるような学習データを用意する必要があると考える.
著者
金田 龍平 芳賀 大地 杉山 弘晃 酒造 正樹 前田 英作
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.2L1GS203, 2022 (Released:2022-07-11)

ニューラル言語生成技術の進展により, 雑談などの非タスク指向型対話においてより自然な発話生成が可能になりつつある. そして,自然且つ多様な発話生成を実現するためには,それまでの発話履歴を参照するだけでなく 適切な外部知識を参照して,発話文生成を行うことが必要となる. このとき外部知識として, タスク指向型対話で用いられる構造化された情報(例えば旅行案内対話における料金・アクセス等)に加え BlogやWikipediaに代表される非構造化情報(同口コミテキスト等)の活用が期待される. しかしながら,構造化/非構造化情報の混在下において 文脈に応じて適切な外部知識を選択することは必ずしも容易ではない. そこで本研究では,BERTを利用した発話生成のための知識選択手法について検討を行い, 旅行案内ドメインを事例としてとりあげ, 適切な知識選択のための入力情報について検討を行った