著者
石川 葉子 水上 雅博 吉野 幸一郎 Sakti Sakriani 鈴木 優 中村 哲
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.33, no.1, pp.DSH-B_1-9, 2018-01-01 (Released:2018-01-31)
参考文献数
20
被引用文献数
1

Using emotional expressions in a conversation is an efficient way to convey one’s thoughts. Emotional expressions of the persuader have a strong impact to the recipient’s attitude in a negotiation. Studies for a persuasive dialog system, which tries to lead users to the system’s specific goals, show that incorporating users’ emotional factors can enhance the system to persuade users. However, in a human-human negotiation, the persuader can have better outcomes not only through considering the emotion of the other person but also through expressing his or her own emotions. In this paper, we propose an example-based persuasive dialog system with expressive emotion capability. The proposed dialog system is trained by newly collected corpus with statistical learning. Emotional states and the user’s acceptance rate of the persuasion are annotated. Experimental results through crowdsourcing suggested that the system using emotional expressions has a potential to persuade some users who prefer to be used emotional expressions, effectively.
著者
河野 誠也 吉野 幸一郎 中村 哲
出版者
人工知能学会
雑誌
2019年度 人工知能学会全国大会(第33回)
巻号頁・発行日
2019-04-08

対話行為とは,話者が発話において持つ何かしらの「意図」あるいは発話における「機能」であり,その意図や機能の種類として対話行為タグが定義される.対話行為は,対話モデルにおける基本単位の一つとして利用されてきており,特に近年,対話における発話間の相互作用をモデル化する上で有用であることが知られている.しかし,近年広く用いられているニューラル対話モデル (Neural Conversation Model; NCM) では,こうした対話行為によってシステム発話を明示的に操作することが困難である.そこで本研究では,システム応答が持つ対話行為の情報を条件として用いた敵対的生成学習の枠組みをNCMに導入する.具体的には,与えられた対話行為に基づいて応答を生成するGeneratorと,Generatorが生成した応答が指定した対話行為に基づいた適切なものであるかを判別するDiscriminatorを構築し,これらの2つのモデルを交互に敵対的に訓練する.このような学習の枠組みの導入により,NCMが任意の対話行為に基づいた適切な応答を生成することが可能かどうかの評価を行った.
著者
水上 雅博 Lasguido Nio 木付 英士 野村 敏男 Graham Neubig 吉野 幸一郎 Sakriani Sakti 戸田 智基 中村 哲
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
pp.DSF-517, (Released:2015-12-15)
参考文献数
23
被引用文献数
4

In dialogue systems, dialogue modeling is one of the most important factors contributing to user satisfaction. Especially in example-based dialogue modeling (EBDM), effective methods for dialog example databases and selecting response utterances from examples improve dialogue quality. Conventional EBDM-based systems use example database consisting of pair of user query and system response. However, the best responses for the same user query are different depending on the user's preference. We propose an EBDM framework that predicts user satisfaction to select the best system response for the user from multiple response candidates. We define two methods for user satisfaction prediction; prediction using user query and system response pairs, and prediction using user feedback for the system response. Prediction using query/response pairs allows for evaluation of examples themselves, while prediction using user feedback can be used to adapt the system responses to user feedback. We also propose two response selection methods for example-based dialog, one static and one user adaptive, based on these satisfaction prediction methods. Experimental results showed that the proposed methods can estimate user satisfaction and adapt to user preference, improving user satisfaction score.
著者
勝見 久央 吉野 幸一郎 平岡 拓也 秋元 康佑 山本 風人 本浦 庄太 定政 邦彦 中村 哲
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.35, no.1, pp.DSI-D_1-12, 2020-01-01 (Released:2020-01-01)
参考文献数
28
被引用文献数
1

Argumentation-based dialogue systems, which can handle and exchange arguments through dialogue, have been widely researched. It is required that these systems have sufficient supporting information to argue their claims rationally; however, the systems do not often have enough information in realistic situations. One way to fill in the gap is acquiring such missing information from dialogue partners (information-seeking dialogue). Existing informationseeking dialogue systems were based on handcrafted dialogue strategies that exhaustively examine missing information. However, these strategies were not specialized in collecting information for constructing rational arguments. Moreover, the number of system’s inquiry candidates grows in accordance with the size of the argument set that the system deal with. In this paper, we formalize the process of information-seeking dialogue as Markov decision processes (MDPs) and apply deep reinforcement learning (DRL) for automatic optimization of a dialogue strategy. By utilizing DRL, our dialogue strategy can successfully minimize objective functions: the number of turns it takes for our system to collect necessary information in a dialogue. We also proposed another dialogue strategy optimization based on the knowledge existence. We modeled the knowledge of the dialogue partner by using Bernoulli mixture distribution. We conducted dialogue experiments using two datasets from different domains of argumentative dialogue. Experimental results show that the proposed dialogue strategy optimization outperformed existing heuristic dialogue strategies.
著者
平山 直樹 吉野 幸一郎 糸山 克寿 森 信介 奥乃 博
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.55, no.7, pp.1681-1694, 2014-07-15

本論文では,様々な方言の混合に対応する音声認識システムを構築する.まず,単一方言音声認識の言語モデルを,大規模共通語言語コーパスから擬似生成した方言言語コーパスで学習する.擬似生成には,共通語-方言対訳コーパスからWFST(重み付き有限状態トランスデューサ)によって学習されたルールを用いる.次に,構築された各方言言語モデルを混合し,発話ごとに最適な混合比を推定しながら認識を行う.これは,実際に話される方言が純粋な単一方言ではなく,人の移動やテレビ,ラジオなどの放送の影響を受けた様々な方言の混合であると考えられるからである.この推定には,音声認識用言語モデルにおける対数尤度の値を用いる.実験により,方言音声認識用言語モデルを用いて方言音声の認識精度が向上することを確認した.また,対数尤度と音声認識精度に強い相関があること,対数尤度を最大化する混合比を発話ごとに選択することで,固定混合比の場合と比較して音声認識精度が向上することを確認した.
著者
吉野 幸一郎 森 信介 河原 達也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.29, no.1, pp.53-59, 2014-01-05 (Released:2014-01-07)
参考文献数
28

A novel text selection approach for training a language model (LM) with Web texts is proposed for automatic speech recognition (ASR) of spoken dialogue systems. Compared to the conventional approach based on perplexity criterion, the proposed approach introduces a semantic-level relevance measure with the back-end knowledge base used in the dialogue system. We focus on the predicate-argument (P-A) structure characteristic to the domain in order to filter semantically relevant sentences in the domain. Moreover, combination with the perplexity measure is investigated. Experimental evaluations in two different domains demonstrate the effectiveness and generality of the proposed approach. The combination method realizes significant improvement not only in ASR accuracy but also in semantic-level accuracy.
著者
小田 悠介 Philip Arthur Graham Neubig 吉野 幸一郎 中村 哲
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.25, no.2, pp.167-199, 2018-03-15 (Released:2018-06-15)
参考文献数
41

本論文では,ニューラル翻訳モデルで問題となる出力層の時間・空間計算量を,二値符号を用いた予測法により大幅に削減する手法を提案する.提案手法では従来のソフトマックスのように各単語のスコアを直接求めるのではなく,各単語に対応付けられたビット列を予測することにより,間接的に出力単語の確率を求める.これにより,最も効率的な場合で従来法の対数程度まで出力層の計算量を削減可能である.このようなモデルはソフトマックスよりも推定が難しく,単体で適用した場合には翻訳精度の低下を招く.このため,本研究では提案手法の性能を補償するために,従来法との混合モデル,および二値符号に対する誤り訂正手法の適用という 2 点の改良も提案する.日英・英日翻訳タスクを用いた評価実験により,提案法が従来法と比較して同等程度の BLEU を達成可能であるとともに,出力層に要するメモリを数十分の 1 に削減し,CPU での実行速度を 5 倍から 10 倍程度に向上可能であることを示す.
著者
湯口 彰重 河野 誠也 石井 カルロス寿憲 吉野 幸一郎 川西 康友 中村 泰 港 隆史 斉藤 康己 美濃 導彦
出版者
一般社団法人 日本ロボット学会
雑誌
日本ロボット学会誌 (ISSN:02891824)
巻号頁・発行日
vol.40, no.10, pp.932-935, 2022 (Released:2022-12-24)
参考文献数
8

We propose an autonomous mobile robot Butsukusa, which describes its observations and internal states during the looking-around task. The proposed robot observes the surrounding environment and moves autonomously during the looking-around task. This paper examined several language generation systems based on different observation and interaction patterns to investigate better communication protocol with users.
著者
品川 政太朗 吉野 幸一郎 サクティ サクリアニ 鈴木 優 中村 哲
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J102-D, no.8, pp.514-529, 2019-08-01

自然言語から思い通りの画像を生成するシステムは,コンピュータによるデザイン作成支援に有用であると期待されている.本研究では,自然言語によってインタラクティブな画像編集を行うことを指向して,自然言語の指示によって直前にシステムからユーザへ共有された生成画像を操作することで,より意図に沿った画像を新たに生成するフレームワークを提案する.具体的には,修正元となる画像データをConvolutional neural networks (CNNs)によって埋め込んだベクトルと,画像に対する自然言語の修正指示文をLong short-term memory neural networks (LSTM)によって埋め込んだベクトルを入力とし,敵対的学習によって指示通りに修正された画像の生成を行う枠組みを提案した.実験では,手書き数字操作データセットを用いた単純なタスクにより,提案モデルが学習した画像編集タスクにおける振る舞いについて分析した.また,実際に人手で付与した指示文によってアバター画像を修正し,意図に沿った編集を行うことができることを確認した.
著者
中村 哲 須藤 克仁 松本 裕治 田中 宏季 サクリアニ サクティ 吉野 幸一郎 高道 慎之介
出版者
奈良先端科学技術大学院大学
雑誌
基盤研究(A)
巻号頁・発行日
2017-04-01

①-A)常時音声認識:音声、非音声音響モデルに基づく常時音声認識の検討を始めた。B)自動音声同時通訳:シフトリデュースパーザを音声認識に組み込み、逐次的に音声認識デコーダで構文解析しながら次の文構成要素を予測し、訳出、待機を行う方法の高度化について文献調査を行った。C)機械翻訳の高度化:再帰的ニューラルネットワークの一種であるLSTMによる注意形ニューラル機械翻訳(NMT)の高度化に向けて研究を進めた。D)対話制御:LSTMを用いた対話状態推定法の利用、POMDPを利用した音声翻訳の高度化に向けて検討を始めた。②パラ言語:元言語の発話から強調抽出し、アライメントを求めた後、CRFおよびLSTMニューラルネットで対象言語に強調を付与する技術の改良を進めた。③リアルタイムコミュニケーション:視線検出装置Tobi、モバイル心拍計などを用いてプロの同時通訳者の作業時、および同時通訳ユーザの聴取時の聴取負荷の観察を行うため、実験計画の検討を行った。④コーパス構築:2012年から介した基盤研究Aで収集したコーパスの整理を行い、H29年度に実施すべきコーパス収集の計画を検討した。
著者
湯口 彰重 豊田 真行 趙 崇貴 吉野 幸一郎 高松 淳 中澤 篤志 小笠原 司
出版者
一般社団法人 日本ロボット学会
雑誌
日本ロボット学会誌 (ISSN:02891824)
巻号頁・発行日
vol.41, no.10, pp.893-896, 2023 (Released:2023-12-21)
参考文献数
13

Analyzing time-series changes of the contact surface by touching is important to elucidate the touching skills of Humanitude as one of the pervasive multimodal comprehensive care methodologies. However, the transparent flat plates to capture contact surfaces used in the previous studies are far from the actual surfaces of care receivers because the surfaces of humans consist of curved shapes. In this paper, we propose a Frustrated Total Internal Reflection (FTIR) sensing system using a transparent curved plate for the purpose to capture contacting state by using a surface more similar to the human body. We evaluate the equivalent performance between data from the proposed FTIR sensing system and an FTIR sensing system using a transparent flat plate by calculating time-series contact areas and the quantitative indices representing theHumanitude's touching motion. Through these experiments, we conclude that the proposed system can obtain the same data quality for the contact areas and the indices as the FTIR system using the flat plate.
著者
中村 泰貴 河野 誠也 湯口 彰重 川西 康友 吉野 幸一郎
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2022-NL-253, no.6, pp.1-7, 2022-09-22

ロボットをはじめとする人間を支援するシステムは,観測から状況を正しく理解し,人間が必要とする支援行動を出力する必要がある.特に人間を対象とした支援において,システムがどのような状況理解を行い,どのような動作行動の生成しようとしているかは,言語で表現することが重要である.そこで本研究では,現在の状況からシステムが行うべき行動を予測しその内容を言語で説明する,動作行動予測とその言語化 (captioning operative action) に取り組む.具体的には,ある状況とそこに対して何らかの支援行動が行われた理想状態の画像を入力とし,どのような支援行動が行われたかを説明する言語化タスクによって動作行動予測を実現するシステムを構築した.この際,こうした状況を説明する補助情報であるシーングラフの予測を補助タスクとして用いることで,シーングラフのアノテーションが存在しないテストセットに対しても精度高く動作行動の予測・言語化を行うことができることが確認された.
著者
中野 佑哉 河野 誠也 吉野 幸一郎 中村 哲
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2020-NL-244, no.3, pp.1-5, 2020-06-26

質問応答とは,与えられた質問に対し適切な答えを見つけて提示するタスクであり,機械読解や対話システムなど様々な応用を構成する重要な基本タスクの一つである.これまでの質問応答システムの研究は様々な問題を解決し,いくつかのベンチマークで高い精度を実現してきた.しかしながら,質問応答システムを実際に利用する場合,様々な課題が残されている.その中の一つに,質問応答システムに対するユーザ発話の曖昧性がある.本論文では,解答が一意に定まらない曖昧な質問文に対し,問い返しを行うことによって質問文の意味を一意に定めることを目的とする新たな質問応答タスクを設定した.その上で,この問題のベンチマークとなる質問応答データセットを既存の質問応答タスク向け大規模データセットから変換することにより作成した.また,作成したデータセットに対して既存モデルを用いた際の精度評価実験を行い,どのような問題が存在するか議論した.
著者
杉山 享志朗 水上 雅博 Graham Neubig 吉野 幸一郎 鈴木 優 中村 哲
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.5, pp.437-461, 2016-12-15 (Released:2017-03-15)
参考文献数
19

質問応答システムが高い精度で幅広い質問に解答するためには,大規模な知識ベースが必要である.しかし,整備されている知識ベースの規模は言語により異なり,小規模の知識ベースしか持たない言語で高精度な質問応答を行うためには,機械翻訳を用いて異なる言語の大規模知識ベースを利用して言語横断質問応答を行う必要がある.ところが,このようなシステムでは機械翻訳システムの翻訳精度が質問応答の精度に影響を与える.一般的に,機械翻訳システムは人間が与える評価と相関を持つ評価尺度により精度が評価されている.そのため,この評価尺度による評価値が高くなるように機械翻訳システムは最適化されている.しかし,質問応答に適した翻訳結果は,人間にとって良い翻訳結果と同一とは限らない.つまり,質問応答システムに適した翻訳システムの評価尺度は,人間の直感に相関する評価尺度とは必ずしも合致しないと考えた.そこで本論文では,複数の翻訳手法を用いて言語横断質問応答データセットを作成し,複数の評価尺度を用いてそれぞれの翻訳結果の精度を評価する.そして,作成したデータセットを用いて言語横断質問応答を行い,質問応答精度と翻訳精度との相関を調査する.これにより,質問応答精度に影響を与える翻訳の要因や,質問応答精度と相関が高い評価尺度を明らかにする.さらに,自動評価尺度を用いて翻訳結果のリランキングを行うことによって,言語横断質問応答の精度を改善できることを示す.
著者
向原 康平 サクリアニ サクティ 吉野 幸一郎 グラム ニュービッグ 中村 哲
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2015-SLP-109, no.15, pp.1-6, 2015-11-25

話者感情の揺らぎは音声へ影響を与え,音声認識システムにおいてモデルとのミスマッチを発生させ認識精度を悪化させる.本研究では,DNN ボトルネック特徴量および CNN ボトルネック特徴量を用いることを提案し,感情音声認識精度の改善を図る.ボトルネック構造のニューラルネットワークによって特徴量変換を施したボトルネック特徴量は,入力音声の変動に対して頑健な音響特徴量を抽出できることが示されている.ボトルネック特徴量とは,中間層のユニット数を少なくしたボトルネック構造の多層ニューラルネットワークから抽出する特徴量である.ボトルネック特徴量は特徴量強調が行われ,感情音声のゆらぎに左右されない音素の本質的な成分を抽出されていることが期待されている.本実験では感情音声に対してボトルネック特徴量変換を行い,それぞれの特徴量で GMM-HMM 音響モデルを再学習する.この時のボトルネック音響モデルの感情音声に対する精度向上を確認する.また他の特徴量変換手法と組み合わせることで認識精度の向上を図る.DNN,CNN ボトルネック特徴量を用いた認識精度はそれぞれのベースラインと比較し,認識精度の改善が確認できた.また他の特徴量変換手法の組み合わせにより認識精度の向上を確認できた.
著者
芥子 育雄 鈴木 優 吉野 幸一郎 Graham Neubig 大原 一人 向井 理朗 中村 哲
出版者
電子情報通信学会
巻号頁・発行日
2017-04-01

LeとMikolovは,文書の分散表現を単語と同様にニューラルネットワークで学習できるパラグラフベクトルのモデルを提案し,極性分析ベンチマークを用いて最高水準の分類精度を示した.パラグラフベクトルを用いたツイートの極性分析における実用上の課題は,単語のスパース性を解消するパラグラフベクトルの構築のために大規模文書が必要なことである.本研究では,Twitterの文に対して評判情報抽出を適用する際,その出現単語のスパース性に由来する性能低下を解決するため,人手により構築された単語意味ベクトルを導入する.意味ベクトルとして,各次元が266種類の特徴単語に対応し,約2万語に付与されている単語意味ベクトル辞書を使用する.この辞書を用いて単語拡張したツイートをパラグラフベクトルのモデルで学習するという,単語意味ベクトルとパラグラフベクトルの統合化手法を提案する.これにより,単語がスパースでも特定分野の文脈情報を学習できることが期待される.この評価のため,クラウドソーシングを利用してスマートフォン製品ブランドに関する極性分析ベンチマークを作成した.評価実験の結果,約1万2千ツイートから構成される特定のスマートフォン製品ブランドのベンチマークにおいて,提案手法は,ポジティブ,ニュートラル,ネガティブの3クラス分類におけるポジティブ予測とネガティブ予測のマクロ平均F値71.9を示した.提案手法は従来手法であるパラグラフベクトルによるマクロ平均F値を3.2ポイント上回った.