著者
Graham NEUBIG Masato MIMURA Shinsuke MORI Tatsuya KAWAHARA
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
IEICE Transactions on Information and Systems (ISSN:09168532)
巻号頁・発行日
vol.E95.D, no.2, pp.614-625, 2012-02-01 (Released:2012-02-01)
参考文献数
40
被引用文献数
11 24 6

We propose a novel scheme to learn a language model (LM) for automatic speech recognition (ASR) directly from continuous speech. In the proposed method, we first generate phoneme lattices using an acoustic model with no linguistic constraints, then perform training over these phoneme lattices, simultaneously learning both lexical units and an LM. As a statistical framework for this learning problem, we use non-parametric Bayesian statistics, which make it possible to balance the learned model's complexity (such as the size of the learned vocabulary) and expressive power, and provide a principled learning algorithm through the use of Gibbs sampling. Implementation is performed using weighted finite state transducers (WFSTs), which allow for the simple handling of lattice input. Experimental results on natural, adult-directed speech demonstrate that LMs built using only continuous speech are able to significantly reduce ASR phoneme error rates. The proposed technique of joint Bayesian learning of lexical units and an LM over lattices is shown to significantly contribute to this improvement.
著者
水上 雅博 Lasguido Nio 木付 英士 野村 敏男 Graham Neubig 吉野 幸一郎 Sakriani Sakti 戸田 智基 中村 哲
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
pp.DSF-517, (Released:2015-12-15)
参考文献数
23
被引用文献数
4

In dialogue systems, dialogue modeling is one of the most important factors contributing to user satisfaction. Especially in example-based dialogue modeling (EBDM), effective methods for dialog example databases and selecting response utterances from examples improve dialogue quality. Conventional EBDM-based systems use example database consisting of pair of user query and system response. However, the best responses for the same user query are different depending on the user's preference. We propose an EBDM framework that predicts user satisfaction to select the best system response for the user from multiple response candidates. We define two methods for user satisfaction prediction; prediction using user query and system response pairs, and prediction using user feedback for the system response. Prediction using query/response pairs allows for evaluation of examples themselves, while prediction using user feedback can be used to adapt the system responses to user feedback. We also propose two response selection methods for example-based dialog, one static and one user adaptive, based on these satisfaction prediction methods. Experimental results showed that the proposed methods can estimate user satisfaction and adapt to user preference, improving user satisfaction score.
著者
小田 悠介 Philip Arthur Graham Neubig 吉野 幸一郎 中村 哲
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.25, no.2, pp.167-199, 2018-03-15 (Released:2018-06-15)
参考文献数
41

本論文では,ニューラル翻訳モデルで問題となる出力層の時間・空間計算量を,二値符号を用いた予測法により大幅に削減する手法を提案する.提案手法では従来のソフトマックスのように各単語のスコアを直接求めるのではなく,各単語に対応付けられたビット列を予測することにより,間接的に出力単語の確率を求める.これにより,最も効率的な場合で従来法の対数程度まで出力層の計算量を削減可能である.このようなモデルはソフトマックスよりも推定が難しく,単体で適用した場合には翻訳精度の低下を招く.このため,本研究では提案手法の性能を補償するために,従来法との混合モデル,および二値符号に対する誤り訂正手法の適用という 2 点の改良も提案する.日英・英日翻訳タスクを用いた評価実験により,提案法が従来法と比較して同等程度の BLEU を達成可能であるとともに,出力層に要するメモリを数十分の 1 に削減し,CPU での実行速度を 5 倍から 10 倍程度に向上可能であることを示す.
著者
赤部 晃一 Graham Neubig Sakriani Sakti 戸田 智基 中村 哲
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.1, pp.87-117, 2016-01-25 (Released:2016-04-25)
参考文献数
30

複雑化する機械翻訳システムを比較し,問題点を把握・改善するため,誤り分析が利用される.その手法として,様々なものが提案されているが,多くは単純にシステムの翻訳結果と正解訳の差異に着目して誤りを分類するものであり,人手による分析への活用を目的とするものではなかった.本研究では,人手による誤り分析を効率化する手法として,機械学習の枠組みを導入した誤り箇所選択手法を提案する.学習によって評価の低い訳出と高い訳出を分類するモデルを作成し,評価低下の手がかりを自動的に獲得することで,人手による誤り分析の効率化を図る.実験の結果,提案法を活用することで,人手による誤り分析の効率が向上した.
著者
角森 唯子 Graham Neubig Sakriani Sakti 平岡 拓也 水上 雅博 戸田 智基 中村 哲
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会研究会資料 言語・音声理解と対話処理研究会 75回 (2015/10) (ISSN:09185682)
巻号頁・発行日
pp.04, 2015-10-26 (Released:2021-06-28)

When humans attempt to detect deception, they perform two actions: looking for telltale signs of deception, and asking questions to attempt to unveil a deceptive conversational partner. There has been a significant amount of prior work on automatic deception detection, which focuses on the former. On the other hand, we focus on the latter, constructing a dialog system for an interview task that acts as an interviewer asking questions to attempt to catch a potentially deceptive interviewee. We propose several dialog strategies for this system, and measure the utterance-level deception detection accuracy of each, finding that a more intelligent dialog strategy results in slightly better deception detection accuracy.
著者
杉山 享志朗 水上 雅博 Graham Neubig 吉野 幸一郎 鈴木 優 中村 哲
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.5, pp.437-461, 2016-12-15 (Released:2017-03-15)
参考文献数
19

質問応答システムが高い精度で幅広い質問に解答するためには,大規模な知識ベースが必要である.しかし,整備されている知識ベースの規模は言語により異なり,小規模の知識ベースしか持たない言語で高精度な質問応答を行うためには,機械翻訳を用いて異なる言語の大規模知識ベースを利用して言語横断質問応答を行う必要がある.ところが,このようなシステムでは機械翻訳システムの翻訳精度が質問応答の精度に影響を与える.一般的に,機械翻訳システムは人間が与える評価と相関を持つ評価尺度により精度が評価されている.そのため,この評価尺度による評価値が高くなるように機械翻訳システムは最適化されている.しかし,質問応答に適した翻訳結果は,人間にとって良い翻訳結果と同一とは限らない.つまり,質問応答システムに適した翻訳システムの評価尺度は,人間の直感に相関する評価尺度とは必ずしも合致しないと考えた.そこで本論文では,複数の翻訳手法を用いて言語横断質問応答データセットを作成し,複数の評価尺度を用いてそれぞれの翻訳結果の精度を評価する.そして,作成したデータセットを用いて言語横断質問応答を行い,質問応答精度と翻訳精度との相関を調査する.これにより,質問応答精度に影響を与える翻訳の要因や,質問応答精度と相関が高い評価尺度を明らかにする.さらに,自動評価尺度を用いて翻訳結果のリランキングを行うことによって,言語横断質問応答の精度を改善できることを示す.
著者
芥子 育雄 鈴木 優 吉野 幸一郎 Graham Neubig 大原 一人 向井 理朗 中村 哲
出版者
電子情報通信学会
巻号頁・発行日
2017-04-01

LeとMikolovは,文書の分散表現を単語と同様にニューラルネットワークで学習できるパラグラフベクトルのモデルを提案し,極性分析ベンチマークを用いて最高水準の分類精度を示した.パラグラフベクトルを用いたツイートの極性分析における実用上の課題は,単語のスパース性を解消するパラグラフベクトルの構築のために大規模文書が必要なことである.本研究では,Twitterの文に対して評判情報抽出を適用する際,その出現単語のスパース性に由来する性能低下を解決するため,人手により構築された単語意味ベクトルを導入する.意味ベクトルとして,各次元が266種類の特徴単語に対応し,約2万語に付与されている単語意味ベクトル辞書を使用する.この辞書を用いて単語拡張したツイートをパラグラフベクトルのモデルで学習するという,単語意味ベクトルとパラグラフベクトルの統合化手法を提案する.これにより,単語がスパースでも特定分野の文脈情報を学習できることが期待される.この評価のため,クラウドソーシングを利用してスマートフォン製品ブランドに関する極性分析ベンチマークを作成した.評価実験の結果,約1万2千ツイートから構成される特定のスマートフォン製品ブランドのベンチマークにおいて,提案手法は,ポジティブ,ニュートラル,ネガティブの3クラス分類におけるポジティブ予測とネガティブ予測のマクロ平均F値71.9を示した.提案手法は従来手法であるパラグラフベクトルによるマクロ平均F値を3.2ポイント上回った.