著者
神田直之 武田龍 大淵康成
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2013-SLP-97, no.8, pp.1-6, 2013-07-18

本稿では Deep Neural Network (DNN) を用いた日本語音声認識に関する検討結果を述べる.DNN とは多数の階層を持った人工ニューラルネットワークモデルである.近年,多層のネットワークでも効率的に最適化できる手法が発表され,各種の認識タスクで従来法を上回る性能を示したことから,再び大きな注目を集めている.音声認識分野においても DNN に基づく音響モデルに関して既に多数の研究が行われ改善が進む一方で,日本語のテストデータを用いた検討結果は限られた学習データを用いた小規模な実験に限られていた.本稿では日本語話し言葉コーパス (CSJ) をテストセットとし DNN に基づく音響モデルに関する各種の評価を行った結果について述べる.特に 270 時間の学習データを用いた評価において,音素誤り最小化 (MPE) 学習された Gaussian Mixture Model に基づく音響モデルと比較して最大 28.2 %の認識誤りが削減され,DNN の認識性能の高さを日本語においても確認した.また DNN に基づく音響モデルにおいて,学習用の言語リソースが限られた状況でデータを擬似的に増加させる手法について新たに検討を行い,認識精度がさらに向上することを確認した.
著者
神田 直之 王 瑩 片岡 憲昭 山田 龍太 今泉 洋 狩野 直樹
出版者
公益社団法人 日本アイソトープ協会
雑誌
RADIOISOTOPES (ISSN:00338303)
巻号頁・発行日
vol.64, no.12, pp.717-728, 2015
被引用文献数
5

2011年3月12~15日に,福島第一原子力発電所事故が起こった。この事故は,近県に放射性物質汚染を引き起こした。本研究では,汚染された地域に及ぼすこの事故の影響を明らかにするため,新潟市と福島県における幾つかの湖沼の湖沼水と湖沼泥を採取した。湖沼水においては,固体高分子膜電解(SPE)装置によりトリチウム(T)比放射能の濃縮を行い,T-比放射能を液シンで測定した。このように測定したT-比放射能に基づき,環境に及ぼすこの事故の影響を調査した。それと同時に,湖沼泥中の放射性セシウムの比放射能も測定した。その結果,福島第一原子力発電所事故が近くの湖沼(例えば,福島県や新潟市)に及ぼす影響が定量的に明らかになった。以上のことから,新潟市に及ぼすこの事故の影響はかなり小さく,事故は徐々に収束していることがわかった。
著者
神田 直之 駒谷 和範 中野 幹生 中臺 一博 辻野 広司 尾形 哲也 奥乃 博
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.12, pp.55-60, 2006-02-04
被引用文献数
4

複数のドメインを扱う音声対話システムにおいて,対話の文脈や進行に関する特徴量を導入してより精度よくドメイン選択を行う手法を開発したので報告する.本稿ではドメイン選択問題を,応答すべきドメインが,(I)ひとつ前の応答を行ったドメイン,(II)音声認識結果に対する最尤のドメイン,(III)それ以外のいずれかのドメイン,のどれに該当するかを判別する問題と捉える.ドメイン選択の正解を与えた対話データから,対話の文脈や進行に関する特徴量を用いて上記を判別する決定木を学習することにより,ドメイン選択器を構成した.5ドメインのマルチドメイン音声対話システムを用いた10名の被験者による評価実験の結果,音声認識尤度に基づく従来のドメイン選択手法に比べ,ドメイン選択誤りが11.6%削減された.We have developed a robust domain selection method using dialogue history in multi-domain spoken dialogue systems. We define domain selection as classifying problem among (I) the domain in the previous turn, (II) the domain in which N-best speech recognition results can be accepted with the highest recognition score, (III) other domains. We constructed a classifier by decision tree learning with dialogue corpus. The experimental result using 10 subjects shows that our method could reduced 11.6% domain selection error, compared with a conventional method using speech recognition likelihoods only.