著者
平山 直樹 吉野 幸一郎 糸山 克寿 森 信介 奥乃 博
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.55, no.7, pp.1681-1694, 2014-07-15

本論文では,様々な方言の混合に対応する音声認識システムを構築する.まず,単一方言音声認識の言語モデルを,大規模共通語言語コーパスから擬似生成した方言言語コーパスで学習する.擬似生成には,共通語-方言対訳コーパスからWFST(重み付き有限状態トランスデューサ)によって学習されたルールを用いる.次に,構築された各方言言語モデルを混合し,発話ごとに最適な混合比を推定しながら認識を行う.これは,実際に話される方言が純粋な単一方言ではなく,人の移動やテレビ,ラジオなどの放送の影響を受けた様々な方言の混合であると考えられるからである.この推定には,音声認識用言語モデルにおける対数尤度の値を用いる.実験により,方言音声認識用言語モデルを用いて方言音声の認識精度が向上することを確認した.また,対数尤度と音声認識精度に強い相関があること,対数尤度を最大化する混合比を発話ごとに選択することで,固定混合比の場合と比較して音声認識精度が向上することを確認した.
著者
平山 直樹 長谷川 博
出版者
日経BP社
雑誌
日経ニューメディア (ISSN:02885026)
巻号頁・発行日
no.1541, pp.11-12, 2016-12-12

無料のBS放送チャンネル「BS11」を運営する日本BS放送の売上高が2016年8月期決算で100億円を突破した。2007年12月開局から9年弱で大台を越えた。 同社は2018年8月期の売上高150億円達成を目標としており、今後の持続的な成長に向けて、「自社制作番組の選択と集中」…
著者
平山 直樹
出版者
尾道市立大学芸術文化学部日本文学科
雑誌
尾道文学談話会会報 (ISSN:21852456)
巻号頁・発行日
no.4, pp.17-41, 2013-12-20

著作権の関係上、図1、写真1、写真2、図2、写真3は、掲載できません。本稿の図、写真を含む全文を掲載した『尾道文学談話会会報』第4号を希望される方は、下記にお知らせ下さい。残部のあるかぎり、無償でおわけします。(送料着払い) 〒722-8506 尾道市久山田町1600番地2 尾道市立大学芸術文化学部 日本文学科研究室
著者
平山 直樹 森 信介 奥乃 博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.112, no.369, pp.7-12, 2012-12-13

本稿では,日本語方言音声認識のための言語モデルの統計的構築法を開発する.方言言語モデル構築においては,その方言の言語コーパスの不足が大きな課題である.その解決のため,大規模共通語言語コーパスの単語単位での方言への変換を行う.共通語・方言間の対訳コーパスを用いて統計的に変換ルールを学習し,重み付き有限状態トランスデューサ(WFST)で変換器を実装する.このWFSTに共通語文章を入力することで,対応する方言文章が自動的に出力される.本手法で構築した方言言語モデルを用いて方言音声認識を行うことで,共通語言語コーパスで学習した言語モデルより高い認識精度が得られた.