著者
柳田 智也 サクテイ サクリアニ 中村 哲
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.63, no.4, pp.1149-1158, 2022-04-15

同時音声通訳システムは,話者の発話中に翻訳を行い音声を生成する.その実現のために,文より短いテキストから,音声を生成する逐次音声合成が必要である.本論文は,同時音声通訳システムの実現を目指して,日本語における逐次音声合成の提案を目的とする.先行研究は,逐次音声合成のために使用する言語特徴を制限し,合成範囲を単語としている.しかし,日本語音声合成は,アクセント句と呼ばれる単位が重要であり,単語の逐次音声合成が,音声品質と遅延のトレードオフとして適さない可能性がある.本論文では,日本語逐次音声合成のため,逐次音声合成の言語特徴を提案する.そして,言語特徴の組合せから,遅延と音声品質に最適な合成範囲を決定する.実験結果より,アクセント句から呼気段落の合成範囲が音声の品質を保持するために必要であることを示した.さらに,遅延評価を通して,アクセント句が日本語の逐次音声合成へ適することを示した.