著者
吉原 亨 蔦木圭悟 高橋 弘太
雑誌
情報処理学会研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2008, no.123(2008-SLP-074), pp.233-238, 2008-12-02

できるだけ聞き落としを生じることなく,時間的な効率を上げて音声再生を行うためには,個々の音声に対して最適な再生速度を決定するための指標が必要となる.本稿では,この問題に関して得られた 2 つの成果について発表する.第一の成果は, 2 つの異なる狭帯域エネルギの時間変化に着目した話速推定法を提案し,正規化した誤差で 16% の推定精度で話速推定が行えることを示したことである.第二の成果は,通常発話の音声と高速発話の音声を,それぞれ極めて速い話速に話速変換した結果を観察し,高速発話を話速変換した音声が,より調波構造の乱れが少ないことを示したことである.本稿は,我々で製作している話速バリエーション型音声データベース (SRM-DB) を用いて行った.我々は本研究を SRV-DB の有効な利用法の一例として発表する.
著者
高橋 弘太 蔦木 圭悟 吉原 亨
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.108, no.337, pp.227-232, 2008-12-02
被引用文献数
2

高齢者に確実に音声を聞き取らせるには,どうしたらよいか,また健常者に対しては,短い時間でより多くの音声を聞き取らせるには,どうしたらよいか.これらの研究を行うためには,正確な時間管理のもと,同じ音声を同じ話者が話速を変えて発声した音声のデータベースが必要である.しかし,現時点では,そのような目的で大規模に作られた音声データベースは存在しない.そこで,我々は,平成20年度〜平成22年度の科研費の研究として,さまざまな話速で録音した音声データベースを構築している.今回は,このデータベースの紹介を行うとともに,会場で音声の研究者の生の意見やコメントをうかがって,今後のデータベース作りに反映させていきたいと考えている.また,我々は,音声データベース作成のために,話速を正確に管理しつつ録音できるシステム(原稿提示システム)も製作した.システムはパソコン上で動くもので,将来は,このソフトも公開して,電通大外でも音声を追加できるようにしたいと考えている.当日は,このシステムの機能と,どのような工夫がなされているかについても紹介したい.