著者
中島 淑貴 柏岡 秀紀 キャンベル ニック 鹿野 清宏
出版者
電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.87, no.9, pp.1757-1764, 2004-09-01
参考文献数
11
被引用文献数
37

非可聴つぶやき認識」という,新しいスタイルの実用的な入力インタフェースを提案する.これは音声認識の雑音に対する脆弱性,情報の周囲への漏えい性を克服するため,声帯の振動を伴う通常音声の空気伝搬ではなく,「非可聴つぶやき(Non-Audible Murmur:NAM)」,つまり第三者に聴取不能な声帯の振動を伴わない調音呼気音の体内伝導を,体表からサンプリングし.HMMを用いて認識するものである,これを実現するための基礎として,第一に医療用膜型聴診器の原理を応用した体表接着型マイクロホンを開発した.第二として体内を伝導するNAMを採取して認識するために最適な接着位置を発見した.第三としてNAMの音響学的性質を検討した.第四として,この部位から採取されたサンプルを用い.HMM音響モデルに追加学習してNAM音響モデルを作成した.これらをもとに,日本語ディクテーション基本ソフトウェアを評価に用い,認識エンジンJuliusを使用して大語い連続認識実験を行い.NAM認識の実用可能性を検討した.
著者
中島 淑貴 柏岡 秀紀 キャンベル ニック 鹿野 清宏
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J87-D2, no.9, pp.1757-1764, 2004-09-01

「非可聴つぶやき認識」という,新しいスタイルの実用的な入力インタフェースを提案する.これは音声認識の雑音に対する脆弱性,情報の周囲への漏えい性を克服するため,声帯の振動を伴う通常音声の空気伝搬ではなく,「非可聴つぶやき(Non-Audible Murmur: NAM)」,つまり第三者に聴取不能な声帯の振動を伴わない調音呼気音の体内伝導を,体表からサンプリングし,HMMを用いて認識するものである.これを実現するための基礎として,第一に医療用膜型聴診器の原理を応用した体表接着型マイクロホンを開発した.第二として体内を伝導するNAMを採取して認識するために最適な接着位置を発見した.第三としてNAMの音響学的性質を検討した.第四として,この部位から採取されたサンプルを用い,HMM音響モデルに追加学習してNAM音響モデルを作成した.これらをもとに,日本語ディクテーション基本ソフトウェアを評価に用い,認識エンジンJuliusを使用して大語い連続認識実験を行い,NAM認識の実用可能性を検討した.
著者
中島 淑貴 鹿野 清宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.107, pp.13-18, 2006-10-20

NAMマイクロホンにより収録されるNAMは,声質変換などの技術で,通常音声やささやき声に変換して無音声電話などの通信に使う方法があるが,NAMマイクロホン回路に,あるカットオフ周波数とスロープ特性をもつハイパスフィルタを組み込むことにより,出力は聴覚的に擬似的なささやき声様の音声となり,学習の必要がなく,ローコストでリソース消費のない通信利用が可能になる.今回我々は理想的なハイパスフィルタのカットオフ周波数とスロープを決めるために HPF-NAMの聴覚的な評価実験を行った.Non-Audible Murmur (NAM) can be used as an input interface for confidential telecommunication that annoys nobody due to its conversion to normal speech or a whisper voice using the technology of statistical voice conversion, so-called "non-speech telephony." Instead of using statistical voice conversion we installed an analog high-pass filter only of a resistor and a condenser into the NAM microphone amplifier circuit, and converted NAMs to a whisper-like voice (HPF-NAM) at presumably the lowest resource cost. In this paper we perform perceptual evaluations of naturalness and intelligibility on HPF-NAMs to determine the optimal cut-off frequency and filter slope of the high-pass filter.