- 著者
-
新田 恒雄
桂田 浩一
入部 百合絵
入部 百合絵
- 出版者
- 早稲田大学
- 雑誌
- 基盤研究(B)
- 巻号頁・発行日
- 2010-04-01
ビッグデータ中の音声ドキュメントから任意のキーワードを,実時間で検索する技術を開発した。研究実施にあたっては,(1)未知語を含む音声を高精度に音素列へ変換する技術,(2)曖昧性を含む音素列からキーワードを高速に検索する技術の二つに焦点をあてた。(1)では,双対空間で音素特徴を効率よく抽出すると共に,多層パーセプトロンで調音素性を抽出し,音素を高精度に識別する方式を開発した。(2)では,接尾辞配列に基づき反復深化探索を行う方式をベースに,調音素性間の距離計算を用いた連続DP,およびキーワード分割アルゴリズムを実装することで,検索精度,検索速度,記憶容量の三つの課題を同時に克服できることを示した。