著者
橋口 博樹 西村 拓一 張 建新 滝田 順子 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.12, pp.2479-2488, 2001-12-01
被引用文献数
23

本論文は, 鼻歌から抽出される音高の差(音程)の時系列を検索入力として, それに類似する区間を楽曲の音響分析パターン時系列中から見出す検索手法の提案を行う.提案手法(Model driven path Continuous Dynamic Programming)は, スポッティング検索可能な連続DPを拡張した手法であり, 参照モデルの時系列自体が, 連続DPで用いられる傾斜制限の型を直接定めていることに特徴がある.本論文では, ポピュラー音楽20曲について鼻歌検索実験を行い, 本提案手法の有効性を示す.
著者
岡 隆一 西村 拓一 張 建新 伊原 正典
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.86, no.6, pp.764-775, 2003-06-01
被引用文献数
21

語彙に依存しない音声の検索方式を二つ取り上げ,それらの性能を比較する.検索方式の二つとは,検索対象の音声データベースと音声クエリー波形の双方について,各フレームの表現が分析フレーム特徴そのものとしてそれを用いるものと,フレーム特徴から音素々に変換したものを用いるもの,である.フレーム系列表現された検索対象の音声データベースと音声クエリーとの間では連続DPによるスポッティング処理が適用される.連続DP値のローカルピークを検出し,それの抽出する音声データベース中の重なりのない音声区間を検索出力とする.日常会話の発話音声を検索対象者音声データとし,音声クエリーによる検索実験を行った.より高い検索性能を与える方式は各フレーム特徴を音素記号に変換した方式であることが明らかになった.
著者
岡 隆一 西村 拓一 伊原 正典 張 建新 赤坂 貴志
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.101, no.155, pp.29-35, 2001-06-21
被引用文献数
1

音声やテキストの検索方式を音素記号の系列表現に基づいて構成することを提案する。検索対象のデータである音声波形の各分析フレーム特徴は音素記号に変換される。検索対象のテキストはその読みをひらかなで記述され、さらに音素系列へと展開される。このとき、この各音素表記については平均継続時間長を前もって定めておき、各音素記号について平均時間長のフレーム区間に同一音素記号を配置し音素記号系列とする。クエリーを音声とする場合、このクエリー音声をフレーム単位に音素認識を実行する。音素系列表現の検索対象の音声やテキストと、クエリー音声の音素記号列との間では連続DPによるスポッテイングを行い、データベース中の一致する部分を検索結果とする。