著者
橋口 博樹 西村 拓一 矢部 博明 赤坂 貴志 岡 隆一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.16, pp.57-62, 2001-02-22
被引用文献数
5

近年,多量の音楽ディジタルデータを個人が所有するようになり,楽曲の検索ニーズが高まっている.これに伴い,著者らは鼻歌から音程を抽出し,音楽音響信号からは主旋律の候補を選定し,主旋律推定のあいまいさを考慮に入れた検索システムを開発した.この検索は,mp-CDPと呼ばれるマッチング手法により実現されている.本稿では,主旋律の検索機能に加え,歌詞を歌った場合の鼻歌を想定し音素認識に基づく歌詞検索機能も導入する.この場合,通常行なわれている音声認識の技術を単に採用するだけでは,歌のようにピッチが激しく変化するという状況を想定していないことと,ボーカル以外のBGMの影響により,音素認識は困難であると考えられる.そこで,本稿では,比較的認識しやすい母音の音素認識を取り上げ,さらに,楽曲からは,mp-CDPがたどった主旋律情報を音素認識に利用する方法を検討する.The integration of rhythm and lyric recognition in a music retrieval system is the main purpose of this paper. In order to realize a music retrieval system based on rhythm extraction, we have already proposed a matching method called "Model driven path Continuous Dynamic Programming (mp-CDP)" to retrieve a part of music signal by a hamming query. This method detects several intervals in a music signal which are similar to a hamming query. This paper focuses on recognizing vowel categories in a song signal. Lyric recognition problem is out of scope of conventional speech recognition problems. Matching paths obtained by applying mp-CDP lead to enhance the features for recognizing vowel categories.
著者
矢部 博明 西村 拓 向井 理朗 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎 (ISSN:09135685)
巻号頁・発行日
vol.99, no.183, pp.23-30, 1999-07-15

動画系列とその意味する単語の記号列に基づくジェスチャ認識手法を提案する。まず、Incremental Path Methodと呼ぶ方式で、ジェスチャー動画像データからそのnetworkモデルの自動作成を行い、ネットワークのトポロジ解析によりジェスチャの部分共通性、特異性を抽出することで、ジェスチャ動画像の自動文節をする。ジェスチャ動画像系列に現れるジェスチャの順序と、その意味する単語記号の記号系列の順番が一致しているとき、テキストデータについても、同様に自動的に文節化する。それぞれのネットワークの間で部分的対応を取ることで、ジェスチャ動画像について自動的に意味付けを行う認識方法を提案する。さらに、本方式の有効性を検証するために、テキスト付き手話データを対象とした認識実験を行い、本手法の有効性を検証する。