著者
橋口 博樹 西村 拓一 矢部 博明 赤坂 貴志 岡 隆一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.16, pp.57-62, 2001-02-22
被引用文献数
5

近年,多量の音楽ディジタルデータを個人が所有するようになり,楽曲の検索ニーズが高まっている.これに伴い,著者らは鼻歌から音程を抽出し,音楽音響信号からは主旋律の候補を選定し,主旋律推定のあいまいさを考慮に入れた検索システムを開発した.この検索は,mp-CDPと呼ばれるマッチング手法により実現されている.本稿では,主旋律の検索機能に加え,歌詞を歌った場合の鼻歌を想定し音素認識に基づく歌詞検索機能も導入する.この場合,通常行なわれている音声認識の技術を単に採用するだけでは,歌のようにピッチが激しく変化するという状況を想定していないことと,ボーカル以外のBGMの影響により,音素認識は困難であると考えられる.そこで,本稿では,比較的認識しやすい母音の音素認識を取り上げ,さらに,楽曲からは,mp-CDPがたどった主旋律情報を音素認識に利用する方法を検討する.The integration of rhythm and lyric recognition in a music retrieval system is the main purpose of this paper. In order to realize a music retrieval system based on rhythm extraction, we have already proposed a matching method called "Model driven path Continuous Dynamic Programming (mp-CDP)" to retrieve a part of music signal by a hamming query. This method detects several intervals in a music signal which are similar to a hamming query. This paper focuses on recognizing vowel categories in a song signal. Lyric recognition problem is out of scope of conventional speech recognition problems. Matching paths obtained by applying mp-CDP lead to enhance the features for recognizing vowel categories.
著者
橋口 博樹 西村 拓一 張 建新 滝田 順子 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.12, pp.2479-2488, 2001-12-01
被引用文献数
23

本論文は, 鼻歌から抽出される音高の差(音程)の時系列を検索入力として, それに類似する区間を楽曲の音響分析パターン時系列中から見出す検索手法の提案を行う.提案手法(Model driven path Continuous Dynamic Programming)は, スポッティング検索可能な連続DPを拡張した手法であり, 参照モデルの時系列自体が, 連続DPで用いられる傾斜制限の型を直接定めていることに特徴がある.本論文では, ポピュラー音楽20曲について鼻歌検索実験を行い, 本提案手法の有効性を示す.
著者
後藤 真孝 橋口博樹 西村拓一 岡隆一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.45, no.3, pp.728-738, 2004-03-15
被引用文献数
55

本論文では,研究者が研究目的で共通に利用できる著作権処理済み音楽データベースの,制作方針と構成について述べる.他の研究分野では,以前から多様な共通データベースが構築され,研究の進展に大きく貢献してきていたが,音楽情報処理の分野では,従来,共通楽曲データベースや大規模な楽器音データベースは存在していなかった.そこで我々は,RWC(Real World Computing)研究用音楽データベースとして,「ポピュラー音楽データベース」(100曲),「著作権切れ音楽データベース」(15曲),「クラシック音楽データベース」(50曲),「ジャズ音楽データベース」(50曲),「音楽ジャンルデータベース」(100曲),「楽器音データベース」(50楽器)の6つを構築した.全315曲に対し,音響信号,標準MIDIファイル,歌詞のテキストファイルを用意し,50楽器に対し,音域全体を半音間隔で収録した単独演奏音を用意した.これらを共通ベンチマークとして活用することで,様々なシステムや手法の比較・評価が可能になる.また,統計的手法や学習手法を活用した,データベースに基づく多様な研究の進展も期待できる.さらに,学会等における研究成果の対外発表の際にも,著作権の制約を受けずに自由な使用ができるようになる.本データベースはすでに広く利用され始めており,音楽情報処理の研究分野の発展に寄与していくことが期待される.This paper describes the design policy and specifications of a copyright-cleared music database that is available to researchers as a common foundation for research.Shared databases are common in other fields of academic research and have frequently made significant contributions to progress in those areas.The field of music information processing, however, has lacked common databases of musical pieces and large-scale databases of musical instrument sounds.We therefore built the RWC (Real World Computing) Music Database which contains six original collections: the Popular Music Database (100 pieces), Royalty-Free Music Database (15 pieces), Classical Music Database(50 pieces), Jazz Music Database(50 pieces), Music Genre Database(100 pieces), and Musical Instrument Sound Database(50 instruments).For all 315 musical pieces, we prepared audio signals, standard MIDI files, and text files of lyrics.For the 50 instruments, we captured individual sounds at half-tone intervals.These collections will provide a benchmark that enables researchers to compare and evaluate their various systems against a common standard.The database can also be used to stimulate research in database-oriented approaches that use statistical methods and learning techniques.In all cases, researchers can use the database for research publications and presentations without copyright restrictions.The RWC Music Database has already been widely used and will contribute to further advancements in the field of music information processing.
著者
後藤 真孝 橋口 博樹 西村 拓一 岡 隆一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.14, pp.25-32, 2002-02-15
被引用文献数
14

本稿では,共通利用の自由,学術利用の自由が確保されたRWC 研究用音楽データベースの,制作方針と構成について述べる.他の研究分野では,以前から共通データベースの必要性・意義が認識されて,多様なデータベースを構築する努力がなされてきたが,音楽情報処理の分野では,従来,共通楽曲データベースは存在していなかった.そこで我々は既に,「ポピュラー音楽データベース」(100 曲)と「著作権切れ音楽データベース」(15 曲)の二つを構築してきた.本稿では,さらに,「クラシック音楽データベース」(50 曲)と「ジャズ音楽データベース」(50 曲)の二つを構築したことを報告する.本データベースにより,音楽情報処理の研究分野がさらに発展していくことを期待したい.This paper describes the design policy and overview of RWC music database that gives researchers freedom of common use and research use.Various commonly available databases have been built in other research ?elds because of the importance and signi ?cance of those databases.In the ?eld of musical information processing, however,there has not been any commonly available music database.We have therefore built two databases,"Popular Music Database "(100 pieces)and "Royalty-Free Music Database "(15 pieces).This paper reports that we built two more databases,"Classical Music Database "(50 pieces)and "Jazz Music Database "(50 pieces).We hope that these databases will encourage further advance in musical information processing research.
著者
橋口 博樹 西村 拓一 赤坂 貴志 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.100, no.443, pp.79-86, 2000-11-10
被引用文献数
3

近年, 多量の音楽ディジタルデータを個人が所有するようになり, 楽曲の検索ニーズが高まっている.これに伴い, 著者らは鼻歌をクエリーとして, 主旋律に基づいて楽曲信号から直接検索するシステムを開発した.この検索は, mp-CDPと呼ばれるマッチング手法により実現されている.本稿では, 歌詞のある鼻歌を想定し, 音素認識に基づく歌詞検索機能も導入する.このとき, 通常行なわれている音声認識の技術では, 楽曲のように激しく音程が変化するという状況を想定していないため, 歌詞の検索は困難であると考えられる.そこで, mp-CDPがたどった主旋律情報を利用して, 歌詞検索に向いた音素認識法を考え, 両者の統合システムを提案する.
著者
西村 拓一 橋口 博樹 関本 信博 張建新 後藤 真孝 岡 隆一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.103, pp.7-14, 2001-10-26
被引用文献数
1

我々は,音楽音響信号のデータベースから,鼻歌のメロディーに類似した区間を見つけ出す音楽検索システムを提案している.本システムでは,個人的に収集したビデオデータからの検索も可能である.しかし,このシステムで用いていた「Model driven path 連続DP」呼ぶマッチング手法は,クエリーの時間軸,データベースの時間軸,音高の軸からなる3次元空間中において,局所類似度を連続DPに基づいて累積し,極大となる累積類似度を計算するもので,その計算量が大きい.そこで,クエリーの始端周辺の音高が正しく推定できたと仮定することで,音高軸を削減した2次元空間における局所類似度の累積に基づく「始端特徴依存連続DP」を提案する.本稿では,ポピュラー音楽20曲について鼻歌検索実験を行い,約7割の検索率を維持しつつ,計算量を従来法の約1/40に低減できることを示す.We have developed a music retrieval method that takes a humming query and finds similar audio intervals (segments) in a music audio database. This method can also address a personally recorded video database containing melodies in its audio track. Our previous retrieving method took too much time to retrieve a segment: for example, a 60-minute database required about 10-minute computation on a personal computer. In this paper, we propose a new high-speed retrieving method, called start frame feature dependent continuous Dynamic Programming, which assumes that the pitch of the interval start point is accurate. Test results show that the proposed method reduces retrieval time to about 1/40 of present methods.