著者
小杉 尚子 櫻井 保志 山室 雅司 串間 和彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.45, no.1, pp.333-345, 2004-01-15
被引用文献数
6 7

本論文では,我々が研究開発しているハミングを用いた音楽検索システム"SoundCompass"を,カラオケの選曲システムとして実用化するために考案した技術について述べ,それらの有効性を定量的に評価する.このシステムを実用化するにあたって,一般ユーザの使用により,様々なハミングに柔軟に対応することが必要となった.データベース・サイズの増大に対応できるように,蓄積コストや検索速度の改善も必要となった.本論文では様々なハミングに対応するために,これまでの手法では検索できなかったハミングについてその原因を明らかにし,それらを解決するために部分特徴ベクトルの導入,部分ハミング片間OR検索方式の導入,半テンポ曲/倍テンポ曲の重複登録の導入を提案する.一方,検索対象曲数の増加にともなう音楽データベースの大規模化に対して,曲内での繰返しによる特徴ベクトルの冗長性を手がかりにしたデータベース・サイズの縮小を提案する.これらの技術を導入することで,新しいSoundCompassは実用範囲内の検索速度を保ちつつ,20 000曲を超えるデータベースに対して84.2%の検索精度を達成し,従来の我々のシステムと比較して,約20%の向上が可能となった.This paper describes techniques incorporated into SoundCompass, a query-by-humming system, to enable it to be put to practical use as a karaoke song selection system. Quantitative evaluations of the techniques are also provided. Solutions for variations in hummed tunes by general users are required to make the system practical. Moreover, improvements in both the cost of storing a large number of songs in a database and retrieval speed efficiency are also required to deal with database size expansion. In this paper, we analyze hummed tunes which cannot be retrieved by traditional techniques. According to the analysis, a partial feature vector, an OR retrieval among query keys, and double registration of songs whose tempo is doubled/halved are proposed to deal with the diversity among hummed tunes. We also propose a method to reduce database size based on the repetitive structure of songs to solve the problem of increasing database size as the number of songs stored in the database becomes larger. The new SoundCompass system achieves 84.2% retrieval accuracy, which is about 20% more than that of the previous system, for a database that stores over 20,000 songs, while maintaining the applicable retrieval time required for practical use.
著者
小杉 尚子 小島 明 片岡 良治 串間 和彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.2, pp.287-298, 2002-02-15
被引用文献数
21

本稿では,我々が研究開発しているハミングを用いた音楽検索システム(ハミング検索システム)について述べるとともに,このシステムを構築するために採用している技術やパラメータの値について,その効果を定量的に評価する.音楽データベースに対して,音情報をキーにした検索は直感的で非常に有効である.しかし人の歌唱は曖昧で,検索キーとして使用するのは難しい.そこで本システムでは類似検索技術を用いて,ハミングに似ている部分を持つ曲を似ている順にリストアップしたものを検索結果とする.目標は,ハミングされたフレーズを含む曲(正解)を,類似度順の曲名リストの1位に出力することである.従来のハミング検索システムに比べて本システムがきわめて優位である点は,データの処理の基本単位を「音符」ではなく「拍」にしていることと,多次元特徴ベクトルを用いたインデクスを検索に使用していることに起因する.これによって,様々なエラーを含むハミングを検索キーにしても,精度の高い高速な類似検索を実現している.実験では1万余曲を登録したデータベースを構築し,検索時間は約1秒というレスポンスを達成した.また人が聞いて分かるレベルのハミングの約70%については5位以内に正解を出力することを確認した.A music retrieval system that accepts hummed tunes as queries isdescribed. Technologies and the values of parameters that are used in the systemare also described and their effectiveness is quantitatively evaluated.Retrieval using sound information as queries for a music database isintuitive and very useful.However, it is difficult to use hummed tunes as queries because theyare often unclear. Thus, the system employs a similarity retrieval technique to overcomethis problem. The retrieval result is a ranked list of songs that has a part whichis similar to the hummed tune according to the closeness of the match. Our goal for the system is to retrieve the correct song at the top ofthe song list. The most significant ways in which our system is superior to generalquery-by-humming systems are that 1) musical data is processed basedon ``beats'' instead of ``notes'', and 2) the retrieval is donethrough the use of indices based on multi-dimensional feature vectors. These features allow the system to retrieve songs quickly andprecisely even if erroneously hummed tunes are used as queries.The database currently holds over 10,000 songs,and the retrieval timeis about one second.The system is able to recognize the song and rank it within the firstfive places on the list for about 70% of hummed tunes that arerecognizable to human beings as a part of a song.