著者
安部 素嗣
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EA, 応用音響 (ISSN:09135685)
巻号頁・発行日
vol.105, no.136, pp.13-18, 2005-06-17

一般化調和解析(GHA)は, 一般に, 離散フーリエ変換(DFT)と比べて精度のよい周波数分析法であると言われているが, どのような意味で精度がよいのかを明確に論じた文献はみられず, やや直観的な議論が先行しているように思われる.本稿では, まず正弦波パラメータ推定という立場からGHAとDFTを考察することで, これらが直接的に比較されることの非合理性を指摘し, 合理的な比較であるための前提を明らかにする.続いて, 時間領域で定義されるGHAの周波数領域での振舞いを論じ, 結論として, GHAは, 1)正弦波推定法としてよく知られるフーリエスペクトルのピーク抽出とほぼ等価な演算であることと, 2)実用上その違いが問題となるのは, 実単一正弦波の極低周波成分を推定する場合のみであることを明らかにする.
著者
澁谷 崇 東山 恵祐 安部 素嗣 西口 正之
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2011, no.17, pp.1-8, 2011-07-20

本稿では,テレビや映画などで用いられる背景音楽を音楽データベースと高速に一致検索する手法を提案する.我々は背景音楽よりも大きい前景音に対してロバストかつ高速に一致検索を行うために,音楽の持続性トーン成分に着目し,それを用いた特徴量 "トーン構造記述子" を提案する.トーン構造記述子を用いた実験では,S/N 比-20dB においても再現率が 96% 以上で,かつパーソナルコンピュータを用いてもリアルタイムに 10 万曲以上検索可能であることを示す.This paper presents an extremely fast method for identifying background music with a piece of music in large database. We focus on continuous tonal components, which make the identification robust to loud foreground sounds, and propose a feature based on continuous tones, "Tonal Structure Descriptor". In the experiments, we demonstrate that our descriptor enables a personal computer to compare background music with more than 100, 000 tracks in real time, and realize more than 96% Recall at -20dB S/N Ratio.
著者
安部 素嗣 西口 正之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.101, no.569, pp.25-30, 2002-01-11
被引用文献数
5

本稿では, オーディオ検索のための自己最適化スペクトル相関法を提案する.これは未知の入力信号から既知の参照信号と一致する部分を同定する, いわゆる一致検索のための方法であるが, 入力信号に他の妨害音が強く混入していても, 背景で共通する信号間の類似性を評価し, 類似部分を同定する.例えば音声の背景にある音楽の同定などに用いられる.本手法は, まず参照信号を時間周波数領域で多数の小領域に分解し, 各小領域の成分と入力信号との間の類似度を計算する.続いて各小領域の類似度を投票法により統合し, 参照信号と入力信号が類似しているか否かを判定し, 類似している場合にはその位置を同定する.背景音楽の同定実験では, 音声に対するS/N比が-10dBの音楽で100%, -20dBの音楽でも90%が同定できることが確認された.