著者
中村友彦 吉井和佳 後藤真孝 亀岡弘和
出版者
一般社団法人情報処理学会
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014, no.11, pp.1-6, 2014-08-18

本論文では,調波楽器音の周波数特性とドラムの音色を,音楽音響信号間で楽譜を用いずに置換するシステムを提案する.このシステムでは,まず置換元の音楽音響信号 (インプット) と置換先の音楽音響信号 (リファレンス) の振幅スペクトルをそれぞれ調波楽器音成分と打楽器音成分のスペクトルに分離し,それぞれの成分に対して独立に処理を行う.調波楽器音成分のスペクトルの周波数特性をスペクトルの山周辺と谷周辺を通る 2 つのスペクトル包絡によって特徴付け,インプットの調波楽器音成分の振幅スペクトルを,インプットとリファレンスの調波楽器音成分のスペクトル包絡が類似するように変形する.インプットとリファレンスの打楽器音成分のスペクトログラムは,各ドラム楽器毎のスペクトログラムに分離した後,ユーザによって指定されたインプットのドラム楽器の音色をリファレンスのドラム楽器の音色に置換する.主観評価実験により,提案するシステムが周波数特性とドラムの音色を適切に置換できることを確認した.
著者
吉井 和佳 後藤 真孝
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2011, no.2, pp.1-10, 2011-07-20

本稿では,和音系列に対する統計的言語モデルとして,ノンパラメトリックベイズ理論に基づく n グラムモデルについて述べる.従来の経験的なスムージングに基づく n グラムモデルには,主に三つの問題,すなわち,理論的な裏付けがなく改善が困難であること,n の値を一意に指定しなければならないこと,考慮する和音の種類 (語彙) は恣意的に決めざるを得ないこと,が存在した.これらの問題を解決するため,我々は語彙フリー無限グラムモデルを提案する.このモデルは,あらゆる音の組合せを和音として許容するため語彙が不要で,和音系列中の各和音が異なるコンテキスト長 (理論上は無限でもよい) を持つことを許容する.ある和音系列が与えられた上で,次の和音を予測するときには,n の値を一意に決めることなくあらゆる可能性を考慮できる.また,これまで観測したことがない和音が出現したとしても,その和音のゼログラム確率 (構成音の同時出現確率) をこれまで観測してきた和音の構成音に基づいて計算することで,適切に n グラム確率を推定することができる.実験の結果,従来の n グラムモデルよりも低いパープレキシティを達成することが分かった.This paper presents a novel nonparametric Bayesian n-gram model as a statistical language model for symbolic chord sequences. Standard n-gram models based on heuristic smoothing have three fundamental problems―that they have no theoretical foundation, that the value of n is fixed uniquely, and that a vocabulary of chord types is defined in an arbitrary way. To solve these problems, we propose a vocabulary-free infinity-gram model. It accepts any combinations of notes as chord types and allows each chord appearing in a sequence to have an unbounded and variable-length context. Our experiments showed that the perplexity obtained by the proposed model is significantly lower than that obtained by the state-of-the-art models.
著者
吉井 和佳 後藤 真孝 駒谷 和範 尾形 哲也 奥乃 博
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.82, pp.91-96, 2005-08-05

本稿では、認識誤りを含むドラム音の発音時刻列からドラムパターンを推定し、認識誤り補正を行う手法について述べる。本稿におけるドラムパターンとは、バスドラム音およびスネアドラム音の発音時刻列のペアで構成される周期的な時間構造のことを指す。まず、我々が提案したドラム音認識手法を音楽音響信号に適用してドラム音の発音時刻列を得る。次に、発音時刻列を短時間フーリエ解析しても止まる周期長に基づき、ドラムパターンを切り出す。ここで、同じドラムパターンは連続して反復されやすいという仮定をおき、各ドラムパターン区間における実際の発音時刻列を推定する。最後に、切り出されたドラムパターンと推定された発音時刻列との比較により、認識誤りの可能性が高い時刻を検出し、再検証を行う。ポピュラー音楽50曲を用いたドラム音認識実験で、補正手法により認識率が77.4% から80.7%に改善することを確認した。may include recognition errors and corrects them by using the drum patterns. In this paper, drum patterns are defined as periodic temporal structures which are pair of onset-time sequences of bass and snare drum sounds. First, we apply our drum sound recognition method to musical audio signals, and obtain onset-time sequences of drum sounds. Next, we calculate the period length of those sequences by applying short-time Fourier transform, and extract drum patterns from them. Under the assumption that the same drum patterns tend to be repeated, we estimate an actual onset-time sequences in duration of each drum pattern. Finally, by comparing each drum pattern with its corresponding estimated onset-time sequences, we detect time points where recognition errors may have been made, and verify those points. The experiments of drum sound recognition with 50 popular songs showed that our correction method improved the recognition accuracy from 77.4% to 80.7%.
著者
吉井 和佳 後藤 真孝 奥乃 博
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.127, pp.55-60, 2003-12-21
参考文献数
8
被引用文献数
6

本稿では,実世界の音楽音響信号を対象としたドラムスの音源同定について述べる.このような音響信号に対してドラムスの音源同定を行う上での問題点は,曲ごとにドラムスの音色が大きく異なり,対象曲に使用されているドラムスの正確なテンプレートが事前に用意できないことである.我々は,この問題を解決するために,新しいテンプレート適応手法とテンプレートマッチング手法を提案する.まず,テンプレート適応手法を用いて,各ドラムごとに1つの基本テンプレートを,対象曲中に使用されているドラム音に適応させる.次に,距離尺度を改良したテンプレートマッチング手法を用いて,ドラムスの音源同定を行う.ポピュラー音楽を対象にした音源同定実験の結果,テンプレート適応により,バスドラムとスネアドラムの平均認識率が68%から85%まで改善された.This paper describes drum sound identification for real-world polyphonic musical audio signals. The most critical problem with drum sound identification is that acoustic features of drum sounds vary with each musical piece, and thus we cannot prepare their precise templates in advance. To solve this problem, we propose new template-adaptation and template-matching methods. The former method adapts a single base template model prepared for each drum sound to the corresponding drum sound appeared in the target musical piece. The latter method uses the distance measure that enables the adapted templates to be matched with the corresponding sounds in a mixture of them and other instruments. Experimental results showed that the average accuracy of identifying bass and snare drums in popular music is improved from around 68% to around 85% by the template adaptation.
著者
吉井 和佳
出版者
京都大学
雑誌
特別研究員奨励費
巻号頁・発行日
2005

採用第3年度ではまず、開発した音楽推薦システムを実用化する上での重大な問題点を克服することに取り組んだ。また、音楽の内容として音色だけでなくリズムを考慮できるようにシステムを拡張した。さらに、ドラム音認識技術を音楽ロボット開発に応用することを試みた。これはホンダ・リサーチ・インスティテュート・ジャパンとの共同研究である。(1)ハイブリッド型楽曲推薦システム我々はこれまで、確率モデルを用いて楽曲評価と音響的特徴とを統合し、ユーザの嗜好にあった楽曲を精度良く選択できるシステムを開発した。しかし、データ変化に対する適応性やデータサイズに対するスケーラビリティが欠如していた。そこで、確率モデルをデータ変化に合わせて逐次的に更新可能にするインクリメンタル学習法を提案し、適応性の問題を解決した。さらに、インクリメンタル学習法をクラスタリング手法と統合することで、巨大なデータに対しても確率モデルを効率的に学習できる手法を提案した。この成果は音楽情報処理分野で最難関の会議であるISMIR2007にて発表し、好評を得た。(2)音楽ロボット開発本研究では、音楽を自らの耳で聴きながらリズムに合わせて自律的に足踏みできる二足歩行ロボット(ASIMO)の開発を行った。近年、テレビや博覧会で目にする音楽ロボットは一見音楽に合わせて動作しているように見えるが、実際はロボット自身が音楽を聞いているわけではなく、人間が事前にすべての動作および動作タイミングをプログラミングしている。我々は、頭部ヘッドフォンにより録音された音響信号中のビート時刻を検出・予測し、フィードバック制御に基づいて足踏みをコントロールするロボットを開発した。ビート検出・予測部は我々のドラム音検出術を応用して実装した。この成果はロボティクス分野で最難関の会議であるIROS2007にて発表した。ロボティクス分野ではこれまでハードウェア面での改良が主な興味であったが、ロボットの知的能力開発の重要性を指摘した我々の研究発表は多くの聴衆を集めた。
著者
奥乃 博 北原 鉄朗 吉井 和佳
出版者
一般社団法人 電気学会
雑誌
電気学会誌 (ISSN:13405551)
巻号頁・発行日
vol.127, no.7, pp.417-420, 2007-07-01 (Released:2007-09-01)
参考文献数
23

本記事に「抄録」はありません。