著者
米田 隆一 西本 卓也 嵯峨山 茂樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.129, pp.31-36, 2005-12-23

本研究では、Standard MIDI File 楽譜等のシンボリックな音楽情報を入力として対旋律、和音、調等のラベルを付与する汎用的な手法を提案する。このような音楽のラベル付与問題は、音声認識における言語モデルとの類似性から、マルコフモデル、および生成モデルとしての HMM (hidden Markov models) を適用することが多かった。本研究でも確率モデルを踏襲するが、MIDI、楽譜などは、縦の和音、横の声部進行等、2次元的な情報であり、マルコフ連鎖のような一次元的なモデリングでは不十分である。このような背景のもと、より広いコンテキストを重視すべきであるという考えが生まれる。マルコフ確率場(Markov random field)モデルは、ノード間の関連をエッジであらわす一種の無向グラフモデルであり、エッジを設計することにより広いコンテキストを柔軟に設定できる。また、マルコフ確率場では我々の持つ音楽的知識を素性関数の設計(エッジの設計)という操作に還元することが可能、という利点を持つ。さらに、識別モデルであるという点でHMMとは異なり、可能なすべての出力系列を入力系列の条件付き確率として求めることができるという点で、条件付き確率場(conditional random fields)とも呼ばれる。本研究ではマルコフ確率場モデルに基いたさまざまな音楽情報処理に対するアプローチを論じる。本手法は汎用であり、応用範囲は多岐にわたるが、本稿では対旋律付け、和声付け、ドミナント定型句の同定、和声解析、調認識に対するアプローチを述べる。考えられる他の応用としては、リズム認識、楽曲のパージング、音楽情報検索など広範囲にわたる。This paper describes a Markov random field approach for labeling tasks such as key finding, automatic harmonization, and automatic counterpoint. Most of our previous work deal with these labeling problems using Markov models, and hidden Markov models as a generative model, analogous to language models of automatic speech recognition. This work follows our previous probabilistic approach. 1-dimensional Markov chain, however, cat not model large musical context like scores and SMFs(standard MIDI files) which have rich information in that chords and melodies spread 2-dimesionally. Thus the ability of dealing with large context is crutial in music modeling. Markov random field is a kind of undirected graphical models in which edges are regarded as relevances between nodes. The design of edges (feature functions) corresponds to our music knowledge in which nodes (symbols) have relevances with each other. Markov random field is also called as conditional random fields(CRFs) in that all possible output sequences have conditional probabilites given an input sequence. In other words, CRFs is a discriminative model. Although the proposed model can be applied to many purposes, this paper describes the approaches to five tasks: counterpoint, harmonization, dominant chunk detection, harmony analysis, and key finding. Other possible applications include rhythm recognition, musical parsing, and music information retrieval.

言及状況

はてなブックマーク (1 users, 1 posts)

収集済み URL リスト