著者
津島 啓晃 中村 栄太 糸山 克寿 吉井 和佳
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2017-MUS-116, no.14, pp.1-7, 2017-08-17

本稿では,音楽コーパスから和音系列とメロディに関する生成規則を統計的に学習し,それに基づいてメロディへの和声付けを行う手法を示す.従来の和声付け手法には,一拍ごとのコードの遷移を表現した隠れマルコフモデル(HMM)に基づく手法がある.しかしこの手法では,音楽理論において重要とされているコードのリズム,コードの機能(tonic, dominant, subdominant),コードの階層構造を明示的に表現できない.この問題を解決するため,確率的文脈自由文法による和音系列生成モデル,拍節マルコフモデルによるコードのリズム生成モデル,コードの条件付きマルコフモデルによる音高系列生成モデルからなる階層的生成モデルを提案する.さらに,提案モデルを用いてメロディに対する和音系列の推定を行うため,潜在変数であるコード記号とそのオンセット位置のそれぞれをsplit-mergeサンプリングという新しいサンプリング手法を含むメトロポリス・ヘイスティングス法に基づいて更新する手法を提案する.評価実験よりHMMに基づく手法に対して提案手法の和声付けタスクにおける精度が向上したことを示せた.
著者
呉 益明 Tristan Carsault 中村 栄太 吉井 和佳
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2019-MUS-124, no.5, pp.1-6, 2019-08-20

本稿では,正解コードラベル付きの音楽音響信号 (教師ありデータ) に加えて,ラベルが付与されていない音響信号 (教師なしデータ) を同時に利用するための,深層ニューラルネットワーク (DNN) に基づくコード推定法について述べる.従来の DNN に基づく識別的アプローチは,大量の教師ありデータを用いることで優れた推定精度を達成できるが,コードラベルの付与には多大な労力が必要であり,精度向上には限界があった.一方,隠れマルコフモデルなどの確率モデルに基づく生成的アプローチは,原理的に半教師あり学習が可能であるものの,モデルの表現力の貧弱さから,推定精度の面で劣っていた.これらの問題を解決するため,本研究では,高い表現力を持つ DNN に基づく深層生成モデルと,償却型変分推論法に基づく半教師あり学習法を提案する.具体的には,まず,コードラベル系列と音響テクスチャ系列を潜在変数とし,音響的特徴量を観測変数とする生成モデルを定式化する.観測変数が与えられた際に,潜在変数の事後分布を推定するため,音響的特徴量からコードラベル系列を推定する識別モデルと,音響的特徴量とコードラベル系列から音響テクスチャ系列を抽出する推論モデルを導入する.与えられた音楽音響信号に対して,教師ラベルの有無に関わらず,変分自己符号化器の枠組みでこれら三つの深層モデルを同時最適化することができる.実験の結果,教師なしデータに対しても,コードラベル情報と音響テクスチャ情報が適切に分離された表現学習を行うことができること,半教師あり学習を行った識別モデルが,教師ありデータのみで学習した識別モデルよりも高い認識精度を実現できることを確認した.
著者
中村 栄太 齋藤 康之 吉井 和佳
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2019-MUS-124, no.12, pp.1-16, 2019-08-20

ピアノ運指の自動推定は,音楽演奏過程を情報学的に理解するために重要であり,演奏支援や演奏学習支援技術へ応用可能である.運指の良さを定義する自然な方法は演奏の制約やコストのモデルを構成することであるが,一般的にこれらのモデルでは適切なパラメータの値を見つけるのは難しい.本稿では,統計モデルに基づくデータ駆動型のアプローチを考え,与えられた運指の自然さを確率に基づいて記述する方法について調べる.具体的には,2種類の HMM (隠れマルコフモデル) とその高次の拡張を構成する.比較手法として,DNN (深層ニューラルネットワーク) に基づく方法も調べる.新しく公開したピアノ運指のデータセットを用いて,これらの手法の学習と評価を行い,制約に基づく代表な手法との比較評価も行う.評価に関しては,運指の個人的差異を考慮して,複数の正解運指データがある場合に使える新たな評価指標を考案した.評価の結果,高次 HMM に基づく手法がその他の手法よりも推定精度が高いことが明らかになった.運指モデルに基づく演奏難易度の定式化およびピアノ用編曲への応用についても議論する.