- 著者
-
澤田 隼
竹川 佳成
平田 圭二
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.59, no.3, pp.941-950, 2018-03-15
本稿では,Generative Theory of Tonal Music(GTTM)を音楽のスペクトログラムに直接適用して階層的クラスタリングによってタイムスパン・セグメンテーションを生成する新しい方法を提案する.まず初めに,スペクトログラムを時間軸方向に分割し,周波数方向に縦長の矩形(bin)をピッチイベントとして,スペクトログラムを一連のbinの集合として考える.binのテクスチャの特徴は,グレーレベル同時生起行列(Gray level co-occurrence matrix: GLCM)を使用して抽出され,テクスチャ特徴量の時系列データを生成する.テクスチャ特徴量による隣接bin間の類似度によってフレーズの近接度および変化量が計算される.並列性および反復性などの大域的な構造は,一連のbinの自己相似性行列(Self-similarity matrix: SSM)によって検出される.隣接するbin間の境界の強さを表す時系列データが与えられ,隣接するbinをボトムアップに反復的に併合していくことで,最終的にタイムスパン・セグメンテーションに対応する系統樹を生成するアルゴリズムを開発する.MozartのK.331とK.550を入力して実験を行った結果,音高や調和などの音楽知識をほとんど考慮していないにもかかわらず,有望な結果が得られた.