著者
湯谷 承将 山本 雄也 中谷 秀洋 寺澤 洋子
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2023-SLP-147, no.8, pp.1-7, 2023-06-16

シンセサイザーは現代の音楽制作や演奏活動において,不可欠な存在である.一方で音色生成に用いられるパラメータは複雑かつ技術的な用語が多く,プレイヤーが望む音色を得るためには習熟が必要とされる.本研究では, ウェーブテーブル合成[2, 14, 32]と呼ばれる音響合成方式において,意味的な表現を用いた,オーディオ・エフェクト/波形生成手法を提案する.これは,ユーザーが使用したいウェーブテーブルを選択し,所望の音色を意味的なラベルによって指定する事で,その特性を付与した一周期の波形を生成する事で実現される.提案手法では,Conditional Variational Autoencoder (CVAE)[18] を利用して, ウェーブテーブルの条件付け生成を行う. 条件付けには,音響特徴に基づいて算出した明るさ (bright),暖かさ (warm),リッチさ (rich)という 3 つの意味的ラベルを用いる.さらに,ウェーブテーブルの特徴を捉えるために,畳み込みとアップサンプリングを用いた CVAE モデルを設計する.また,生成時の処理を時間領域でのみ行うことで処理時間を削減し,リアルタイム性を確保する.実験結果から,提案手法は意味的ラベルを入力として用いてウェーブテーブルの音色をリアルタイムに制御できる事を定性的・定量的に示す.本研究は,データに基づいた意味的なウェーブテーブル制御の実現による直感的な音色探索を目指す.