著者
大中 緋慧 高道 慎之介 井本 桂右 岡本 悠希 藤井 一貴 猿渡 洋
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2023-SLP-146, no.33, pp.1-6, 2023-02-21

オノマトペとは,音の構造を模倣する文字表現,つまり音の文字表現である.この観点から,所望のオノマトペから環境音を合成する Onoma-to-wave が提案されている.他方,オノマトペには漫画や広告,バーチャルリアリティにおける音の視覚的表現(画像オノマトペ)がある.画像オノマトペには,画像の伸縮などの文字だけでは表現できない表現が含まれており,この表現を用いることでより多様な音の合成が期待できる.そこで本研究は,画像オノマトペから環境音を合成する Visual onoma-to-wave を提案する.本手法は,画像オノマトペに含まれる視覚表現のみならず,環境音源の視覚表現(音源画像)を補助情報として,環境音を合成する.また本論文では,オノマトペの反復表現に着目したデータ拡張手法を提案し,より多様な環境音合成を可能にする.実験評価の結果から,画像オノマトペと音源画像から多様な環境音を合成できることが示す.