著者
砺波 紀之 井本 桂右 岡本 悠希 福森 隆寛 山下 洋一
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.78, no.5, pp.217-226, 2022-05-01 (Released:2022-06-01)
参考文献数
42

本論文では,音響イベント検出のための新たな評価指標を提案する。環境音分析のタスクの一つである音響イベント検出の従来の性能評価指標では,イベントの種類によらずすべての誤検出が等しく重み付けされる。提案指標では,音響イベントの種類を考慮しながら深刻な音響イベントの誤検出がより大きく罰則される。また,深刻な誤検出が発生し易いあるいは発生しにくい音響イベント検出モデルを用いて,複数の性能評価指標に対する深刻な誤検出の影響を詳細に分析する。実験結果より,従来指標と比較して,提案指標を用いることで,深刻な誤検出の多いイベント検出モデルの性能がより劣化して評価されることを確認した。
著者
大中 緋慧 高道 慎之介 井本 桂右 岡本 悠希 藤井 一貴 猿渡 洋
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2023-SLP-146, no.33, pp.1-6, 2023-02-21

オノマトペとは,音の構造を模倣する文字表現,つまり音の文字表現である.この観点から,所望のオノマトペから環境音を合成する Onoma-to-wave が提案されている.他方,オノマトペには漫画や広告,バーチャルリアリティにおける音の視覚的表現(画像オノマトペ)がある.画像オノマトペには,画像の伸縮などの文字だけでは表現できない表現が含まれており,この表現を用いることでより多様な音の合成が期待できる.そこで本研究は,画像オノマトペから環境音を合成する Visual onoma-to-wave を提案する.本手法は,画像オノマトペに含まれる視覚表現のみならず,環境音源の視覚表現(音源画像)を補助情報として,環境音を合成する.また本論文では,オノマトペの反復表現に着目したデータ拡張手法を提案し,より多様な環境音合成を可能にする.実験評価の結果から,画像オノマトペと音源画像から多様な環境音を合成できることが示す.