著者
小野 順貴 SCHEIBLER ROBIN
出版者
首都大学東京
雑誌
特別研究員奨励費
巻号頁・発行日
2017-11-10

本研究の目的は、音を光に変換するセンサノードとカメラを組み合わせ、カメラを一種の多チャンネル音響デバイスとして用いる新たな多チャンネル音響信号処理の枠組みを構築することである。これらにより、従来は困難であった広範囲に分散するセンサノードからの音響情報の取得を容易にし、音響シーン認識、音源定位、音源強調などをカメラによって行う新しい音響応用システムを実現することを目指している。2018年度は以下の研究成果を得た。1) 音強度情報からの音源定位を行った。具体的には,首都大学東京日野キャンパスの体育館において,多数の音光変換デバイス「ブリンキー」を配置し,ビデオカメラで撮影したブリンキーの光強度信号から,機械学習により画像上での音源位置を推定した。2) 前年度に引き続き,通常のマイクロホンアレイと組み合わせ、光信号を教師信号として用いる教師有りビームフォーミングを行い、その有効性を確認した。3) 複数音源を扱えるようにするため,ブリンキーで取得した音強度信号を非負値行列分解により分離する手法を考案し,実環境でも分離できることを確認した。さらに,4) 2)の拡張として,通常のマイクロホンアレイとブリンキーを組み合わせたマルチモーダルブラインド音源分離の理論を構築し,シミュレーションにより有効性を確認した。5) 音響シーン認識やイベント検出への応用として,人,自転車,バイクなどの通行の検出,研究室環境での複数人での会話といった実環境シーンでデータ取得を行い,分析法について検討した。