著者
半田 晶寛 レアンドロディペルシア 大田健紘 柳田 益造
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.12, pp.1-6, 2006-02-03
参考文献数
10

残響環境下で,周波数領域ICAによるブラインド音源分離を行った際,持続時間が比較的長い混合音声に対してはある程度の分離精度を得ることができるが,1秒前後の短時間混合音声に対しては十分な分離精度をあげるに至っていない.主な原因は各周波数ビンでのデータ量不足と考えられる.そこで本稿では1秒前後の短時間混合音声における短時間フーリエ変換をする際の最適な窓長とシフト幅の調査を行い,データ量不足の影響を軽減させ,さらに周波数領域ICAの後処理として各周波数ビンでWienerフィルタを適用させることで,分離精度の向上を図った.Frequency-domain ICA is effective for separating mixed speech signals of long duration but it is not the case for signals of short duration in environments having ordinary reverberation time. The main reason would be lack of data in each frequency bin. The optimal window size and shifting interval for separating short speech are investigated, and Wiener filter is adopted in each frequency bin as post-processing of frequency-domain ICA.