著者
榎 将功 皇甫 美華 大田健紘 柳田 益造
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.129, pp.313-318, 2007-12-21
参考文献数
9
被引用文献数
2

音声認識に,認識対象として未登録の略語を使えるようにする方法を提案している.略語の生成はいくつかの規則に従うことが知られている.本研究では,それらの規則により元の表現(原型)から簡略後の表現(略語)を自動的に生成することを考えている.規則の適用により略語の候補を多数生成し,各候補に対し,どの規則を適用して生成したか,略語の言語モデルに整合しているか,Web 上での使用頻度は多いか,の3つの基準により略語らしさとしてのスコアをつけ,上位からいくつかの候補を選んで認識対象辞書に加えるという方略を提案している.提案法により原型 40 語から略語候補を生成し,各原型につき略語らしい候補を 10 語ずつ選んだところ,約 80%の略語をカバーできている.音声認識システムに提案法を応用したところ,認識語彙の増大による認識率の低下を十分上回る略語認識ができるようになっている.Proposed is a method to generate abbriviated forms of Japan expressions to accept them as words to be recognized even in case they are unregistered for speech recognition. It is known that there are several rules to generate abbriviated forms from original expressions. Proposed is automatic generation of abbriviated forms from an original expression. The proposed method generates several tens or hundreds of candidates of an abbriviated form by applying possible generation rules to the original expression. A scoring system to prune the candidates for each original expression is designed on the following three criteria; which generation rule is adopted, accordance with the language model of abbriviation, and appearance frequency on the Internet. Candidates having score ranked within the top N are registered into the word list for recognition. To evaluate the method, the proposed method is used to generate candidates of abbriviated forms from 40 original expressions, and the system choses 10 candidates for each original expression referring to the score. About 80% of the correct abbriviations were included in the top 10 candidates. The output of the proposed method is fed to a speech recognition system yielding recognition improvement sufficiently compensating decrease of recognition rate due to enlargement of vocabulary size.
著者
半田 晶寛 レアンドロディペルシア 大田健紘 柳田 益造
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.12, pp.1-6, 2006-02-03
参考文献数
10

残響環境下で,周波数領域ICAによるブラインド音源分離を行った際,持続時間が比較的長い混合音声に対してはある程度の分離精度を得ることができるが,1秒前後の短時間混合音声に対しては十分な分離精度をあげるに至っていない.主な原因は各周波数ビンでのデータ量不足と考えられる.そこで本稿では1秒前後の短時間混合音声における短時間フーリエ変換をする際の最適な窓長とシフト幅の調査を行い,データ量不足の影響を軽減させ,さらに周波数領域ICAの後処理として各周波数ビンでWienerフィルタを適用させることで,分離精度の向上を図った.Frequency-domain ICA is effective for separating mixed speech signals of long duration but it is not the case for signals of short duration in environments having ordinary reverberation time. The main reason would be lack of data in each frequency bin. The optimal window size and shifting interval for separating short speech are investigated, and Wiener filter is adopted in each frequency bin as post-processing of frequency-domain ICA.
著者
安井 耕平 野口 忠繁 大田健紘 レアンドロ・ディ・ペルシア 柳田 益造
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.136, pp.59-64, 2006-12-21
参考文献数
6

周波数領域独立成分分析に基づくブラインド音源分離において、近傍周波数ビンを連結することにより分離対象となる周波数ビンの関する分離行列を安定して求める周波数領域ICAの検討を行っている。Di Persiaらの提案したパーミュテーションフリーICAでは、全周波数ビンで分離行列が共通になってしまい、周波数ビン毎に最適な分離行列を生成することになっていないという問題があった。そこで、本研究では、対象とする周波数ビンの前後数本の周波数ビンを連結することによって、周波数特性の方向依存症を考慮し、かつパーミュテーションも抑えることのできるICAとしてMulti-Bin ICAを提案している。動作解析には反射による周波数特性がどの方向も同一に近い場合と、強制的に周波数特性が方向によって異なるようにした部屋で行った。前者ではパーミュテーションフリーICAとMulti-Bin ICAに差はなかったが、後者においてMulti-Bin ICAの有効性を確認できた。Proposed is a processing scheme of Blind Source Separation(BSS) employing frequency-domain Independent Component Analysis(f-ICA) to a vector consisting of time series of adjacent frequency components, contrasting with Parmutation-Free ICA(PF-ICA) applying f-ICA to a vector consisting of all the frequency components. The proposed method is named Multi-Bin ICA(MB-ICA). It can treat directionality of frequency characteristics of the sound field, while PF-ICA proposed by Di Persia cannot treat directionality of frequency characteristics. Its performance is confirmed by comparing with those of ordinary ICA and PF-ICA for room environments of almost equal directionality and of forcedly asymmetrical directionality in the room characteristics.