著者
半田 正樹 長井 隆行 榑松 明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CAS, 回路とシステム (ISSN:09135685)
巻号頁・発行日
vol.100, no.717, pp.1-6, 2001-03-22
参考文献数
7

音声認識システムでは、周囲に雑音が存在すると認識率が大幅に低下してしまう.複数の人が音声認識システムを利用するような環境では、入力音声に周辺の人の音声が重畳してしまい誤認識をしてしまう.この様な環境でも音声認識システムを効率的に使うためには、入力音声から周辺の人の音声を分離する必要があり、混合音声の分離方法を確立することが求められる.そこで本稿では、周波数振り分けによるマルチチャンネルの混合音声の分離法を提案する.これは、Caoらが提案する固有分解法の周波数領域での解釈から導かれる.本手法は、入力音声をFFTにより周波数領域に変換し、各周波数成分が元々どのチャンネルの成分だったのかを判断して、周波数の振り分けを行うことにより音声分離を行う.独立成分分析(ICA)との性能比較、計算機シミュレーションにおける実験結果、および実環境での実験を通して、本提案手法の有効性を明らかにする.
著者
永井 明人 北 研二 花沢 利行 川端 豪 鹿野 清宏 森元 逞 嵯峨山 茂樹 榑松 明 鈴木 忠 岩崎 知宏 中島 邦男
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.50, no.9, pp.723-729, 1994-09-01
被引用文献数
1

本稿は、大語彙の連続音声認識を実時間で処理するための、HMM-LR連続音声認識装置の設計、処理性能について述べる。HMM-LR法は、一般化LR構文解析により入力音声データ中の音素を予測し、予測された音素の存在確率をHMM音素照合により調べることで、音声認識と言語処理を同時進行させる方式であり、高精度で効率的な処理系を構成することができる。処理量が極めて大きな継続時間制御付きトレリス計算を伴うHMM-LR連続音声認識を実時間で実行するために、本装置は種々の高速化手法を33個のDSPを用いて実現した。その結果、連続文節発声の入力音声に対し、入力文の長さに依らずに、発声終了後から2〜3秒ですべての認識処理を終了する処理速度を達成した。
著者
徐 光哲 金子 正秀 榑松 明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.7, pp.1279-1288, 2001-07-01
参考文献数
6
被引用文献数
25

似顔絵は個人の顔の特徴を端的に表現したものであり, 新聞, 雑誌での利用のほか, ホームページへの掲載, エージェントとしての利用など多くの用途が考えられる. 本論文では, 各顔部品の形状特徴, 配置に関する特徴, 及び傾きに関する特徴を個別に制御可能な, より柔軟性の高い似顔絵生成方法について述べる. まず, 眉, 目, 口などの顔部品の各々について輪郭形状に対する固有空間を求める. これとは別に, 各顔部品の配置情報に関する固有空間を求める. 次に似顔絵を生成しようとする対象顔画像について, 各顔部品の形状, 配置の各々について平均顔との差を求め, 固有空間の基底(固有ベクトル)への直交展開を行う. 直交展開により求められた係数に従って強調倍率を決め, 固有ベクトルに対する強調処理を施す. 顔部品の傾きに対しては, 平均顔における顔部品の傾きとの差を2次関数を用いて強調する. これらの結果に平均形状, 平均配置, 及び平均の傾きを加えることにより, 似顔絵の形状を得る. 生成した似顔絵に対して主観評価実験を行い, 似顔絵の生成方法としての有効性を明らかにする.