著者
魏 回 北村 正 岩田 彰 鈴村 宣夫
出版者
電子情報通信学会情報・システムソサイエティ
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 = The transactions of the Institute of Electronics, Information and Communication Engineers (ISSN:09151923)
巻号頁・発行日
vol.75, no.4, pp.689-696, 1992-04-25
被引用文献数
4

多数のカテゴリーを分類する一つの手法として,我々は大規模ニューラルネット(CombNET-II)を提案した.これは,前段に入力ベクトルを大分類するためのベクトル量子化型ニューラルネットを配置し,後段にグループ内のデータを細分類するための階層ニューラルネットを配置した.くし型の構成をしている.本論文では,CombNET-IIを用いる大語いの音声認識手法を提案し,この方法を中国語の単語音声認識に適用し,その有用性について検討する.音声信号から2次元メルケプストラム法によって求められる特徴量をCombNET-IIの入力に用いる.2次元メルケプストラムは音声の静的特徴と動的特徴を同時に分析でき,音声認識には有効なパラメータである.今回の音声認識実験では,特定話者が中国語で発声した世界の国名と都市名1000単語を用いた,各単語を5回ずつ発声し,この中の4回分のデータで学習を行い,残りの1回分のデータを認識させたところ,99.0%の認識率が得られ,本方法の有効性が示された.