著者
魏 回 北村 正 岩田 彰 鈴村 宣夫
出版者
電子情報通信学会情報・システムソサイエティ
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 = The transactions of the Institute of Electronics, Information and Communication Engineers (ISSN:09151923)
巻号頁・発行日
vol.75, no.4, pp.689-696, 1992-04-25
被引用文献数
4

多数のカテゴリーを分類する一つの手法として,我々は大規模ニューラルネット(CombNET-II)を提案した.これは,前段に入力ベクトルを大分類するためのベクトル量子化型ニューラルネットを配置し,後段にグループ内のデータを細分類するための階層ニューラルネットを配置した.くし型の構成をしている.本論文では,CombNET-IIを用いる大語いの音声認識手法を提案し,この方法を中国語の単語音声認識に適用し,その有用性について検討する.音声信号から2次元メルケプストラム法によって求められる特徴量をCombNET-IIの入力に用いる.2次元メルケプストラムは音声の静的特徴と動的特徴を同時に分析でき,音声認識には有効なパラメータである.今回の音声認識実験では,特定話者が中国語で発声した世界の国名と都市名1000単語を用いた,各単語を5回ずつ発声し,この中の4回分のデータで学習を行い,残りの1回分のデータを認識させたところ,99.0%の認識率が得られ,本方法の有効性が示された.
著者
堀田 健一 岩田 彰 松尾 啓志 鈴村 宣夫
出版者
電子情報通信学会情報・システムソサイエティ
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 = The transactions of the Institute of Electronics, Information and Communication Engineers (ISSN:09151923)
巻号頁・発行日
vol.75, no.3, pp.545-553, 1992-03-25
被引用文献数
37

一般にニューラルネットが大規模になると,結合数が急速に増加し,また学習の収束が困難になるなどさまざまな問題が生じる.これを改善するために我々は,ベクトル量子化ニューラルネットと階層型ニューラルネットを組み合せたCombNETと名づけたネットワークモデルを提案している.しかし,前段のベクトル量子化ニューラルネットにおけるカテゴリーの大分類が均等にならないという問題が生じた.本論文ではこの問題を解決する手法として,自己増殖型ニューラルネットと呼ぶベクトル量子化ニューラルネットを考案し,このネットワークを適用したCombNET- IIを提案する.このネットワークの利点は二つある.まず第1に,前段で各グループに属するカテゴリーがほぼ均等になるように分割されることである.また第2には,分類するカテゴリーの増減にニューロンの数を柔軟に対応させて変化する点にある.今回はこのCombNET-IIをJIS第1,2水準印刷漢字の識別に適用し,前段における大分類の様子,カテゴリー数の変動に対する能力および識別率の検証を行った.
著者
山田 博司 長坂 保典 鈴村 宣夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.98, no.608, pp.65-72, 1999-02-18
被引用文献数
2

本研究では手話の認識を目的として、人の上半身を撮影した動画像より手の動きを認識することを検討した。青い手袋をして三角や丸などの図形を手の動きにより描き、アフィン変換による圧縮や色情報などを用いて手の位置を特定する。その図形に対して手の移動量を登録パターンとして記録しておく。次に任意の図形を描いている動画像と登録パターンの手の位置を比較する。そのユークリッド距離より連続DPマッチングを用いて入力された動作を認識する。動作は全て単純な動きの組み合わせとして表現し、複雑な動きはその連続として考えて認識を行う。また、実時間での認識が可能な装置を作成しその評価実験により、動作の登録者以外の人物であっても動作の認識が可能であることを示した。