著者
松野 勝弘 李 七雨 辻 三郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1591-1600, 1994-08-25
被引用文献数
66

本論文では,物理モデルであるポテンシャルネットとKL展開を組み合わせた顔表情認識の手法について述べる.ポテンシャルネットは,ノードが2次元グリッド状に相互にばねで連結された構造をもつ.画像からの力によって各ノードが顔器官の特徴に移動するためネットは変形し,変形したネットの形状には顔の特徴が反映されている.ポテンシャルネットにより求めた高次元の特徴ベクトル空間から,認識に有効なより低次元の特徴ベクトル空間を構成するために,照合パターンの特徴ベクトルの集合をKL展開して正規直交基底を求める.次に,求めた正規直交基底で表現される低次元のカテゴリー空間を構成し,この空間で入力パターンと照合パターンの距離を求め,最小距離判別法により認識を行う.本手法を未知の人物に対する識別能力,照明条件変動に対する耐久性,位置ずれに対する安定性の観点から評価し,その有効性を示した.
著者
渡辺 孝弘 李 七雨 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.6, pp.1571-1580, 1997-06-25
被引用文献数
43

本論文では, インタラクティブシステム構築に適した動画像からの実時間ジェスチャ認識手法について述べる. 本手法は, ジェスチャを行う特定部位の部分画像を低次元のジェスチャ空間内で表現することによって, 大量の動画像情報を効率的に処理するものである. まず, 画像中からジェスチャを行う特定部位がMaskable Template Model (MTM) を用いて実時間でロバストに抽出される. MTMとはさまざまに変形する物体との柔軟なマッチングが行えるように, 従来のテンプレートマッチングの手法を我々が改良したものである. 次に, その抽出された部位画像系列をジェスチャ空間に投影して入力ジェスチャ曲線として表現し, この曲線とモデルジェスチャ曲線を比較することによってジェスチャを認識する. ここでのジェスチャ空間は, モデルジェスチャの部位画像系列をKL展開することによってあらかじめ構成しておく. 我々は, 本手法を利用して実時間インタラクティブシステムー仮想指揮システムを実現した. 本システムは, ユーザが行う指揮者のジェスチャを認識して, 計算機が奏でる音楽を実時間で制御するもので, 本手法の有効性を示すものである.
著者
宋 欣光 李 七雨 徐 剛 辻 三郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1601-1609, 1994-08-25
被引用文献数
52

本論文では,顔器官の一部分を表す部分特徴テンプレートPFT(Partial Feature Template)を用いて顔器官部分特徴の抽出について述べる.PFTは顔器官のコーナー部分の特徴を一般化されたエッジ形状として再構成したものである.このモデルは器官の全体形状を特徴として扱うモデルより,エッジパターンの変形と照明条件の変動の影響を受けず,容易に顔の各器官を抽出することができる.PFTは局所的な特徴を取り出すのみに用い,全体の形状を推定するため,顔の各器官の間に成り立つ幾何学的制約を記述したGFM(Global FacialModel)を導入する.GFMは顔の回転と拡大縮小に対して不変性をもつため,PFTを用いたマッチングの結果から顔器官の部分特徴の正確な位置を定めることができる.顔器官の探索実験の結果,11人の50枚の顔画像に対して80%の成功率が得られた.また100フレームの連続動画像を用いた顔器官の探索実験では,99フレームの画像から正しい結果が得られた.