著者
松野 勝弘 李 七雨 辻 三郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1591-1600, 1994-08-25
被引用文献数
66

本論文では,物理モデルであるポテンシャルネットとKL展開を組み合わせた顔表情認識の手法について述べる.ポテンシャルネットは,ノードが2次元グリッド状に相互にばねで連結された構造をもつ.画像からの力によって各ノードが顔器官の特徴に移動するためネットは変形し,変形したネットの形状には顔の特徴が反映されている.ポテンシャルネットにより求めた高次元の特徴ベクトル空間から,認識に有効なより低次元の特徴ベクトル空間を構成するために,照合パターンの特徴ベクトルの集合をKL展開して正規直交基底を求める.次に,求めた正規直交基底で表現される低次元のカテゴリー空間を構成し,この空間で入力パターンと照合パターンの距離を求め,最小距離判別法により認識を行う.本手法を未知の人物に対する識別能力,照明条件変動に対する耐久性,位置ずれに対する安定性の観点から評価し,その有効性を示した.
著者
辻 三郎 今井 正和 山田 誠二 石黒 浩 徐 剛
出版者
大阪大学
雑誌
一般研究(B)
巻号頁・発行日
1991

自律的に環境を観測し、そのモデルを作成する知能ロボットを実現するために全方位ビジョンを開発し、その能動的利用方式の確立を研究の目的とする。[1]全方位画像理解の研究 カメラを回転させながら連続的に撮像した画像列から作成する全方位画像は、広い視野を持つが、物体までの距離が得られない欠点があった。本研究では、カメラを円弧上で移動しながら連続撮像し、2本のスリットからサンプルする2枚の全方位画像間の視差から距離情報を算定する方式を考案し、実験で有効性を検証した。[2]全方位画像から環境地図の作成 全方位ステレオの距離情報から粗い環境地図を構成し、それに基づいて次の観測点を計画し、移動して観測を繰り返す。それぞれの場所で得られた全方位ステレオデータを融合して、より信頼性のある地図を作成する方式を提案し、実験で検証した。[3]能動ビジョンによる環境地図の作成 全方位ステレオは、基準線が短く精度の高い計測は難しい。そこで、離れた2点での2枚の全方位画像を用いて計測する両眼全方位ステレオが有効と考えられる。しかし、ロボットが移動するために2点間の距離と、移動前後の回転成分を決定する必要がある。環境内の2個の特徴点を360度の視差に保ちながら移動するアクティブビジョンの方式を利用することにより、回転成分を0とし容易に高精度で環境地図を作成する考えを提案し、実験で有効性を示した。[4]定性的室内地図の作成 ロボットの移動のためには、環境の構造を示す定性的地図が有用である。ロボットが、自律的に環境観測の計画を作り、それに従って全方位パノラマ画像、経路パノラマ画像を撮像し、それらを融合して地図を作成するシステムを試作し、実環境で検証した。
著者
瀬川 英吾 徐剛 辻 三郎
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.1992, no.73(1992-CVIM-079), pp.33-36, 1992-09-17

画像から対象物の輪郭線を抽出することは、非常に重要である。Kassらによって提案されたsnakeは、輪郭線を抽出する問題を、エネルギー関数の最小化問題に変換する。しかし、snakeを望ましい輪郭に収束させるためには、適切な初期位置を設定する必要があり、また、パラメータも適切な値に設定しなければならない。従来、これらのパラメータは、試行錯誤によって決められていた。本報告では、snakeを円で近似することによって、パラメータの設定を簡単化する方法について述べる。
著者
宋 欣光 李 七雨 徐 剛 辻 三郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1601-1609, 1994-08-25
被引用文献数
52

本論文では,顔器官の一部分を表す部分特徴テンプレートPFT(Partial Feature Template)を用いて顔器官部分特徴の抽出について述べる.PFTは顔器官のコーナー部分の特徴を一般化されたエッジ形状として再構成したものである.このモデルは器官の全体形状を特徴として扱うモデルより,エッジパターンの変形と照明条件の変動の影響を受けず,容易に顔の各器官を抽出することができる.PFTは局所的な特徴を取り出すのみに用い,全体の形状を推定するため,顔の各器官の間に成り立つ幾何学的制約を記述したGFM(Global FacialModel)を導入する.GFMは顔の回転と拡大縮小に対して不変性をもつため,PFTを用いたマッチングの結果から顔器官の部分特徴の正確な位置を定めることができる.顔器官の探索実験の結果,11人の50枚の顔画像に対して80%の成功率が得られた.また100フレームの連続動画像を用いた顔器官の探索実験では,99フレームの画像から正しい結果が得られた.