著者
林 健太郎 久野 義徳 白井 良明
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.40, no.2, pp.556-566, 1999-02-15
被引用文献数
9

本論文では 画像から抽出した上半身の3つの特徴点を基準とし 手の3次元位置 方向を計測する手法を提案する. 著者らが先に発表した手法では 3次元情報を計算する際に基準となるアフィン座標系を作るための4つの特徴点をユーザの体から抽出していた. このとき 4点は同一平面上にあってはならないので ユーザの姿勢は大きな拘束を受けていた. 本論文では アフィン座標系を作る特徴点のうちの3点を体上にとり その3点が作る平面の法線上の1点を仮想的な4点目とする. このようにすれば3つの特徴点でアフィン座標系が作れるので ユーザの姿勢を拘束しないヒューマンインタフェースを構築できる. 実験として シミュレーションによって仮想基準点を求める手法を検証する. また 応用例として本手法を用いたプレゼンテーションシステムを構築し ヒューマンインタフェースとして有効であることを示す.This paper describes a method to measure the user's 3D hand position and orientation using 3 features on the upper body of the user. The method proposed by the authors before used 4 feature points attached on the user's body. The user's pose was restricted because these 4 features must not be coplanar. Thus, we propose to use a virtual feature as the 4th feature, which is calculated by using the normal direction of the plane made by the 3 features. This method allows the user to move freely. The experimental results show that the proposed method is useful for the interface of presentation systems.
著者
白井 良明
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2016-CVIM-200, no.16, pp.1-6, 2016-01-14

これは,CVIM 研究会の 200 回を記念した講演の概要である.まず,これまでの発展を概観し,現在の CV の傾向と問題点を述べる.とくに,最近盛んになっている学習による画像認識の限界を指摘する.人の能力に近付けるためには,まだやることがある.そこで,人の視覚能力実現のため,のアプローチとして,これまで筆者が試みてきた研究をいくつか簡単に紹介する.
著者
荒木 祐一 島田 伸敬 白井 良明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.101, no.569, pp.87-94, 2002-01-11
被引用文献数
24

本論文では複雑背景下において大きさや位置, 方向が未知な顔を検出し, その顔の方向を推定する手法を提案する.まず, 目や口といった顔要素の候補を抽出し, 各顔要素らしさを計算する.次に, 顔としての幾何学的位置関係を満たしている顔要素の候補の組合せを顔として検出する.しかし, さまざま顔の大きさや方向を考慮する必要があるのでその組合せの数は膨大になる.そこで, その組合せの数を減らすために, 一般化ハフ変換により顔の候補領域の位置と大きさを限定する.その後, 確率の更新方法と効率的な顔検出を行なうために顔要素の候補間の影響の計算を修正した弛緩法を顔の各候補領域に適用する.顔を検出した後, 顔の輪郭に対する両目の位置によりその顔の方向を推定する.
著者
明神 聖子 白井 良明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎 (ISSN:21859329)
巻号頁・発行日
vol.110, no.238, pp.1-5, 2010-10-14
参考文献数
18

本研究では,ユーザの視界に入りこみながら,ユーザ間の日常的な会話を邪魔することなく,システムの存在に気を留めたときにはユーザの会話を促進するインタフェースを提案する.本インタフェースでは,ユーザが突っ込みを入れたくなるように,独り言のストーリー展開において,ユーザの予測を裏切る.そのことによって,ユーザは他者を意識した突っ込みを入れたくなり,会話が活性化すると考えられる.また本研究では,システムが語る内容として,「思い出」を採用する.システムが,思い出を独り言で一部始終語ることによって,その思い出のトピックに関するユーザの記憶を想起させる.また,その独りごとに対する他者の感想やコメントを提示することによって話題の幅を広げる.
著者
森昭太 松尾直志 白井良明 島田伸敬
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2013, no.20, pp.1-6, 2013-03-07

画像から手話を認識するためには,顔・手領域を抽出する必要があり,特に手形状の抽出は非常に重要である.しかし手話によっては手同士,顔と手で隠蔽がおこる場合がある.その場合,肌色やエッジ検出のみでは顔と手を分離することが困難であった.そこで深度センサ(Kinect for Xbox360)を用いることが考えられる.しかし手話によっては顔と手が密着する場合には,顔・手を分離することが困難である.本手法では,1フレーム前の手領域を現在フレームの手領域があると推測される領域に対して顔の3次元テンプレートマッチングを行うことによって,手領域候補を抽出する.その領域に手以外の領域が含まれていないか距離のヒストグラムから判別分析法により自動で判断し手領域を求める.手同士の隠蔽時も同様の処理を行う.その結果,隠蔽が起こる手話に対して隠蔽中の顔・手領域を正確に分離し,手話認識に用いる領域特徴を抽出する.以上をの手法の有効性を実験によって確かめた.
著者
長井 敦 久野 義徳 白井 良明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.5, pp.1086-1095, 1997-05-25
被引用文献数
50

複雑に変動する背景を伴うシーンにおいても有効に機能する移動物体の検出手法を提案する. シーンの動き場において移動物体に対応する部分は, 空間方向に一様で, かつ滑らかに移動することを利用して検出を試みる. オプティカルフローを抽出し, 空間的に均一なフローをもつ領域を切り出して, 得られた領域が移動物体(若しくはその一部)であると仮定する. その後の予測される時空間上の位置に投票を行うことにより, シーン内を横切ったものだけを移動物体として検出する. 背景変動の程度に応じて, 適応的に検出の際の投票値のしきい値を決定する. 移動物体に対して等速直線運動の拘束を与える場合と, 加速度への対応のための拡張手法のそれぞれについて述べる.
著者
白井 良明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会誌 (ISSN:09135693)
巻号頁・発行日
vol.89, no.2, pp.173-175, 2006-02-01
被引用文献数
2
著者
根岸 善朗 三浦 純 白井 良明
出版者
日本ロボット学会
雑誌
日本ロボット学会誌 (ISSN:02891824)
巻号頁・発行日
vol.21, no.6, pp.690-696, 2003-09-15 (Released:2010-08-25)
参考文献数
15
被引用文献数
5 11

This paper describes a map generation method using an omnidirectional stereo and a laser range finder. Omnidirectional stereo has an advantage of 3D range acquisition, while it may suffer from a low reliability and accuracy in range data. Laser range finders have advantage of reliable acquisition of data, while they usually obtain only 2D range information. By integrating these two sensors, a reliable map can be generated. Since the two sensors may detect different parts of an object, a separate probabilistic grid map is first generated by temporal integration of data from each sensor. The resultant two maps are then integrated using a logical integration rule. An ego-motion estimation method is also described, which is necessary for integration of sensor data obtained at different positions. Experimental results on autonomous navigation in unknown environments show the feasibility of the method.
著者
島田 伸敬 白井 良明 久野 義徳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRU, パターン認識・理解
巻号頁・発行日
vol.94, no.50, pp.25-32, 1994-05-19
被引用文献数
9

本論文では,手指の単眼視時系列シルエット画像から三次元形状モデルを用いて手指姿勢を解釈する手法について述べる.まず時間的な拘束から予測される手の平の姿勢をモデルを用いて生成し入力画像のシルエット形状との適合度を評価することで手の平の姿勢候補を選択する.さらに手の平の候補について各指の姿勢候補をモデルを用いて生成し,輪郭の突起特徴にもっとも適合するものを推定する.突起特徴に対応しない指の姿勢はシルエットとの重なりの形状と面積を考慮して選択する.最後に実際の手指画像に対して行った実験の結果を示す.