著者
西海 嘉志 佐藤 智和 横矢 直和
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.27, pp.321-326, 2008-03-11

静止画像からカメラの位置・姿勢を推定する技術は,現在広く普及しているカメラ付き携帯電話などの小型のカメラ付き端末上における拡張現実感を用いたヒューマンナビゲーションなどに応用できる.従来我々は物理的なインフラを用いずに静止画像一枚からのカメラの位置・姿勢を推定できるランドマークデータベースに基づくカメラ位置・姿勢の推定手法を提案した.しかし,ランドマーク照合のための計算コストが大きく,推定完了までの待ち時間が長いという問題や,類似した自然特徴点が多く存在する環境では推定が失敗するといった課題が残されていた.本稿では,ランドマークの情報に照合の信頼度の指標として特異度を付加し,特異度を考慮してランドマークの探索範囲を空間的に限定することで,誤対応の低減と処理の高速化を実現する手法を提案する.実験では,屋外環境での推定結果を示し,本手法の有用性を確認する.In this paper, we propose a fast and robust camera parameter estimation method from a single image using a feature landmark database with uniqueness of image features. Although we have already developed and proposed a landmark based camera parameter estimation method in which no markers and no positional sensors are needed, its computational cost was expensive and estimation sometimes failed when environment has many similar features. To achieve fast and robust camera parameter estimation, we newly employ uniqueness of image features as a measure for the confidence of feature point matching. In experiment, we show the validity of the proposed method.
著者
小野 友也 岩井 儀雄 谷内田 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.115, pp.193-200, 2008-11-20

近年,拡張現実感・ロボットナピゲーションなどの分野の研究が盛んに行われている.それに伴い,対象物体とカメラの相対的な位置・姿勢を推定することは重要な課題となっている.本論文では '空間周波数を利用した姿勢推定法を提案する.空間周波数を利用して画像にマーカを埋め込み,空間周波数の変化を観測することで現在の姿勢を推定する. OpenGL を用いたシミュレーションを行い提案手法の有効性を確認した.Recently, fields of the augmented reality and the robot navigation are actively researched. Estimating a relative position and a posture between an object body and a camera has become a more important task. In this paper, we propose a posture estimation method using spatial frequency. We embed markers in an image by using spatial frequency and observe changes in the spatial frequency domain to estimate a current posture of the image. We create an application with OpenGL for simulation and show the effectiveness of our method.
著者
岩下 友美 倉爪亮 辻 徳生 原 健二 長谷川 勉
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.109, pp.119-126, 2003-11-06

カメラ画像など2次元,3次元空間内で移動体を追跡する際に,SnakesやDeformable surfaceなどの動的輪郭モデルが広く利用されている.これらはノイズに対して頑強な境界軌跡法であるが,分離や結合など位相変化への対応は困難であった.一方,近年本質的に位相変化が可能なLevel Set Methodが注目を集めているが,この手法は初期化や更新時の計算コストが高いことが問題とされていた.そこで本報告では,高速で安定なLevel Set Methodの解法として提案したFast Level Set Methodの概要を示し,その応用例としてビデオ画像上の移動物体のリアルタイム追跡,およびステレオカメラを用いた人体概形の3次元リアルタイム追跡を紹介する.This paper presents an efficient implementation technique for the level set method(LSM) named the Fast Level Set Method (FLSM). Various applications based on the LSM have been presented including motion tracking and 3D geometrical modeling. However, the calculation cost of reinitialization and updating of the implicit function is considerably expensive as compared with the cost of conventional active contour models such as "Snakes". To tackle this problem, we have proposed an efficient algorithm of the LSM named the FLSM. This paper introduce some experiments of realtime tracking of moving objects in video images and 3D stereo range images using the FLSM.
著者
川上 裕司 伊藤 吉弘 金澤 靖
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.6, pp.37-44, 2004-01-22

未校正なステレオカメラにおいて,シーン内に存在する局所的な平面領域のロバストな抽出法を提案する.ここでは,予め画像の対応づけプログラム等により,画像の特徴点間の大まかな対応は取れているものとし,各特徴点に対して,他の全ての特徴点に対する距離を元にした確率分布を定義する.そして,その確率分布を用いて2重のランダムサンプリングによるRANSACを行なうことにより,シーン内の複数の平面領域を検出する.本手法は,ロバストかつ正確に平面領域を検出することができるだけでなく,画像内の直線検出のような他の局所特徴の検出に対しても応用できる.シミュレーションおよび実画像を用いた実験により,本手法の有効性を示す.We propose a robust method for detecting local planar regions in a scene with an uncalibrated stereo. Our method is based on random sampling using distributions of feature point locations. For doing random sampling in RANSAC procedure, we use an uniform distribution and the distributions for each feature point defined by the distances between the point and the other points. We first choose a correspondence by using an uniform distribution and next choose candidate correspondences by using the distribution of the chosen point. Then, we compute a homography from the chosen correspondences and find largest consensus set of the homography for detecting a local planar region in the scene. We repeat this procedure until all regions are detected. We demonstrate that out method is robust to the outliers in the scene by simulations and real image examples.
著者
越澤 勇太 日浦 慎作 佐藤 宏介
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.38, pp.171-178, 2005-05-12
被引用文献数
1

今後,家電機器はより一層高機能化し,それに伴って操作は複雑化していくものと考えられる.そのような複雑な操作に柔軟に対応でき,またリモコンのように機器を手に取る必要のない操作インタフェースとして,ジェスチャを用いたインタフェースが考えられる.ジェスチャ操作用のインタフェースにおいても,GUIのようにウィジェットと呼ばれる基本操作に対応した部品を提供し,その組み合わせでインタフェースを構築することで様々な機器の操作方法を統一し学習を容易にすること,また操作法をユーザへ アフォードすることができると考えられる.そこで本研究では,特に音量などの連続量の操作に注目し,ジェスチャ操作に適した量操作ウィジェットを設計,評価した.その結果,従来のGUIに見られる量操作ウィジェットを用いた場合と比較して,提案するウィジェットの方が高速かつ正確な操作が行えることがわかった.The ways to operate electric appliances will be more complicated if new functions are added without careful organization. A gestural interface with visual presentation is one of the solutions for such complicated operations without taking any devices like remote controllers. For ease of learning and to afford users how to operate various appliances, it is effective to use a set of widgets for constructing interfaces, because each widget can be shared by all different appliances. Therefore, in this research, we designed value-control widgets for gestural interfaces and then compared them with existing GUI widgets for evaluation. We showed that users can control values more rapidly and accurately with the proposed widgets than the ones for GUI.
著者
木下 敬介 張正友
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.1997, no.70, pp.43-50, 1997-07-24

複数のカメラで撮影した画像から、三次元空間中の点の三次元位置を、簡単に、そして、安定に推定する手法を提案する。従来の透視変換モデルを使うかわりに、アフィンカメラモデルを採用した。まず、複数のアフィンカメラで撮影された画像から、三次元空間の点の位置を線形な計算で推定できることを示す。次に、仮想的なアフィンカメラで撮影したのと等価になるように、現実のカメラで得られた画像を補正する方法を提案する。補正後の画像からは、三次元位置を線形な演算だけで推定することができる。This paper proposes a simple and robust method that estimates 3D position of the points from multiple cameras. Affine camera model is used instead of conventional perspective camera model. First we show that, using multiple cameras, the 3D position is estimated from the image coordinates by linear operation. Then, we assume that Affine cameras are virtually placed in the 3D space. The image coordinates of the real cameras are modified to coincide with those of the virtual Affine cameras. 3D positions of the points are linearly estimated from this modified image coordinates.
著者
出水 祐樹 佐野 睦夫 西口 敏司
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.82, pp.165-170, 2008-08-29

近年,画像処理技術を利用して人間の行動を理解する研究が盛んに行われている.人間の行動を理解することは,人間とコンピュータとの自然なインタラクションを実現するのに必要不可欠である.特に視線は,人間の意図や注意を認識するのに大きな役割を果たしている.視線を検出することができれば,様々なインターフェースに適用できる.例えば,視線情報を利用して人間同士のコミュニケーションを促すエージェントなどが挙げられる.本稿では,AAM (Active Appearance Model) とパーティクルフィルタを用いたノイズにロバストな視線追跡方法について述べる.まず始めに AAM を用いて顔特徴点の抽出を行う.顔特徴点の情報をもとに顔向きの推定を行い,どの方向を見ているのかを検出する.次に AAM で求めた目領域に対して,パーティクルフィルタを用いて視線追跡を行った結果を示す.Recently, by using image processing technology, many methods to understand a human behavior have been proposed. It is essential to understand a human behavior to realize natural interaction between human and computer. Gaze-movement plays a major role to recognize human's intention and attention. Detecting the gaze-movement can make us develop various man-machine interfaces, such as communication agents. This paper proposes gaze tracking method using AAM and Particle Filter. At first, this method extracts the face feature points using AAM. Then it estimates a face direction based on information of the face feature points and exerts gaze tracking to eyes region of the estimated direction by Particle Filter.
著者
佐藤 淳
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.115, pp.61-68, 2006-11-09
被引用文献数
2

プロジェクタの小型化高性能化に伴い,プロジェクタカメラを用いた新たなシステム実現への期待が高まりつつある.特に近年では,複数のプロジェクタとカメラを用いたマルチプロジェクタカメラや,ダイナミックに位置や姿勢を変えるプロジェクタカメラに関する研究開発などが進展しつつある.本発表では,このような多数のプロジェクタとカメラが存在する場合に現れる特有な多視点幾何を明らかにすると共に,このようなプロジェクタカメラを使った拡張現実感の例などを示す.特に,一見,邪魔物と見られがちなプロジェクタによる影が,プロジェクタカメラシステムの校正や3次元復元などを行う上で非常に重要な役割を果たすことや,プロジェクタカメラをモバイル化したモバイルプロジェクタカメラによる新たなプロジェクタカメラの可能性などに関して述べる.The projector camera system has recently been applied for various new multimedia systems. In particular, multiple camera projector systems and dynamic camera projector systems have been studied recently. In this paper, we show the multiple view geometry for cameras and multiple projectors, and show some applications on augmented reality systems. In particular, we show that shadows made by projector light provide us very important information for calibrating projector camera systems and for reconstructing the 3D structure of the scene. We also show mobile projector camera systems, which can be applied for new multimedia systems.
著者
福井 章仁 八木 康史 谷内田 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.6, pp.53-58, 2004-01-23
被引用文献数
4

双曲面ミラーなどを用いた全方位視覚センサは、周囲360度の視野映像が実時間で撮影できることから、実写映像に基づく空間モデリングのためのセンシング手段として有望視されている。しかし、360度の視野を単一の撮像素子で撮影しているため、入力画像の解像度が低いという問題があった。一方、カメラを回転する方法は、高解像度の画像が得られる反面、1枚のパノラマ画像の取得に時間がかかってしまうという問題がある。本研究では、両タイプのセンサを同軸上に上下配置することで、全方位画像が実時間観測できるとともに高精細のテクスチャーが獲得でき、また本センサシステムを電動カートへ搭載することで高解像度のテクスチャーを持つ広域な都市空間の3次元モデリングが可能なパノラマ画像入力システムを提案する。An catadioptric omnidirectional image sensors using convex mirrors have a useful advantage for modeling. These sensors can capture omnidirectional information simultaneously and can continuously observe the object. The image resolution of the observed surface texture is low. On the other hand, an advantage of rotating camera around with constant angular velocity is that we can acquire a high-resolution omnidirectional image. However, it has a disadvantage that it requires a rather long time. In this paper, we propose the high-resolution panoramic imaging system by combining the real-time omnidirectional image sensor HyperOmni Vision and line-scan camera system.
著者
山田 純一 外園 宙 山中 隆 鹿嶋 雅之 佐藤公則 渡邊 睦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.27, pp.469-476, 2008-03-11

警備ロボットにおける不審者追跡など,特定の対象を自動追跡する際には,視野からの消失や被追跡対象の隠れなどに適切に対処することが必要となる.本稿では,Condensation 法を用いて自動追跡中に被追跡対象が消失した際に,予め与えた環境地図と自己位置推定結果,および消失地点の検出結果を用いて,再探索するための中間目標地点を自動的に生成する手法について述べる.When an intelligent robot automatically tracks same determined object, in such a situation as doubtful human tracking for guard robots, it is necessary to adaptively cope with the vanishment and the occlusion. This paper shows a method to create a subgoal for re-searching the tracked object by using existing environment map, self localization result and vanished position detection result during automatic object tracking based on the condensation algorithm.
著者
外園 宙 山田 純一 山中 隆 古賀 由紀夫 渡邊 睦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.42, pp.167-174, 2007-05-15

移動ロボットが作成する地図として、従来トポロジカル地図とメトリック地図の2つの方法が研究されてきた。トポロジカル地図は環境から得られる情報を抽象化してノードとアークで表現するため環境の構造に対する知識を少ない情報量で表現するのに適しているが、観測結果との統合や不確実性の記述が困難である。また、ロボットの移動制御など正確性が要求される用途には適していない。本研究では、環境に設置されたステレオカメラを用いて作成する大局地図と、移動ロボットによる探索に基づく局所地図を統合することで、効率良く室内のメトリック地図作成を行う方式に関する手法について述べる。天井に設置したステレオカメラで画像領域内の3次元情報を取得し自由空間と机等高さを持つ物体、つまり天井カメラからでは遮蔽されている未識別の領域を検出する。この検出した遮蔽領域を移動ロボットに搭載されたカメラと超音波センサによって実験室を対象に実験を行い、本方式の有効性確認を行なった。The map which a mobile robot creates, two methods of topological map and the metric map have been studied conventionally. Since a topological map abstracts the information acquired from environment and expresses it with a node and an arc, it is suitable for expressing the knowledge over an environmental structure for the small amount of information, but integration with an observation result and description of uncertainty are difficult. In addition, movement control of a robot accuracy is not suitable for a demanded use. This research describes the technique about the system which performs efficient indoor Mettrick mapping by unifying the general situation map created using the stereo camera installed in environment, and the partial map based on search by a mobile robot. The three-dimensional information in a picture domain is acquired with the stereo camera installed in the ceiling, and the domain shaded from the ceiling camera is detected. By the camera and ultrasonic sensor in which this detected shaded domain was carried by the mobile robot, it experimented in the laboratory and the validity check of this system was performed.
著者
関口 大陸 松山 方大 桑島 茂純
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.27, pp.239-242, 2008-03-10

ProFUSION 25 は 25 眼分の VGA 解像度の動画像データをリアルタイムに PC へ取り込み可能な 25 眼カメラアレイシステムである. ProFUSION25 の大きな特徴の一つは 25 個の撮像素子を 5 x 5 のアレイ状に 12mm ピッチで配置し これまでになく撮像素子が密に配置された非常に小型化されたカメラアレイシステムとなっている点である.また 画像転送帯域を確保するために PCIExpress をケーブルで延長しカメラ本体に直接接続するインタフェースを採用したことも技術上の特徴となっている.本稿では 以上のような特徴を持つ 25 眼カメラアレイシステム ProFUSION25 の設計と開発について述べる.ProFUSION 25 is a 5x5 camera array system. The system has 25 VGA resolution cameras inside a very compact body with 12mm spacing. ProFUSION 25 also employs a PCI Express External Cable. This PCI Express connection provides more than 200MByte/Sec effective bandwidth and transfers all 25 images at 25 FPS to the PC. In this article, we will describe the development of ProFUSION 25.
著者
永橋 知行 藤吉 弘亘 金出 武雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.51, pp.69-74, 2006-05-18

従来、物体識別には形状やテクスチャ情報に基づく特徴が識別器への入力として用いられている。これらの入力特徴は、物体領域全体を大局的に捉えたものであり、その物体の構造情報は用いられていない。そこで、本稿では混合正規分布モデルを用いて記述した物体の構造パターンに基づく識別法を提案する。本手法は、検出された物体領域に混合正規分布モデルを当てはめ領域分割を行う。分割後の各領域から求めたテクスチャと形状に基づく特徴量をノード、2つの正規分布間の距離をエッジとするグラフを作成する。各クラスの参照グラフと入力グラフとの距離を算出し、kNN法を用いて移動体を自動車/人/複数の人/二輪車に識別する。評価実験の結果、全体から得られる特徴量に構造情報を加えることで、識別率を向上させることができた。Current feature-based object type classification methods use texture and shape based information derived from image patches. Generally, input features such as aspect ratio are derived from some rough characteristics of the entire object. However, we derive input features from parts-based representation of the object. In this paper, we propose a method to distinguish object types using structure-based features described by a mixture of Gaussian distribution. Our approach uses the Gaussian fitting onto object image to segment into several sub-regions, each of which is related to a physical part of the object. We model the object as a graph, where the nodes contain texture and shape information obtained from the corresponding segmented regions, and the edges contain the distance information between two connected regions. Calculating the distance of the reference graph and the input graph, we can classify an object into single-human/human-group/vehicle/bike using k-NN based classifier. We demonstrate that we can obtain higher classification performance when we use both conventional features and structure-based features compared to using only conventional features or only structure-based features.
著者
片平 尭之 岩井 儀雄 谷内田 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.36, pp.113-120, 2008-05-01

コンピュータやセンサを身につけてさまざまな作業の支援を行うウェアラブルシステムにおいては,自己位置情報の提供が有益である.本論文では,ウェアラブル全方位視覚センサより得られる画像と GPS の情報に基づく自己位置識別手法を提案する.画像特徴量・GPS 特徴量について,それぞれ部分空間を構成し,各部分空間内で近接した学習データから自己位置を識別を行う.識別された自己位置が異なる場合は,どちらの結果を信用するか判別し識別を行う.実際に屋内および屋外環境で取得した全方位画像,GPS の情報を用いて実験を行い,提案手法の有効性,ウェアラブルシステムへの適応性を確認した.Self-location is very informative for wearable systems. In this paper, we propose a method for identifying user's location from omnidirectional image features and GPS data. User's location is independently recognized from the image feature and GPS data projected into a sub-space made from learning data. User's location is determined from the results. We show the effectiveness of our method by experimental results in real images and GPS data.
著者
小林 貴訓 佐藤洋一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.36, pp.231-246, 2008-05-01
被引用文献数
3

本稿では,環境に疎密に分散配置されたセンサ群を用いて,特定エリア全体における人物動線を計測する手法について述べる.まず,公共施設や商業施設などの監視カメラ映像を想定し,視野を共有する複数のカメラを用いて,人物頭部の三次元位置と向きを追跡する手法について述べる.また,店舗などでの複数人物の追跡のため,監視カメラによる追跡にレーザ測域センサを相補的に統合することで,人物の出現や消失の検出,人物相互の遮蔽を扱う.さらに,エリア内全体を通じて,連続した人物動線を計測するため,障害物や人物相互の遮蔽などにより断片化した人物動線や,複数観測領域間における人物動線を対応付け,観測領域外の人物動線を補間する手法について述べる.This paper describes the method of tracking people in an indoor environment by using a sparse network of multiple sensors. 3D position and the orientation of people's heads are tracked by using multiple cameras. To deal with appearance/disappearance of people including occlusions cased by people's interactions, laser range scanners are seamlessly integrated into the vision based tracking framework. The information from a sparse network of multiple sensors is used to estimate people's trajectories in the whole area including unobserved areas. This paper also describes the method for establishing correspondences between trajectories captured by different cameras and estimating trajectories in unobserved areas.
著者
LuBounVinh 角田 哲也 川上 玲 大石岳史 池内 克史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.36, pp.295-300, 2008-05-01
被引用文献数
2

複合現実感(MR)における実物体と仮想物体のオクルージョン問題を解決するため,実画像から前景領域の抽出と影領域の除去を行い,さらに画像中の位置座標から前景物体の奥行き推定を行う手法を提案する.前景領域の抽出については確率モデルに基づく手法を用い,色,コントラスト,時間的事前確率を用いて精度を高める.確率モデルにおけるエネルギー最小化にはグラフカットを用いる.また抽出した前景領域に対し,各画素の色度とカメラの分光感度特性から求められる logF 値を用いることにより,影領域を除去する.最後に画素ごとの描画判定に利用されるステンシルバッファを用いて,前景物体によるオクルージョンを考慮しながら仮想物体の重ね込みを行う.屋外環境で全方位カメラを用いてパノラマ単画像を撮影し,画像シーケンスに対して仮想物体の合成を行うことによって提案手法の有効性を確認した.This paper presents a method solving the occlusion problem in Mixed Reality (MR). We cut out foreground from a real image using probability-based segmentation method. Using the color, spatial and temporal priors, we can improve the accuracy of the segmentation. The energy minimization is executed by graph cuts. Then we remove shadow region from the foreground with log F value calculated from the pixel value and the spectral sensitivity characteristic of the camera. Finally we superimpose virtual objects using the stencil buffer which is used to limit the area of rendering for each pixel. Synthesized images of an outdoor scene show the efficiency of the proposed method.
著者
本多 充知 加藤 博一 西田 正吾
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.3, pp.243-248, 2008-01-18

実写画像を用いたカーナビゲーションシステムにおいて,車載カメラから得られた画像上にさまざまな案内情報を違和感無く重畳表示するためには,現在の自車位置を高い精度で計測する必要がある.特に車線数の多い道路においては,自車が走行しているレーンの位置を把握することが重要となってくる.そこで本研究では,車載カメラから得られた画像をもとに,自車両走行レーン位置を推定する手法を提案する.計算コストの削減のため,走行レーン位置の推定に時空間画像を利用することを考えた.A car navigation system based on an augmented reality technique requires accurate positioning data. In this paper we propose a compensation method of positioning for the car navigation systems. In this method, we utilize signs on the road, such as a crosswalk. In addition, We use the "sptio-temporal image" for reduction of complexity.
著者
稲見 昌彦 富田 正浩 杉本 麻樹 新居 英明 小島 稔
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.115, pp.77-84, 2006-11-09

Display-based Computingとはプロジェクタや液晶など画像提示装置を映像提示だけでなく,計測,制御,通信等に用いることを目指す概念である.画像提示装置を用い時空間変調可能な指標画像を表示することでカメラに代わり複数個の受光素子のみで高速に位置計測を行う事が可能となる.本技術はディスプレイを人のためなく計測や機器制御に用いるという点で,カメラを人が鑑賞するためだけでなく計測に用いたComputer Visionと双対をなす概念である.本講演では画像提示装置を用い複数台の小型移動ロボットの動きを同時に制御することを可能とするシステムを提案し,その試験的実装に関し報告を行う.Display-based Computing (DBC) is a concept to achieve communication, measurement, control and appropriate presentation that exert influence on the real world by using display devices. DBC presents optical information superimposed onto the real world by projecting the images. Computer Vision (CV) uses the camera not only to record optical information but also for image-based control of robotic devices and information instruments. Similarly, it is also possible to control a robot based on optical information projected by DBC. In this paper we present a robot-based interaction using DBC. We also achieved a multi-robots control system.
著者
小川原 光一 崎田 健二 池内 克史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.88, pp.55-62, 2005-09-05
被引用文献数
1

本稿では,人間が行う作業に対してロボットが自然な形で協調し作業の遂行効率を上げることを目的として,作業者の迷いに起因する作業の滞りを検出し,その局面において取るべき適切な動作を推定し提示することによって作業者の行動を支援する手法について述べる.そのために,人間の意図を内包した生理的情報である視線運動の履歴を利用して,迷いの状態を検出するとともに,人間の意図とシステムの持つ作業に関する知識の両者と整合性のとれた適切な行動を推定する枠組みを提案する.さらに,レゴ組み立て作業を例題にとって推定手法の実装を行い,実ロボットを用いた行動の推定・提示・実行システムを構築して検証実験を行う.To realize a flexible and natural cooperative task between a human and a robot, a framework of a system which estimates and presents appropriate action to a human when he/she is in trouble over making decision on the action to be taken next.For that, history of gaze motion,physiological information which implicitly expresses the intention of a human, is employed to detect trouble and to estimate appropriate action which agrees with both the intention of the human and the goal of the task which is known to the system. The proposed framework is implemented on LEGO assembly task and experimental results are presented by using a gaze tracking system and a humanoid robot.
著者
大野 健彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.87, pp.171-178, 2001-09-13
被引用文献数
5

人の視線を測定する技術の発展と共に,その利用方法も眼球運動の研究から,視線インタフェースへと広がりつつある.本稿では視線測定装置を視線インタフェースに利用する場合に要求される条件を述べ,これまでに提案されてきた視線測定法がどのように要求を満たしてきたかを紹介する.次に視線インタフェースの具体例をコマンド型インタフェースと非コマンド型インタフェースの2種類に大別して紹介し,最後に視線インタフェースの将来形として,視線コミュニケーションに向けた研究について紹介する.The improvement of gaze tracking system enables us to expand its research area from measurement of eye movements to gaze interface field. In this paper, the requirements of gaze tracking system for gaze interface device are described at first, and then technologies that satisfied them are presented.Next, the researches of gaze interface are shown within two categories, command-based interface and noncommand-based interface. Finally, the challenge of gaze communication between man and computer is described.