著者
狩塚 俊和 佐藤宏介
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.88, pp.141-146, 2003-09-08
被引用文献数
5

現実環境に仮想物体をシームレスに融合する複合現実感(Mixed Reality)が新たな情報提示方法として注目され、今までに様々な形態のシステムが開発されてきた。その一例として、プロジェクタを利用し、実物体をスクリーンとするプロジェクション方式が複合現実感ディスプレイとして提案されている。 また、一方でコンピュータを身につけられるほど小型化して、常時利用を可能にするウェアラブルコンピュータの研究が行われている。複合現実感による便益をユーザの状態にかかわらず享受できるようにするため、両者を融合する「ウェアラブル複合現実感」が新たなメディア環境として注目されてきた。本発表では、小型プロジェクタを用いたウェアラブル複合現実感システムを提案する。One of methods achieving Mixed Reality (MR) displays is the texture projection method using digital projectors. Another kind of emerging information environments is a wearable information device. which realizes ubiquitous computing. It is very promising to integrate these technologies. Using this kind of fusion system, two or more users can get the same MR environments without using HMD at the same moment. In this paper, we propose a wearable MR system with an on board projector and image-based sensor, and also introduce some applications with this system.
著者
奥富 正敏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.1996, no.115, pp.57-64, 1996-11-21
被引用文献数
17

ステレオ視は、画像からの3次元再構成のための重要な手段であると考えられ、従来から大変多くの研究がなされてきた。本報告では、「ステレオ視において、結局何が本質的に問題なのか」、「提案されたさまざまな手法が、主にどういう問題を解決しようとしてきたのか」を整理すると同時に、今後の展開を考察する。Stereo Vision is an important method for 3-D reconstruction from images. And a huge number of researches on this method have been done. In this report, we survey the fundamental issues such that, "after all, what are the essential problems in stereo vision?" and "what problems have the methods proposed so far mainly solved or intended to solve?", and also "what would be important for future development?".
著者
杉本 岳夫 徐剛
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.1997, no.83, pp.41-48, 1997-09-11
被引用文献数
11

本論文では,カラー画像を用いて複雑な背景から個数,位置,サイズ,姿勢が未知である顔を実時間で抽出するアルゴリズムを提案する.本手法では,まず同じ人種の人々の肌の色の分布が正規分布であると仮定して,肌色を抽出する関数をモデリングする.次に,この関数を用いて抽出した肌色を閉領域毎に分割し,各領域に中心と面積の情報を与える.この情報を用いて,肌色領域内に黒目や眉毛に相当する暗い領域が存在するかしないかを判断し,もし存在していればその肌色領域は顔であると判断する.実験から,この方法による処理が高速でロバストであることが示された.This paper describes a practical algorithm that can robustly detect multiple human faces with unknown sizes and positions in complex backgrounds from color images in real time. Skin color is modeled as a normal distribution among different persons within the 58.1118 race. Detected skin pixels are grouped into regions whose centroids and areas are recorded. If dark regions for eyes and eyebrows are also detected within these regions, then they are regarded as faces. Experimental results show that this approach is very fast and robust.
著者
坂本 博康 坂田 年男 井上 光平 浦濱 喜一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.93, pp.135-142, 2006-09-09
被引用文献数
3

人の快・不快などの感情や気分を簡便に計測したいという要望はいろいろな分野から出されている.本報告は,人の単一の感情や気分が直接的に顔の表情に表れている場合について,顔画像の正準相関分析法を用いて計測する方法を提案している.本方法の顔画像の取扱い手法には,固有顔と同列のimage-basedの方法を用い,これに人が顔画像を観察する際の注視特性を組み込んだ方法を利用する.また,人の感情および表情のモデルにはラッセルの感情円環モデルを採用し,不快一快および沈静一覚醒の2座標軸で各顔画像を主観評価したデータを用いる.女性22名の4種類(笑,怒,泣,鷲)の表情を含む顔画像のデータベースを用いて行った数値実験結果を示し,本提案手法の有効性を述べる.A convenient measuring method for human's feeling or affect of comfortableness and/or uncomfortableness is required from various fields of research, manufacturing and business. This report discusses a measuring method based on the canonical correlation analysis scheme under the assumption that one's feeling or affect is directly reveals on his/hers facial expression. Our image processing technique is an image-based method like eigenface method, enhanced by eyes' gazing property upon human faces. Employing Russel's circumplex model of affect as a model of facial expression, each facial image is subjectively evaluated on the two coordinates of un-comfortableness -comfortableness and composure- excitement. We show results of numerical experiments carried out by using facial expression database of 22 female subjects covering four affections including joy, anger, sadness and surprise, and describe availability of the proposed method.
著者
瀬川 英吾 徐剛 辻 三郎
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.1992, no.73(1992-CVIM-079), pp.33-36, 1992-09-17

画像から対象物の輪郭線を抽出することは、非常に重要である。Kassらによって提案されたsnakeは、輪郭線を抽出する問題を、エネルギー関数の最小化問題に変換する。しかし、snakeを望ましい輪郭に収束させるためには、適切な初期位置を設定する必要があり、また、パラメータも適切な値に設定しなければならない。従来、これらのパラメータは、試行錯誤によって決められていた。本報告では、snakeを円で近似することによって、パラメータの設定を簡単化する方法について述べる。
著者
山田 純平 金谷健一 菅谷 保之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.51, pp.339-346, 2006-05-19
被引用文献数
18

本論文では画像上の点列に楕円を当てはめる問題を最尤推定として定式化し、KCRの下界との関係を述べる。次に、その数値解法としてFNS法、HEIV法、くりこみ法のアルゴリズムを述べ、ガウス・ニュートン法を追加する。そして、シミュレーションおよび実画像を用いてこれらの反復解法の収束性を実験的に比較し、反復の初期値や当てはめる楕円弧の形状への依存性を明らかにする。This paper studies numerical schemes for fitting an ellipse to points in an image. First, the problem is posed as maximum likelihood estimation, and the relationship to the KCR lower bound is stated. Then, we describe the algorithms of FNS, HEIV, and renormalization, to which a new method based on Gauss-Newton iterations is added. Using simulated and real image data, we compare their convergence properties and reveal their dependence on the initial value for iterations and the shape of the elliptic arc to which an ellipse is to be fitted.
著者
坂野 鋭
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.66, pp.41-44, 2003-07-03
被引用文献数
1

本報告は世界各国で推進されている顔画像認証技術標準に関する報告である.9.11以降,顔画像認識技術を含むバイオメトリック個人認証技術は,カウンターテロリズムのためのセキュリティ技術としてにわかに注目を集めているが,共通するプラットフォームがないなどの問題で実用化が遅れている.本報告は,こうした標準化活動のうち精度評価方法にフォーカスし,ISO,INSITSなどの動きを報告し,日本からの提案への助言をお願いする.The article describes the progress of the standardization activities for evaluation methodology about facial image recognition system in this globe. From the impact of 9.11 biometric technology as facial image recognition technology is focused to security technology for counter terrorism. However, the evaluation method of face image recognition system in each system supplier was inconsistent and the standard method for accuracy evaluation was never defined. So consumer needs the standardization of the evaluation method. In this article, we report the standardization activity in ISO and we expect useful discussion for the standardization for proposition for international standard.
著者
林 邦彦 斎藤 英雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.51, pp.173-180, 2006-05-18
被引用文献数
3

近年、スポーツ映像などで自由な視点からの映像の要求が高まっている。従来手法[5]では、サッカースタジアムのような大規模な空間で、カメラの中間視点画像しか合成できなかった。この従来手法は、空間の3次元モデルを復元をせずに、入力画像間の対応点を算出することで自由視点画像を生成している。そこで、本稿では、サッカーシーンを幾何的な特徴に応じて、動的領域と静的領域に分割し、各領域を平面近似して、それぞれ3次元モデルを簡易的に復元することによって、中間視点画像に限らない自由視点画像を生成する手法を提案する。本手法では、対象の3次元モデルを復元するために、まず、カメラキャリブレーションを行う。その際、サッカーグラウンドにマーカーを置く事はできないので、グラウンド面の平面パターンを利用してカメラキャリブレーションを行う。分割された各領域のうち、選手やボールである動的領域がグラウンドに垂直に立つ1枚の板(ビルボード)で表されるものとして3次元モデルを復元する。一方、静的領域に対しては、複数の平面領域に分割し、各平面の3次元モデルをあらかじめ復元する。本手法をサッカーシーンに適用し、従来生成できなかった中間視点以外の自由視点画像を生成することで有用性を示す。We propose a new method for synthesizing free-viewpoint images from multiple view videos in soccer stadium. The previous method[5] can synthesize virtual viewpoint images at intermediate viewpoint between real cameras. The previous method estimates only pixel-wise correspondences between input images for synthesizing virtual viewpoint images without a 3D reconstruction. In this paper, we propose a new method that can synthesize virtual viewpoint images at free-viewpoints which are not limited at intermediate viewpoint by reconstructing simple 3D models after dividing a soccer scene into static regions and dynamic regions. To reconstruct the object soccer scene, we perform camera calibration without marker objects because we can't put such objects on the soccer ground. For reconstructing of dynamic regions, we employ a billboard representation of dynamic regions. The billboard representation can realize a simple 3D reconstruction and transform textures into the appropriate appearance of the aspect of dynamic regions at virtual viewpoint. For reconstructing of static regions, we divide two planes that are a ground region and a background region. We reconstruct 3D models in each region beforehand. By applying our method to a soccer scene, we can synthesize free-viewpoint images which are not limited at intermediate viewpoint by employing only pixel values of real images.
著者
服部 雄一 中澤 篤志 町田 貴史 竹村 治雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.51, pp.145-150, 2006-05-18
被引用文献数
1

時系列3次元データは、応用範囲が広く今後の発展が期待される研究分野である。この時系列3次元データはデータサイズが非常に大きく、これらを伝送および保存する際は圧縮処理が必要不可欠となる。本稿では、データの時間的冗長性を削減することを目的として、3次元に拡張したHuモーメント不変量を用いた時系列ブロックマッチングによる圧縮法を提案する。この手法では、従来手法では考慮されていなかった物体の回転運動を検出することで、圧縮率の向上を図っている。Time sequence 3D data has a broad range of application and is a research area expected for the future development. The time sequence 3D data has such a huge data size that data compression is essential when it is transmitted and saved. This paper proposes a compression method by using the time sequence block-matching with extended 3D Hu invariant moment for the purpose of reduction of the data time redundancy. In this method, the data compression ratio is improved by detecting the rotational motion of an object that is not considered in the existing method.
著者
村井 祐一 番匠 一雅 山本 和弥 野田 健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.1995, no.68, pp.1-8, 1995-07-20
被引用文献数
1

野球のピッチャーが投げ,バッター方向に飛来するボールの映像を2台のTVカメラでステレオ観測し,ボールの時々刻々の空間位置の精密計測,ボールのバッター平面到達位置の予測,ロボット捕球,ロボット打球等の高度処理をさせる技術のアルゴリズムを開発した.従来技術の飛球速度計測,ストライクやボールの判定から踏み出して,カーブやシュート,落ちる球や浮き上がる球などの変化球に対する詳細かつ正確な飛跡の客観的計測データを得たり,ロボットキャッチャーによる捕球,ロボットバッターによる打球をも可能とした.ボールを構成している画素の連続性に基づくボール中心点決定方法,ボール到達座標予測を使用してボール探索領域の限定を行うアルゴリズムなどを考案し,各種ボール到達位置予測アルゴリズムの実験および比較検討による最適方式の決定を行った.さらに連続して得られた3次元ボール移動軌跡からボール最終到達点の予測を行い広汎な環境条件において,投手が投げたボールを追跡し,到達点を予測するシステムのアルゴリズムを開発し,実験によって動作の確認が得られたので報告する.Pursuiting algorithm of linear prediction and a color grade stressed integration for a flying baseball image is utilized to real-time measuremet of its trajectory. After the ball image of video screen on each TV monitor of stereo cameras is enhanced by cancelling background scene image in specified limited area, the true ball image is searched on the screen and their coordinates are located. In searching process, searching area on the TV screen area is limited within less than one thousandth of the TV screen area at the least, by using the linear prediction. Ball arriving point forecast algorithm on batter plane are experimentally demonstrated by usin parabolic equation approximation, and forecast accuracy less than a few millimeters is estimated.
著者
吉村 真 清水 雅夫 田中 正行 奥富 正敏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.1, pp.169-176, 2007-01-12

時系列画像を用いた画像処理には,安定で高精度な画像レジストレーションを必要とするものが多い.このような画像レジストレーションでは,多くの場合,アフィン変換や射影変換などの,比較的自由度が低いモーションモデルが採用されてきた.しかし,このようなモーションモデルでは正確に表現できないような変形をする撮影対象もある.本論文では,画像上に多数配置した制御点の移動をパラメータとする,B-Spline画像変形を用いた画像間レジストレーション手法を検討する.従来,このような非剛体レジストレーションでは,画像の輝度勾配を用いた勾配法によってモーションパラメータを求めていたが,テクスチャが少なく輝度勾配が小さい領域では勾配法が安定に収束しない問題があった.そこで,輝度勾配に応じて変化する安定化項をコスト関数に導入し,画像によらず高精度でしかも安定にモーションパラメータを推定できるようにした.非剛体変形する対象の例として,望遠レンズで遠方の対象を撮影するときに生じる大気揺らぎ(かげろう)と,水面を通して水中物体を撮影するときに生じる揺らぎを取り上げる.これらの揺らぎは,観測時間を十分に長く取れば平均位置に対して対称になる.そこで,このような揺らぎを含む時系列画像を時間方向に平均化することで,空間的にぼやける代わりに揺らぎを除去できる.この平均化画像に対して各入力画像を非剛体レジストレーションすることで,入力時系列画像から揺らぎを除去することができる.揺らぎを含む実画像を利用した実験を行い,効果を確認した.A stable and highly accurate image registration technique is required for sequential image processing. Affine and projective transforms are often used for motion models of the image registration, but some objects cannot be modeled with the motion models using such a limited number of parameters. In this paper we discuss a non-rigid registration that utilizes a B-Spline image transformation with a parameter-set of the control vertex positions. The parameter-set can be estimated using a gradient-based parameter optimization method. The optimization method is, however, sometimes unstable at texture-less regions with image noise. We have introduced a stabilization term that varies with the magnitude of image gradient to the cost function, which allows estimating a stable and accurate parameter-set even if the image has a weak texture.In the experiments, we have applied the stable non-rigid registration technique to eliminate two types of fluctuations in image sequences; an atmospheric fluctuation and a fluctuation through a watter surface. A deformation-eliminated reference image is obtained by averaging image frames in the sequence, and then each frame is non-rigidly registered to the reference image. The experimental results demonstrate the stability and accuracy of the proposed non-rigid image registration technique.
著者
柴田 英貴
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.2, pp.31-36, 2003-01-16
被引用文献数
1

UAV(Unmanned Aerial Vehicle:無人航空機)の研究開発は、世界各国の大学、研究機関等で進められている。ヤマハ発動機(株)では、自社製品である産業用無人ヘリコプタRMAXをベースに、GPSセンサと慣性センサを利用した高精度な飛行制御を実現した。回転翼UAVの制御の難易度は非常に高く、現実的に可視外運用が可能な機体は世界にも数種類しか存在しない。 UAVと画像処理との関係は大まかに2種類に分けられる。一つ目はUAVの飛行そのものを制御するために必要なデータを収集するための航法センサ、二つ目はUAVに搭載したカメラを用いて撮影を行い、それを処理して被写体について何らかの情報を得るリモートセンシングである。 ヤマハ発動機は2000年春まで、東京工業大学との共同研究で前者の飛行制御のための航法センサを開発してきた。AIS(ActiveImageSensor)と名づけられたその画像センサは機体搭載カメラのチルト・パン・ズームをアクティブに制御し、積極的に画像情報を得て必要な情報を取り出すことができる。本稿ではこのAISを中心に解説する。UAVs(Unmanned Aerial Vehicle) are a focus of research and development efforts by universities, research organizations and other entities in countries all over the world. At Yamaha Motor Co., Ltd., we took the RMAX, our own proprietary industrial-use unmanned helicopter, as a starting point and developed sophisticated flight control that operates using a GPS sensor and an intertia sensor. Rotary wings UAVs are extremely difficult to control, and there are only a few types of these machines worldwide that can actually be operated outside the range of visibility. Generally, there are two different ways in which the UAV and image processing work together; with the first, a navigational sensor compiles the data necessary in order to control the flight of the UAV itself. The second involves remote sensing, in which a camera mounted on the UAV takes photographs which are then processed to obtain various information concerning the object being photographed. By the spriong of 2000, Yamaha Moter Co. had developed the former, a navigational sensor for flight control, though collaborative research with the Tokyo Institute of Technology. This image sensor, called the AIS (Active Image Sensor), actively controls the tilting, panning and zooming of the camera mounted on the machine so that the necessary data can be obtained through the assiduous acquistion of image information. This paper describes our development achievements, focusing primarily on the AIS.
著者
福井 和広
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.1994, no.8, pp.1-8, 1994-01-20
被引用文献数
2

本論文では、エッジを安定に抽出する方法を提案する。エッジを輝度が急激に変化する位置ではなく、領域と領域を最も分離する領域境界として捉える。領域境界は、境界を形成する2つの局所領域の統計的な性質によって決るので、ノイズの影響に対してロバストである。この考えに基づいて、エッジ強度は、判別分析法により求まる2つの局所領域間での画像特徴量の"分離度"で表される。分離度は、理想ステップエッジ上で、ステップの高さに無関係に最大 (.) となり、エッジが鈍るに従って低下してゆく。線形領域では、その勾配に依らずにほぼ0.75、平坦領域では0.0に近くなる。この特性により、エッジ抽出しきい値が、エッジ強度に無関係に0.75近傍に設定される。したがって、従来の最適しきい値の選択問題が解決される。また、複数の特徴量を使うことでカラー、テクスチャエッジの抽出にも容易に拡張可能である。This paper proposes a robust method for detecting a weak edge. In our method, an edge is defined not as a point where the intensity changes largely, but as a region boundary based on separability of image features which can be calculated by the linear discriminant analysis. Based on this idea, the intensity of an edge is obtained from the separability, which depends only on the shape of an edge. This feature enables us to select easily the best threshold value for the extraction or a weak edge. And besides, our method can be applied to color, and texture edge extraction. Experimental results are presented to demonstrate the efficacy of the proposed method.
著者
浅野 哲 牧 淳人 松山 隆司
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.38, pp.151-158, 2005-05-12

なぜ人は他人と目が合うとき強烈なインパクトをもって、そしてかくも鋭く気づくのか?従来、視線推定に関する研究は数多く行われてきたが、カメラを見ているか否かを精度良く検出することに特化した研究はあまり見受けられない。本稿では人のアイコンタクトを参考に、カメラを用いて人のカメラへの注視状態を検出する手法を検討する。まず、人がカメラを見ている状態を知る上で視覚的な手がかりとなり得る虹彩位置の検出及び顔向きの推定を行い、その上で両者の関係を解析する。特に、人がある点を注視している状態において、虹彩、眼球、頭部の回転角の間の幾何的関係を基に、上記の両者の間の線形性を示す。これに基づきカメラ注視の判別を行う手法を提案する。In this paper we propose a method for detecting direct gaze on a camera. Although many studies have been made for detecting gaze direction, only little have been reported as to precise detection of whether or not the subject is gazing at the camera.When someone is gazing into your eyes, you instantly notice that with a strong impression. The locus of iris among others as well as the head direction provide strong cues for the eye-contact in the case of human beings. In our study, hence, we also investigate the head direction and extraction of thedisplacement of iris as observable cues by a camera, and the relation between those factors. We then propose that we can deduce a linear mapping between aforesaid two elements in the situations of ``eye-contact'', by the geometric relationship between iris, eyeball, and head directions.
著者
斉藤 英樹 笹木 美樹男 金山 幸礼 伊東正篤
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.1993, no.87(1993-CVIM-085), pp.33-40, 1993-09-30

自律移動ロボットが停止時に対象物の位置姿勢を高精度に認識する手法として、対象物から既知の位置に特定図形を設置するマーカ方式に焦点をあて、その高速化とロバスト化について報告する。まず、自律移動ロボットの動作環境について述べた後に、シンプルな幾何形状を用いたマーカ方式の原理とその性能を解説し、従来方式と比較する。次にマーカの大きさ、形状、カメラ位置、測定精度等の影響を仮想FAルームと呼ぶグラフィクス環境でシミュレーションした結果を示す。最後に実機による検証結果を示す。
著者
菅谷 保之 金谷健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.25, pp.207-214, 2006-03-17
被引用文献数
16

本論文では2画像の特徴点対応から基礎行列を計算する最尤推定とそのECR下界との関係を述べ,具体的な数億計算法としてFNS法,EEIV法,くりこみ法のアルゴリズムをまとめる.さらにガウス・ニュートン反復を用いる方法を追加し,シミュレーション画像を用いてこれらの反復解法の収束性を検討する.反復の初期値はランダムに,最小二乗法で,およびTaubin法で定める3通りで比較する.最後に実画像を用いた実験を示す.これらの実験によって各々の計算法の特質が明らかになり,結論としてFNS法が最も収束性に優れていることが示される.This paper studies numerical schemes of maximum likelihood estimation for computing the fundamental matrix from feature point correspondences over two images. First, we state the problem and the associated KCR lower bound. Then, we describe the algorithms of three well-known methods, FNS, HEIV, and rep to which we add a new algorithm based on Gauss-Newton iterations. Using simulated images, we compare their convergence properties. The initial value is chosen in three ways: randomly, by least-squares, and by the Taubin method. We also show real image experiments. These experiments reveal characteristics of each method. It is concluded that FNS has the best convergence properties.
著者
人見 康宣 高橋 克博 岡谷貫之 出口 光一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.36, pp.81-86, 2001-05-10

キャリプレーションされていないカメラによる複数の画像から、対応点を決定し、対象の三次元形状を復元するシステムの構築について報告する。各画像には座標が既知である点が6点以上あるものとし,それらの点を元に、まず、カメラの相対的な位置,姿勢を計算する。そして、その他の点について、そのカメラ位置、姿勢よりステレオの原理に基づいて、三次元座標を計算する。このとき、各画像間で,同じ対象の点の組つまり画像間の対応を得る必要がある。その作業を自動化する手法がZhang(1994)より提案されている。ここでは基本的にZhangの手法によって対応点の検出を行う。ただし,Zhangの方法では,対応点の候補を絞る段階で緩和法と称しているプロセスについての記憶が明確ではなく、対応点の効率的な絞込みができていなかった。そこで、我々は対応点の候補で特徴点が重複したものを除去するプロセスを作成し,この部分に追加した。これにより対応点を検出する作業を効率化できただけでなく,エピポーラ幾何により正確な対応点を得ることができる。この対応点検出により、大型建造物の空撮画像からの3次元形状復元の結果も合わせて示す。This article reports a technique for extracting correspondences from multiple images to reconstruct 3D shape of the object. The images are obtained by uncalibrated cameras, but assumed to have 6 or more points whose world coordinates are known. From those points, first, relative poses and positions of the stereo principle. To establish these correspondences, we employ the technique proposed by Zhang(1994). But, in his method, the process called as the relacation was not clearly defined and did not efficiently exclude fault correspondences. We modified this process and achieved an effcient and accurate matching. We show total process of image matching based on the epipolar geometry, and also show the results of 3D reconstruction or large buildings from a set of acrial images.
著者
杉内 崇浩 渡辺 俊典 古賀 久志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.113, pp.133-140, 2004-11-12

近年、オブジェクト認識は、セキュリティ認証、ロボットビジョンなどさまざまな場面で使われるようになってきた。我々は、画像オブジェクトをカラー画像の領域分割により直接得られる領域の集合と考えることにより、オブジェクト定義の自動抽出、認識手法について検討している。本稿では、画像内に複数回出現するオブジェクトを圧縮して得られる圧縮率を利用した自動オブジェクト抽出手法を提案する。In recent years, object recognition has come to be used in various scenes, such as security authentication and robot vision. We study automatic extraction and recognition of objects from images by considering an object as a set of the regions directly obtained by image segmentation. In this paper, the automatic object extraction method using data compression ratio in compressing the objects which appears multiple times in image is proposed.
著者
八木 康史 森島 繁生 金子 正秀 原島 博 谷内田 正彦 原 文雄 橋本 周司
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.26, pp.65-72, 1998-03-19
被引用文献数
4

顔画像処理に対する様々な分野での関心の高まりや、工学分野における顔画像処理技術の研究成果の蓄積を背景にして、顔画像処理に関する共通ソフトウェアのツールの作成に向けた活動が進められている。この活動は、「感性擬人化エージェントのための顔情報処理システムの開発」(略称、アドバンストエージェントプロジェクト)と呼ばれ、情報処理振興技術協会(IPA)における独創的情報技術育成事業に関わる開発テーマの一つとして、平成7年度より3年間の計画で精力的に活動を行ってきた。擬人化エージェント技術はさまざまな技術要素から構成されているが、本プロジェクトでは、この中で特に『顔』の役割に着目し、顔画像の認識・合成に関わる顔情報処理システムの開発に主眼をおいた。これと同時に、本システムでは工学のみならず心理学や医学などの分野も含めた顔関連分野における共通の実験用ツールを広く提供することも目標としている。本稿では、平成10年3月で終了するこのプロジェクトの概要と、共通ソフトウェアの紹介を行う。The aim of Advanced Agent Project, supported by Information Technology Promotion Agency (IPA), is to develop the image processing environment for analysis and synthesis of human facial images. This report is mainly concerned with an introduction of an overview of the project and the developed environment for the facial image processing.
著者
岩井 儀雄 勞世竑 山口 修 平山 高嗣
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.38, pp.343-368, 2005-05-13
参考文献数
222
被引用文献数
24

画像処理による顔情報処理に関連した研究について,1)顔検出法 2)イメージベースの顔認識法 3)モデルベースの顔認識法 という観点に基づき最近の動向を紹介する.In this paper, we survey research on facial image processing. We explain the followings: 1) face detection, 2) image-based face recognition, and 3) model-based face recognition.