著者
金谷健一 松永 力
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.7, pp.49-56, 2000-01-20
被引用文献数
18

2画像の点対応から計算した基礎行列をそれぞれの画像の焦点距離とカメラの運動パラメータとに代数的に閉じた形に分解するアルゴリズムを示す。これはスカラ不変量で表された基本行列の分解可能条件に基づくものである。また解が不定となる退化の条件をすべて解析する。さらに退化が生じた場合に2画像の焦点距離は等しいと仮定して解を求める方法を示し、その場合の退化の条件を調べる。最後にエピ極点を用いるBougnouxの公式を本論文の理論的枠組みから再導出する。We describe an algorithm for decomposing a fundamental matrix computed from point correspondences over two images into the focal lengths of the two images and the camera motion parameters in a closed-form expression in the fundamental matrix. Our algorithm is based on the decomposability condition of the essential matrix expressed in terms of its scalar invariants. We give a complete analysis for degenerate camera configurations. We also describe an algorithm for computing a single focal length in the degenerate case and analyze the indeterminacy condition. Finally, we recapitulate Bougnoux's formula, which describes the focal lengths using the epipoles, in our theoretical framework.
著者
金谷健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.66, pp.33-40, 2003-07-03
参考文献数
32
被引用文献数
18

筆者がコンピュータビジョンの幾何学的問題の最適計算法として「くりこみ法」を発表して10年経った機会に,その歴史的経過,その後の発展および最新の結果をまとめる.まず「幾何学的当てはめ」の一般論を述べ,次に拘束条件が線形の場合の「最小二乗法」,「FNS 法」,「HEIV 法」,「くりこみ法」を説明し,それらの背景や比較を述べる.そして関連する「最適補正」の原理,「平衡法(白色化法)」,および「セミパラメトリックモデル」に触れる.On the occasion of the tenth year after the author first proposed the "renormalization method" for statistical optimization of geometric computations for computer vision, this paper reviews its history and recent developments. First, we describe the general framework of "geometric fitting". Then, we describe, as numerical schemes for linear constraints, the "least-squares method", the "FNS method", the "HEIV method", and the "renormalization method" along with their backgrounds and comparisons. We also comment on the principle of "optimal correction", the "equilibration (or whitening) method"and the "semi-parametric model".
著者
金谷健一 浅原 清太郎 菅谷 保之 ハノ・アッカーマン
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.88, pp.131-138, 2005-09-06
被引用文献数
8

Tomasi・Kanadeの因子分解法によって3次元復元を行うにはカメラモデル(平行,弱,疑似透視)を指定する必要がある.本論文ではそのような特定のカメラモデルを指定する必要のない方法を提案する.まず因子分解法の原理を,撮像がアフィンカメラであるという以外には何も仮定しない形で記述し,カメラモデルに依らない計量条件を導く.次に,撮像が透視投影を近似するための最小限の要請を置くと2個の不定関数を含むカメラモデルが得られることを示す.そして,その関数値を入力画像から自己校正によって定めれば自動的に適切なモデルが選ばれることを実験的に検証する.In order to reconstruct 3-D Euclidean shape by the Tomasi-Kanade factorization, one needs to specify a camera model such as orthographic, weak perspective, and paraperspective. We present a new method that does not require any such specific camera models. We first state the principle of 3-D reconstruction in the most general form without assuming anything about the camera except that it is affine and derive a camera-model-free metric constraint. We then prove that a minimal requirement for the affine imaging geometry to mimic perspective projection leads to a camera model that has two free functions. We experimentally confirm that if we optimally determine their values from input images by self-calibration, an appropriate camera model is automatically selected.
著者
金谷健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.35, no.2, pp.201-209, 1994-02-15
参考文献数
38
被引用文献数
42

画像データを解析して3次元情報を抽出する場合に、通常は多数のデータに最小二乗法を適用して、ノイズに対するロバスト性を増している。本諭文ではまずコンピュータビジョンに典型的に現れる最小二乗法では、その重みを最適に選んでも解に統計的な偏差があることを指摘する。そして、統計解析によって偏差を除去する「くりこみ法」と呼ぷ手法を定式化する。これを消失点や出現点の推定、コニックの当てはめ、3次元運動解析に適用した例を示し、画像の誤差についての情報がなくても精度が向上することを確認する。
著者
三島 等 金谷健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.1999, no.74, pp.67-74, 1999-09-16
被引用文献数
22

必ずしも等方一様でない独立な正規分布に従う誤差のもとで2組の対応点から基礎行列を最適に計算する手法を述べる。まずこの誤差モデルのもとでの精度の理論限界を導き、次にこれを達成するアルゴリズムを記述する。これはまずランク拘束を考慮せずにくりこみ法により基礎行列を計算し、次にこれがランク拘束を満たすように補正するものである。そして本手法の精度が理論限界を実際に達成していることを実験的に検証する。したがって、本手法は厳密に最適であり、もはや改良の余地はない。また、本アルゴリズムにより最適解が得られるだけでなく、その信頼性も同時に評価される。シミュレーションおよび実画像実験によりエピ極点の信頼性を評価する例を示す。This paper presents an optimal algorithm for computing the fundamental matrix from two sets of corresponding points in the presence of independent Gaussin noise not necessarily isotropic or homogeneous. We first derive a theoretical accuracy bound and then present an algorithm that attains it. This algorithm first applies a technique called renormalization without considering the rank constraint and then corrects the solution to impose the constraint. We demonstrate by experiments that our algorithm indeed attains the accuracy bound. Hence, our algorithm is optimal in the strict sense: no further improvement is possible. Our algorithm produces not only optimal estimate but also evaluates its reliability. We show simulated and real-image examples of the reliability of the computed epipoles.
著者
山田 純平 金谷健一 菅谷 保之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.51, pp.339-346, 2006-05-19
被引用文献数
18

本論文では画像上の点列に楕円を当てはめる問題を最尤推定として定式化し、KCRの下界との関係を述べる。次に、その数値解法としてFNS法、HEIV法、くりこみ法のアルゴリズムを述べ、ガウス・ニュートン法を追加する。そして、シミュレーションおよび実画像を用いてこれらの反復解法の収束性を実験的に比較し、反復の初期値や当てはめる楕円弧の形状への依存性を明らかにする。This paper studies numerical schemes for fitting an ellipse to points in an image. First, the problem is posed as maximum likelihood estimation, and the relationship to the KCR lower bound is stated. Then, we describe the algorithms of FNS, HEIV, and renormalization, to which a new method based on Gauss-Newton iterations is added. Using simulated and real image data, we compare their convergence properties and reveal their dependence on the initial value for iterations and the shape of the elliptic arc to which an ellipse is to be fitted.
著者
岩元 祐輝 菅谷 保之 金谷健一
出版者
情報処理学会
雑誌
コンピュータビジョンとイメージメディア(CVIM) (ISSN:18840930)
巻号頁・発行日
vol.2011, no.19, pp.1-8, 2011-01-13
被引用文献数
1

多画像から3次元形状復元を行うバンドル調整のアルゴリズムを最新の研究に基づいて詳細に記述する.本論文で着目するのはカメラ回転の適切な取扱い方,および特徴点と画像数が多いときの計算とメモリの効率化であり,これらがバンドル調整実装の骨子となる.そして,2画像からの基礎行列の計算,および多画像からの3次元復元に対する実験行い,その性能を評価する.We describe in detail the algorithm of bundle adjustment for 3-D reconstruction from multiple images based on our latest research results. The main focus of this paper is the handling of camera rotations and the efficiency of computation and memory space usage when the number of feature points and the number of frames are large. An appropriate consideration of these is the core of the implementation of bundle adjustment. Doing experiments of fundamental matrix computation from two images and 3-D reconstruction from multiple images, we evaluate the performance of bundle adjustment.
著者
菅谷 保之 金谷健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.25, pp.207-214, 2006-03-17
被引用文献数
16

本論文では2画像の特徴点対応から基礎行列を計算する最尤推定とそのECR下界との関係を述べ,具体的な数億計算法としてFNS法,EEIV法,くりこみ法のアルゴリズムをまとめる.さらにガウス・ニュートン反復を用いる方法を追加し,シミュレーション画像を用いてこれらの反復解法の収束性を検討する.反復の初期値はランダムに,最小二乗法で,およびTaubin法で定める3通りで比較する.最後に実画像を用いた実験を示す.これらの実験によって各々の計算法の特質が明らかになり,結論としてFNS法が最も収束性に優れていることが示される.This paper studies numerical schemes of maximum likelihood estimation for computing the fundamental matrix from feature point correspondences over two images. First, we state the problem and the associated KCR lower bound. Then, we describe the algorithms of three well-known methods, FNS, HEIV, and rep to which we add a new algorithm based on Gauss-Newton iterations. Using simulated images, we compare their convergence properties. The initial value is chosen in three ways: randomly, by least-squares, and by the Taubin method. We also show real image experiments. These experiments reveal characteristics of each method. It is concluded that FNS has the best convergence properties.
著者
金澤 靖 金谷健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.23, pp.1-8, 2001-03-08
被引用文献数
6

我々は従来より画像の特徴点の位置の不確定性を共分散行列によって表現し,それに基づいた最適化推定の手法を開発してきた.本稿では,まず従来から提案されている画像の濃淡値から共分散行列を計算する方法を統一的に定式化し,それが本当に特徴点の位置の精度を反映しているのかどうかを可変テンプレートマッチングによるサブ画素補正を行うことにより,実験的に検証する.そして,このような共分散行列を用いた場合に射影変換行列および基礎行列の最適計算の精度が向上するかどうかを調べる.これらの結果を画像間の対応づけのための半自動的システムへ応用する.We have explored various statistical optimization techniques based on covariance matrices that characterize the uncertainty of the positions of feature points in the images. We first describe how to compute the covariance matrix of a feature point from the gray levels by integrating existing methods. Then, we experimentally examine if thus computed covarinace matrices really reflect the accuracy of the feature positions. For this purpose, we observe the correlation between the feature covariance and the amount of subpixel correction resulting from variable template matching, using real images. We also test if the accuracy of computing the homography and the fundamental matrices from two images can be really improved by statistical optimization based on the covariance matrices. Finally, we apply our results to semi-automatic systems for matching two images.
著者
金谷健一 菅谷 保之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.31, pp.25-32, 2007-03-19
被引用文献数
9

線形化可能な制約付き最尤推定のための拡張 FNS 法を提案する。これは Chojnacki らの CFNS法に変わる方法である。内部拘束の個数は任意であり、Chojnacki らの FNS 法の真の拡張になっている。基礎行列の計算を例にとり、シミュレーションによって精度を理論限界(KCR 下界)と比較して、CFNS 法は必ずしも正しい解に収束しないが、拡張 FNS 法は常に最適解に収束することを示す。We present a new method, called "EFNS" ("extended FNS"), for linearizable constrained maximum likelihood estimation. This complements the CFNS of Chojnacki et al. and is a true extension of the FNS of Chojnacki et al. to an arbitrary number of intrinsic constraints. Computing the fundamental matrix as an illustration, we demonstrate that CFNS does not necessarily converge to an correct solution, while EFNS converges to an optimal value which nearly satisfies the theoretical accuracy bound (KCR lower bound).
著者
金谷健一 マイケル・J・ブルックス
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.7, pp.57-64, 2000-01-20
被引用文献数
2

運動する未校正カメラで観測したオプティカルフローを特徴づけるフロー基礎行列から焦点距離とその変化速度、およびカメラの運動パラメータを計算するアルゴリズムを示す。まずオプティカルフローのエピ極線条件を導き、それを表すフロー基礎行列を定義するとともに、その分解可能条件を示す。次にフロー基礎行列を画像座標系の回転に対応する2次元回転群の既約表現で表す。シューアの補題により、これは複素数の範囲で1次元相対不変量に簡約される。これを用いると解が簡潔な代数的公式として表せる。最後に解が不定となる退化の条件を解析する。We describe an algorithm for decomposing the fundamental matrices that characterize optical flow observed by an uncalibrated camera in motion into the focal length and its rate of change and the camera motion parameters. We first derive the epipolar equation for optical flow and define its flow fundamental matrices. We also derive their decomposability condition. Then, we express them in terms of irreducible representations of the two-dimensional group of rotations associated with image coordinate rotations. According to Schur's lemma, they can be reduced to one-dimensional relative invariants with weights in the domain of complex numbers. We show that the solution can be easily obtained in a simple algebraic form in terms of them. Finally, we analyze the condition for which the solution is indeterminate.