著者
金谷健一 松永 力
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.7, pp.49-56, 2000-01-20
被引用文献数
18

2画像の点対応から計算した基礎行列をそれぞれの画像の焦点距離とカメラの運動パラメータとに代数的に閉じた形に分解するアルゴリズムを示す。これはスカラ不変量で表された基本行列の分解可能条件に基づくものである。また解が不定となる退化の条件をすべて解析する。さらに退化が生じた場合に2画像の焦点距離は等しいと仮定して解を求める方法を示し、その場合の退化の条件を調べる。最後にエピ極点を用いるBougnouxの公式を本論文の理論的枠組みから再導出する。We describe an algorithm for decomposing a fundamental matrix computed from point correspondences over two images into the focal lengths of the two images and the camera motion parameters in a closed-form expression in the fundamental matrix. Our algorithm is based on the decomposability condition of the essential matrix expressed in terms of its scalar invariants. We give a complete analysis for degenerate camera configurations. We also describe an algorithm for computing a single focal length in the degenerate case and analyze the indeterminacy condition. Finally, we recapitulate Bougnoux's formula, which describes the focal lengths using the epipoles, in our theoretical framework.
著者
新妻 弘崇 プラサンナ・ランガラヤン 金谷 健一
出版者
情報処理学会
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.55, pp.1-8, 2010-01-14
参考文献数
20
被引用文献数
1

2 画像の対応点から射影変換を計算する高精度な解法を提案する.最尤推定に基づく方法は理論的には最適であるが,反復を要するため誤差が大きいと収束しないことがある.提案手法は代数的解法であるため反復なしに解が求まる.代数的解法には正規化の重み行列の自由度があることに着目し,これを 2 次の偏差項まで 0 になるように定める.シミュレーションにより,これが最尤推定に匹敵する精度があり,精度の理論限界 (KCR 下界) をほぼを達成すること,および計算を簡略化する 「Taubin 近似」 を行っても同程度の精度であることを示す.最後に実画像によるパノラマ画像の生成を行い,提案方法によって精度のよい合成ができることを示す.We present highly accurate least-squares (LS) alternatives to the theoretically optimal maximum likelihood (ML) estimator for homographies between two images. Unlike ML, our estimators are non-iterative and yield solutions even in the presence of large noise. By rigorous error analysis, we derive a "hyperaccurate" estimator which is unbiased up to second order noise terms. Then, we introduce a computational simplification, which we call "Taubin approximation", without incurring a loss in accuracy. We experimentally demonstrate that our estimators have accuracy surpassing the traditional LS estimator and comparable to the ML estimator.
著者
金谷健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.66, pp.33-40, 2003-07-03
参考文献数
32
被引用文献数
18

筆者がコンピュータビジョンの幾何学的問題の最適計算法として「くりこみ法」を発表して10年経った機会に,その歴史的経過,その後の発展および最新の結果をまとめる.まず「幾何学的当てはめ」の一般論を述べ,次に拘束条件が線形の場合の「最小二乗法」,「FNS 法」,「HEIV 法」,「くりこみ法」を説明し,それらの背景や比較を述べる.そして関連する「最適補正」の原理,「平衡法(白色化法)」,および「セミパラメトリックモデル」に触れる.On the occasion of the tenth year after the author first proposed the "renormalization method" for statistical optimization of geometric computations for computer vision, this paper reviews its history and recent developments. First, we describe the general framework of "geometric fitting". Then, we describe, as numerical schemes for linear constraints, the "least-squares method", the "FNS method", the "HEIV method", and the "renormalization method" along with their backgrounds and comparisons. We also comment on the principle of "optimal correction", the "equilibration (or whitening) method"and the "semi-parametric model".
著者
金谷 健一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.103, no.391, pp.73-80, 2003-10-16

先端技術は世界に発信して初めて意味があるが,日本人の国際会議における英語による発表がまずいために国際的に評価されないことがしばしば起こる.研究発表だけでなく,機内,空港,ショッピング,および人との挨拶で日本人の言語挙動がおかしく,外国人から奇異に思われることが多いが,多くの日本人は気がついていない.これを指摘するとともに,日本人が間違えやすい発音やアクセントの要領を示す.
著者
菅谷 保之 金谷 健一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.105, no.674, pp.35-42, 2006-03-10
参考文献数
18

本論文では2画像の特徴点対応から基礎行列を計算する最尤推定とそのKCR下界との関係を述べ,具体的な数値計算法としてFNS法,HEIV法,くりこみ法のアルゴリズムをまとめる.さらにガウス・ニュートン反復を用いる方法を追加し,シミュレーション画像を用いてこれらの反復解法の収束性を検討する.反復の初期値はランダムに,最小二乗法で,およびTaubin法で定める3通りで比較する.最後に実画像を用いた実験を示す.これらの実験によって各々の計算法の特質が明らかになり,結論としてFNS法が最も収束性に優れていることが示される.
著者
本田 卓士 松永 力 金谷 健一
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2012, no.18, pp.1-8, 2012-11-26

空間をわずかに移動する複数の点の移動前後の位置を 3 次元センサーで計測し,どのような並進,回転,スケール変化が生じているのか,あるいは生じていないのかを判断するモデル選択のために,誤差のある 3 次元データにさまざまな運動モデルを最適に当てはめる新しい方法を提案する.これは, 3 次元アフィン変換の部分群が変数にさまざまな内部拘束を指定して得られることに着目して,内部拘束をもつ 3 次元アフィン変換を拡張 FNS 法によって計算するものである.これにより,従来のように運動ごとに別々のパラメータを導入する必要がなく,すべての部分群が同一の方法で計算できる.この手法をステレオ視による 3 次元シミュレーションデータに対する幾何学的 AIC,幾何学的 BIC,幾何学的 MDL を用いたモデル選択に応用する.Given 3-D sensing data of points slightly moving in space, we consider the problem of discerning whether or not translation, rotation, and scale change take place and to what extent. For this purpose, we propose a new method for fitting various motion models to 3-D noisy data. Based on the observation that subgroups of the 3-D affine transformations are defined by imposing various internal constraints on the variables, our method fits 3-D affine transformations with internal constraints using the scheme of EFNS, which, unlike conventional methods, dispenses with particular parameterizations for particular motion models. We apply our method to simulated stereo vision data and show how model selection using the geometric AIC, the geometric BIC and the geometric MDL works.
著者
金谷 健一
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2005, no.4(2004-CVIM-147), pp.59-66, 2005-01-20

幾何学的当てはめはコンピュータビジョンの最も基本的な問題の一つである.筆者は以前これに対する精度の理論限界(KCR下界)を導き,最尤推定が統計的に最適であることを証明した.最近,Chernovらは,これが筆者の用いた仮定を弱めても成立することを証明している.本稿ではこれを紹介し,その筆者の定式化との相違や問題の背景,セミパラメトリックモデルなどの最近の話題や今後の課題を検討する.
著者
新島 和孝 太田 直哉 金谷 健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.118, pp.1-8, 1999-09-19
参考文献数
12
被引用文献数
1

自動車の運転者の支援を目的として、死角となりやすい左右後方から近付いて来る車両を画像処理を用いて検出する。検出のために用いる基礎的情報は画像の動き(オプティカルフロー)であるが、一般に画像の動きを計算するためのに必要な演算量は多く、それを実行するためには高価な装置を必要とする。これに対し、ここでは昆虫が複眼のような単純なセンサによる情報と、簡単な神経系による処理で十分な情報を得ていることに注目し、荒い解像度の画像情報と簡単な処理により目的を達成することを試みる。実験には通常のカメラと計算機を使用しているが、将来的にはフォトダイオードアレーのような簡単な受光素子と電子回路で装置を実現することを想定している。
著者
金谷健一 浅原 清太郎 菅谷 保之 ハノ・アッカーマン
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.88, pp.131-138, 2005-09-06
被引用文献数
8

Tomasi・Kanadeの因子分解法によって3次元復元を行うにはカメラモデル(平行,弱,疑似透視)を指定する必要がある.本論文ではそのような特定のカメラモデルを指定する必要のない方法を提案する.まず因子分解法の原理を,撮像がアフィンカメラであるという以外には何も仮定しない形で記述し,カメラモデルに依らない計量条件を導く.次に,撮像が透視投影を近似するための最小限の要請を置くと2個の不定関数を含むカメラモデルが得られることを示す.そして,その関数値を入力画像から自己校正によって定めれば自動的に適切なモデルが選ばれることを実験的に検証する.In order to reconstruct 3-D Euclidean shape by the Tomasi-Kanade factorization, one needs to specify a camera model such as orthographic, weak perspective, and paraperspective. We present a new method that does not require any such specific camera models. We first state the principle of 3-D reconstruction in the most general form without assuming anything about the camera except that it is affine and derive a camera-model-free metric constraint. We then prove that a minimal requirement for the affine imaging geometry to mimic perspective projection leads to a camera model that has two free functions. We experimentally confirm that if we optimally determine their values from input images by self-calibration, an appropriate camera model is automatically selected.
著者
金谷健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.35, no.2, pp.201-209, 1994-02-15
参考文献数
38
被引用文献数
42

画像データを解析して3次元情報を抽出する場合に、通常は多数のデータに最小二乗法を適用して、ノイズに対するロバスト性を増している。本諭文ではまずコンピュータビジョンに典型的に現れる最小二乗法では、その重みを最適に選んでも解に統計的な偏差があることを指摘する。そして、統計解析によって偏差を除去する「くりこみ法」と呼ぷ手法を定式化する。これを消失点や出現点の推定、コニックの当てはめ、3次元運動解析に適用した例を示し、画像の誤差についての情報がなくても精度が向上することを確認する。
著者
三島 等 金谷健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.1999, no.74, pp.67-74, 1999-09-16
被引用文献数
22

必ずしも等方一様でない独立な正規分布に従う誤差のもとで2組の対応点から基礎行列を最適に計算する手法を述べる。まずこの誤差モデルのもとでの精度の理論限界を導き、次にこれを達成するアルゴリズムを記述する。これはまずランク拘束を考慮せずにくりこみ法により基礎行列を計算し、次にこれがランク拘束を満たすように補正するものである。そして本手法の精度が理論限界を実際に達成していることを実験的に検証する。したがって、本手法は厳密に最適であり、もはや改良の余地はない。また、本アルゴリズムにより最適解が得られるだけでなく、その信頼性も同時に評価される。シミュレーションおよび実画像実験によりエピ極点の信頼性を評価する例を示す。This paper presents an optimal algorithm for computing the fundamental matrix from two sets of corresponding points in the presence of independent Gaussin noise not necessarily isotropic or homogeneous. We first derive a theoretical accuracy bound and then present an algorithm that attains it. This algorithm first applies a technique called renormalization without considering the rank constraint and then corrects the solution to impose the constraint. We demonstrate by experiments that our algorithm indeed attains the accuracy bound. Hence, our algorithm is optimal in the strict sense: no further improvement is possible. Our algorithm produces not only optimal estimate but also evaluates its reliability. We show simulated and real-image examples of the reliability of the computed epipoles.
著者
金谷 健一 菅谷 保之
出版者
岡山大学
雑誌
挑戦的萌芽研究
巻号頁・発行日
2012

画像データからの高精度な幾何学的な推定(直線や楕円の当てはめ,複数画像間の対応の関係式の計算)には従来から最尤推定が用いられていたが,それより精度が高い「超精度くりこみ法」を導出し,さまざまな実際的な問題に応用した.同時に最尤推定解を補正する「超精度補正」の精密化を行い,同程度の精度が達成できることを実証した.また未知数間に拘束条件がある場合にも最適な推定ができる「拡張 FNS 法」の新しい定式化を示し,東日本大地震の GPS による地盤変形データの解析に適用した
著者
山田 純平 金谷健一 菅谷 保之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.51, pp.339-346, 2006-05-19
被引用文献数
18

本論文では画像上の点列に楕円を当てはめる問題を最尤推定として定式化し、KCRの下界との関係を述べる。次に、その数値解法としてFNS法、HEIV法、くりこみ法のアルゴリズムを述べ、ガウス・ニュートン法を追加する。そして、シミュレーションおよび実画像を用いてこれらの反復解法の収束性を実験的に比較し、反復の初期値や当てはめる楕円弧の形状への依存性を明らかにする。This paper studies numerical schemes for fitting an ellipse to points in an image. First, the problem is posed as maximum likelihood estimation, and the relationship to the KCR lower bound is stated. Then, we describe the algorithms of FNS, HEIV, and renormalization, to which a new method based on Gauss-Newton iterations is added. Using simulated and real image data, we compare their convergence properties and reveal their dependence on the initial value for iterations and the shape of the elliptic arc to which an ellipse is to be fitted.
著者
岩元 祐輝 菅谷 保之 金谷健一
出版者
情報処理学会
雑誌
コンピュータビジョンとイメージメディア(CVIM) (ISSN:18840930)
巻号頁・発行日
vol.2011, no.19, pp.1-8, 2011-01-13
被引用文献数
1

多画像から3次元形状復元を行うバンドル調整のアルゴリズムを最新の研究に基づいて詳細に記述する.本論文で着目するのはカメラ回転の適切な取扱い方,および特徴点と画像数が多いときの計算とメモリの効率化であり,これらがバンドル調整実装の骨子となる.そして,2画像からの基礎行列の計算,および多画像からの3次元復元に対する実験行い,その性能を評価する.We describe in detail the algorithm of bundle adjustment for 3-D reconstruction from multiple images based on our latest research results. The main focus of this paper is the handling of camera rotations and the efficiency of computation and memory space usage when the number of feature points and the number of frames are large. An appropriate consideration of these is the core of the implementation of bundle adjustment. Doing experiments of fundamental matrix computation from two images and 3-D reconstruction from multiple images, we evaluate the performance of bundle adjustment.
著者
菅谷 保之 金谷健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.25, pp.207-214, 2006-03-17
被引用文献数
16

本論文では2画像の特徴点対応から基礎行列を計算する最尤推定とそのECR下界との関係を述べ,具体的な数億計算法としてFNS法,EEIV法,くりこみ法のアルゴリズムをまとめる.さらにガウス・ニュートン反復を用いる方法を追加し,シミュレーション画像を用いてこれらの反復解法の収束性を検討する.反復の初期値はランダムに,最小二乗法で,およびTaubin法で定める3通りで比較する.最後に実画像を用いた実験を示す.これらの実験によって各々の計算法の特質が明らかになり,結論としてFNS法が最も収束性に優れていることが示される.This paper studies numerical schemes of maximum likelihood estimation for computing the fundamental matrix from feature point correspondences over two images. First, we state the problem and the associated KCR lower bound. Then, we describe the algorithms of three well-known methods, FNS, HEIV, and rep to which we add a new algorithm based on Gauss-Newton iterations. Using simulated images, we compare their convergence properties. The initial value is chosen in three ways: randomly, by least-squares, and by the Taubin method. We also show real image experiments. These experiments reveal characteristics of each method. It is concluded that FNS has the best convergence properties.
著者
金澤 靖 金谷健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.23, pp.1-8, 2001-03-08
被引用文献数
6

我々は従来より画像の特徴点の位置の不確定性を共分散行列によって表現し,それに基づいた最適化推定の手法を開発してきた.本稿では,まず従来から提案されている画像の濃淡値から共分散行列を計算する方法を統一的に定式化し,それが本当に特徴点の位置の精度を反映しているのかどうかを可変テンプレートマッチングによるサブ画素補正を行うことにより,実験的に検証する.そして,このような共分散行列を用いた場合に射影変換行列および基礎行列の最適計算の精度が向上するかどうかを調べる.これらの結果を画像間の対応づけのための半自動的システムへ応用する.We have explored various statistical optimization techniques based on covariance matrices that characterize the uncertainty of the positions of feature points in the images. We first describe how to compute the covariance matrix of a feature point from the gray levels by integrating existing methods. Then, we experimentally examine if thus computed covarinace matrices really reflect the accuracy of the feature positions. For this purpose, we observe the correlation between the feature covariance and the amount of subpixel correction resulting from variable template matching, using real images. We also test if the accuracy of computing the homography and the fundamental matrices from two images can be really improved by statistical optimization based on the covariance matrices. Finally, we apply our results to semi-automatic systems for matching two images.
著者
金谷健一 菅谷 保之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.31, pp.25-32, 2007-03-19
被引用文献数
9

線形化可能な制約付き最尤推定のための拡張 FNS 法を提案する。これは Chojnacki らの CFNS法に変わる方法である。内部拘束の個数は任意であり、Chojnacki らの FNS 法の真の拡張になっている。基礎行列の計算を例にとり、シミュレーションによって精度を理論限界(KCR 下界)と比較して、CFNS 法は必ずしも正しい解に収束しないが、拡張 FNS 法は常に最適解に収束することを示す。We present a new method, called "EFNS" ("extended FNS"), for linearizable constrained maximum likelihood estimation. This complements the CFNS of Chojnacki et al. and is a true extension of the FNS of Chojnacki et al. to an arbitrary number of intrinsic constraints. Computing the fundamental matrix as an illustration, we demonstrate that CFNS does not necessarily converge to an correct solution, while EFNS converges to an optimal value which nearly satisfies the theoretical accuracy bound (KCR lower bound).
著者
金谷健一 マイケル・J・ブルックス
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.7, pp.57-64, 2000-01-20
被引用文献数
2

運動する未校正カメラで観測したオプティカルフローを特徴づけるフロー基礎行列から焦点距離とその変化速度、およびカメラの運動パラメータを計算するアルゴリズムを示す。まずオプティカルフローのエピ極線条件を導き、それを表すフロー基礎行列を定義するとともに、その分解可能条件を示す。次にフロー基礎行列を画像座標系の回転に対応する2次元回転群の既約表現で表す。シューアの補題により、これは複素数の範囲で1次元相対不変量に簡約される。これを用いると解が簡潔な代数的公式として表せる。最後に解が不定となる退化の条件を解析する。We describe an algorithm for decomposing the fundamental matrices that characterize optical flow observed by an uncalibrated camera in motion into the focal length and its rate of change and the camera motion parameters. We first derive the epipolar equation for optical flow and define its flow fundamental matrices. We also derive their decomposability condition. Then, we express them in terms of irreducible representations of the two-dimensional group of rotations associated with image coordinate rotations. According to Schur's lemma, they can be reduced to one-dimensional relative invariants with weights in the domain of complex numbers. We show that the solution can be easily obtained in a simple algebraic form in terms of them. Finally, we analyze the condition for which the solution is indeterminate.