著者
小野 隆 市野 学
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.1989, no.10(1988-CVIM-058), pp.83-86, 1989-01-26

本論文は、コンピュータによるジグソーパズル組み立ての一過程として、ピース表面の色情報を利用した組み合わせピースの限定について報告する。入力データには、個々のピースについて1画素R,G,B各8ビットに量子化されたカラー画像を用い、このデータからピースの最外周部分の色情報(色相)を利用して、ピース間の類似度を求めた。
著者
武藤淳一 藤井 英史 森島 繁生
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.1998, no.26(1997-CVIM-110), pp.49-56, 1998-03-19

空間周波数成分を用いて顔表情の認識と再合成を実時間で行うシステムを提案する。画像から自動的にトラッキングされた目・口周辺の正方領域について、高速フーリエ変換を実時間で行い空間周波数成分を求める。次にこの帝域パワーから顔器官の形状、ここではFACSに基づくAUのパラメータ値をニューラルネットワークを用いて推定する。実際にこの推定結果から、顔表情を再合成して原画像との印象を比較した結果、学習には用いていない表情に対しても、原画像と類似した印象を再合成することが可能となった。これにより、瞬きや口の開き、目の開き工合などが忠実にトラッキングすることができる。したがって、マーカー等を顔面に添付することなく、非装着、非接着で表情の印象レベルでのモーションキャプチャを実現することが可能となった。
著者
川嶋 宏彰 西村 拓一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.51, pp.197-209, 2006-05-18
参考文献数
136
被引用文献数
9

本稿では、1980年代から盛んになってきたコンピュータビジョンにおける時系列パターン認識技術について概観する。特に非線形時間伸縮パターンの認識技術をパターンマッチングによる手法とモデルに基づく手法に分けて述べる。また、応用分野として表情認識および音響情報と視覚情報の統合に関して述べる。In this paper, we will survey researches on temporal pattern recognition which has been popular in 1980s in the field of computer vision. We will focus on dynamic time warping method categorizing it into pattern matching method and model based method. Furthermore, expression recognition and fusion of sound and image are introduced.
著者
中川 知香 佐藤 智和 横矢 直和
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.5, pp.93-100, 2006-01-20

カメラ付き携帯機器におけるユビキタスARの実現には,カメラの位置・姿勢情報の取得が必要である.また計算コストなどの点から入力データとして静止画像を用いることが望ましい.本稿では,特徴点追跡に基づく三次元復元によって得られる広域環境の自然特徴点ランドマークデータベースを用いることで,1枚の静止画像からカメラの位置・姿勢を推定する手法を提案する.提案手法では,まず入力画像内の特徴点と類似度が高いランドマークを1対多で対応付け,各ランドマークと同じ見え方で撮影できる領域に投票することにより入力画像が撮影された可能性が高いカメラ位置候補を特定し,誤対応を排除する.次に,カメラ位置候補に投票したランドマークと入力画像の特徴点の組を複数用いて,カメラの位置・姿勢を推定する.実験では,屋外環境のランドマークデータベースを構築し,データベースの撮影経路付近で撮影した画像を用いて提案手法の推定精度を評価した.Position and posture estimation for a camera embedded in a mobile device is very important for ralizing ubiquitous augmented reality. In this report, we propose a novel method for estimating camera position and posture from a still image based on feature landmark database. In the proposed method, firstly, candidates of corresponding points of feature landmarks are searched in an input image. Secondly, camera position from which candidate points are visible is roughly computed by a voting approach. Finally, camera position and posture is determined by using pairs of landmark and feature point voted for the roughly computed camera position. The validity of the proposed method has been shown through experiments for an outdoor environment.
著者
金谷健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.66, pp.33-40, 2003-07-03
参考文献数
32
被引用文献数
18

筆者がコンピュータビジョンの幾何学的問題の最適計算法として「くりこみ法」を発表して10年経った機会に,その歴史的経過,その後の発展および最新の結果をまとめる.まず「幾何学的当てはめ」の一般論を述べ,次に拘束条件が線形の場合の「最小二乗法」,「FNS 法」,「HEIV 法」,「くりこみ法」を説明し,それらの背景や比較を述べる.そして関連する「最適補正」の原理,「平衡法(白色化法)」,および「セミパラメトリックモデル」に触れる.On the occasion of the tenth year after the author first proposed the "renormalization method" for statistical optimization of geometric computations for computer vision, this paper reviews its history and recent developments. First, we describe the general framework of "geometric fitting". Then, we describe, as numerical schemes for linear constraints, the "least-squares method", the "FNS method", the "HEIV method", and the "renormalization method" along with their backgrounds and comparisons. We also comment on the principle of "optimal correction", the "equilibration (or whitening) method"and the "semi-parametric model".
著者
上田 修功
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.91, pp.195-202, 2004-09-11
被引用文献数
3

パターン認識システムでは,汎化性能の高い識別器の設計が重要となる.において,性能を向上させるには,識別器の汎化性能を向上させるための学習法と,識別に有効な特徴の選択法,および異種情報の効果的な融合法が重要課題となる.本稿では,アンサンブル学習という視点でこれらの問題を解決するための方法論について最新の研究も交えて解説する.In patter recognition system, it is crucial to design a classifier with high generalization ability, Ensemble learning is one pronissing approach for the purpose. In this tutorial, representative ensemble learning methods are reviewed. Moreover, different information dusion methods are also explaind as a new type of ensemble learning.
著者
田口 裕一 高橋 桂太 苗村健
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.27, pp.79-86, 2008-03-10
被引用文献数
5

64台のネットワークカメラアレイを用いた実時間全焦点自由視点映像合成システムについて報告する.本システムでは,所望の視点位置における画素単位の奥行きマップを実時間で推定し,高品質な全焦点自由視点映像を合成する.画像合成処理をすべてGPU上で実装することにより,CPUとGPUで効率的な並列計算を行うシステムを1台のPCで実現した.これにより,解像度QVGAの入力多視点映像を用いて,フレームレート24fpsでの自由視点映像合成が可能となった.さまざまなシーンにおける高品質な自由視点映像を実験結果として示す.We present a real-time video-based rendering system using a network camera array. Our system consists of 64 commodity network cameras which are connected to a single PC through Gbit Ethernet. To render a high-quality novel view, we estimate a view-dependent per-pixel depth map in real-time based on a layered representation. The rendering algorithm is fully implemented on GPU, which allows our system to efficiently perform independent and parallel processing of CPU and GPU. Our system renders free-viewpoint videos at 24 fps using QVGA input video resolution. Experimental results show high-quality images synthesized from various scenes.
著者
市村 直幸
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2001, no.66(2001-CVIM-128), pp.9-16, 2001-07-05

時系列画像上での特徴点追跡により得られる運動軌跡には,観測ノイズと共に,誤対応に伴う外れ値が含まれる.この観測ノイズと外れ値の影響軽減のため,状態空間モデルを用いた時系列フィルタリングを用いる.適切な状態推定を行うためには,状態推定を司る時変な超パラメータを特徴点の運動に応じてオンライン推定する必要がある.本論文ではその推定のために,特徴点の座標と共に超パラメータを状態に含め同時推定する自己組織化型状態空間モデルを用いる.状態推定には逐次モンテカルロ法を適用するため,非線形なモデルの線形近似は必要としない.人工データおよび実データを用いた実験結果から,提案したフィルタの有効性を検討した.
著者
米司 健一 田中 正行 奥富 正敏
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2005, no.38(2005-CVIM-149), pp.47-52, 2005-05-12

画像撮影時の手ぶれや,対象が動くことによって画像にぶれが生じる.このぶれを等速直線運動で近似すると,ぶれを表すPSF(Point Spread Function)は幅と角度の2つのパラメータで表現することができる.劣化画像の振幅スペクトルは,PSFの幅と角度によって決まる方向と周期で0となる性質を持つ.この劣化画像の振幅スペクトルの周期性と方向性を検出することによって,PSFパラメータの幅ellと角度thetaを推定する.本論文では原画像の周波数特性によらず,劣化画像の振幅スペクトルの周期性と方向性をロバストに検出する手法を提案する.また,実画像実験を通して,提案手法の効果を確認した.
著者
森本 吉春
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2005, no.4(2004-CVIM-147), pp.139-146, 2005-01-21

形状や変形を計測する方法はすでに多くの方法が開発されているが,高速・高精度計測できるものは少ない.ここでは各種光学的方法により得られた投影格子や縞画像の位相を利用した方法を紹介する.とくに,3~4枚の画像から矩形波格子や余弦波格子の位相分布が連続的に計測できる積分型位相シフト法,位相シフトした多数の画像の各点の輝度のフーリエ変換により高精度に位相を解析できるフーリエ変換位相シフト法,複数の基準板を用いた高精度形状計測法,位相シフトデジタルホログラフィ干渉法を用いた変位計測法は実時間で計測できたり,計算時間が少しかかっても高精度に解析することができる.これらの計測の原理とその適用例を示す.
著者
金谷 健一
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2005, no.4(2004-CVIM-147), pp.59-66, 2005-01-20

幾何学的当てはめはコンピュータビジョンの最も基本的な問題の一つである.筆者は以前これに対する精度の理論限界(KCR下界)を導き,最尤推定が統計的に最適であることを証明した.最近,Chernovらは,これが筆者の用いた仮定を弱めても成立することを証明している.本稿ではこれを紹介し,その筆者の定式化との相違や問題の背景,セミパラメトリックモデルなどの最近の話題や今後の課題を検討する.
著者
木村 篤信 鈴木 由里子 中茂睦裕 玉木 秀和 小林 稔
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.115, pp.15-20, 2008-11-20

創造性の求められる知的生産活動において,手書きの描画作業が用いられることは多い.われわれは,より創造的な思考を促進するために描画作業を支援する検討を行っている.本稿では,描画作業などによってアイデアを外化する際に,主体が自身の外化(描画)に対して自省的な姿勢を持っていると外化が有効に働くという可能性に着目し,この自省的な思考によって知的生産性を高める検討を行う.思考のプロセスモデルを元にした自省的思考を促進する支援要件として,脳内でアイデアを結合する回数をできる限り増やすための機能と,思いついたアイデアを円滑に形できる機能を抽出し,共同描画ツールに対して実装したので報告する.In this research, we aim to improve intellectual productivity for discussions in the office. Our approach is to activate Reflective Thinking which is to think something by thinking deeper himselffherself and his/her activities. One of the example scenes is share drawing on whiteboards or papers in the office. The prototypes which support the Reflective Thinking smoothly and augment opportunities for it are implemented with the share drawing system. This paper also reports the subjective evaluations of the prototype.
著者
CVIM研究会運営委員 同僚・友人一同
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2005, no.18(2004-CVIM-148), pp.19-26, 2005-03-03

2005 年1 月3 日朝,松下電器産業の長尾健司氏が永眠されました.優れた研究者であり,様々な学会で活躍されていた方だけに,多くの方々から彼を惜しむ声が聞かれます.しかし,悲嘆に暮れるだけでは,彼も本望ではないはずです.CVIM研究会運営委員会では,彼の優れた研究業績や人柄を多くの方々に知って頂くため,本稿の発行を決定いたしました.幸いにして多くの方々からの資料提供や寄稿が得られ,彼の生きた証の一端を綴ることができました.
著者
関野 進 吉田 耕一 原 輝彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.50, pp.41-47, 2000-05-31
参考文献数
3

システム内部にモデルの特徴点に関する情報と、距離画像から得られた特徴点に関する情報とが与えられているときに、位置姿勢パラメータをどのように決定するかが問題となる。位置姿勢パラメータの推定手法に関する従来法の一つであるGongzhuの手法では、位置姿勢パラメータの導出にHough空間における投票を行うが、任意パラメータに対して、微小刻みで値を変化させ、すべての解について投票といったことをするため、位置姿勢パラメータの精度と推定時間は、任意パラメータの刻み幅に依存する。精度は、この刻み幅が小さい程高くなるが、投票時間は逆に増えてしまうという問題点がある。本報告では、Gongzhuの手法に解析的な手法を用いた改良を加え、位置姿勢パラメータの推定時間と精度の向上の確認を行った。We have been developing object shape recognition systems using range images. These are images composed of scene images whose pixel contains information on the distance from the camera. A range image can be obtained, for example, by capturing the reflection of laser lines from an object through a CCD camera and employing triangulation. We can use this information to realize a recognition system which can distinguish an object, whose 3D shape is specified by CAD data, from a cluttered scene containing many unknown objects. We developed arranged method based on Gongzhu's method.
著者
古明地 正俊 佐々木 繁 尾崎 暢 佐藤 龍哉 太田 善之
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.1987, no.50, pp.1-8, 1987-07-23

本報告は,カラー画像をビデレートで処理できる画像処理システム『韋駄天/カラー』に関するものである。このシステムは,筆者らが提案した『構造可変型パイプラインアーキテクチャ』に基づいた3組の処理ユニットを並列に動作させることにより,高速性を実現した。さらに,カラーを構成するRGBの各画像を相互に演算できるカラー処理モジュール,動的に任意領域の抽出ができるマスクモジュール,画像の特徴量を算出できるモジュールを開発したことにより,カラー動画像特有の処理にも柔軟に対応できる構成になっている。また,実際にカラー動画像を処理することで,本システムの有効性を確認した。We have already developed an image processing system "IDATEN", which can process time-varying monochrome images at video rate, based on a reconfigurable pipeline architecture that we proposed. This paper describes the improvements of this architecture and the protorype for time-varying color images. To realize this, we have newly developed three kinds of processing modules: color coordinate transforming modules, dynamic masking modules for extracting specified regions, and feature extraction modules. To keep the same processing rate for color images, the system was designed with three processing units which operate in parallel. The experimental results verify that the system is effective for time-varying color image processing.
著者
林山 剛久 柳井 啓司 野下浩平
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2002, no.34(2002-CVIM-133), pp.161-168, 2002-05-09

テレビ放送からの自動情報抽出の研究の一例として、本研究では、囲碁対局テレビ番組から画像認識によって自動的に対局棋譜を生成するシステムを提案する。システムは、囲碁対局番組の画面画像を取り込み、画面中の囲碁盤の位置を検出し、置石(囲碁盤上に置かれている石)を検出して、囲碁対局の棋譜の自動生成を行う。対局中の画面画像を認識する際には、対局画面とそれ以外の対局には直接無関係な画面の識別や、囲碁盤上に現れる指し手の手や頭などの置石以外の物体の除去などの、囲碁対局テレビ番組の特有の問題点に対する対処を行う。我々は、実装したシステムを用いて、実際の11対局分の囲碁対局番組に対して実験を行い、96%の適合率と83%の再現率を得た。
著者
谷口 倫一郎 大田友一 美濃導彦 石黒 浩 桑島 茂純 和田 俊和
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.2, pp.85-87, 2002-01-17

「大量カメラを用いなければ得られない情報とは何か」、「大量カメラを用いたシステムにおいて通信が果たす役割」、「大量カメラを用いたシステムの今後の展望」などのテーマについて各パネラーの意見を述べ、これをもとにして「大量カメラとネットワーク」の今後について展望する。In this panel, we will discuss varieties of topics, e.g.,``What is the intrinsic information obtained only by mass-camera system?'', ``What is the role of `communication' in mass-camera system?'', ``Future systems based on mass-camera''. Through the discussions, we hope to have a vision of the future in this research field.
著者
金谷健一 浅原 清太郎 菅谷 保之 ハノ・アッカーマン
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.88, pp.131-138, 2005-09-06
被引用文献数
8

Tomasi・Kanadeの因子分解法によって3次元復元を行うにはカメラモデル(平行,弱,疑似透視)を指定する必要がある.本論文ではそのような特定のカメラモデルを指定する必要のない方法を提案する.まず因子分解法の原理を,撮像がアフィンカメラであるという以外には何も仮定しない形で記述し,カメラモデルに依らない計量条件を導く.次に,撮像が透視投影を近似するための最小限の要請を置くと2個の不定関数を含むカメラモデルが得られることを示す.そして,その関数値を入力画像から自己校正によって定めれば自動的に適切なモデルが選ばれることを実験的に検証する.In order to reconstruct 3-D Euclidean shape by the Tomasi-Kanade factorization, one needs to specify a camera model such as orthographic, weak perspective, and paraperspective. We present a new method that does not require any such specific camera models. We first state the principle of 3-D reconstruction in the most general form without assuming anything about the camera except that it is affine and derive a camera-model-free metric constraint. We then prove that a minimal requirement for the affine imaging geometry to mimic perspective projection leads to a camera model that has two free functions. We experimentally confirm that if we optimally determine their values from input images by self-calibration, an appropriate camera model is automatically selected.
著者
森島 繁生
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.66, pp.107-114, 2003-07-03
参考文献数
29
被引用文献数
1

近年バーチャルヒューマンのアプリケーションとして、エンタテインメントシステムやコミュニケーションシステムが注目されている。ここではいかに人物を忠実にコピーして合成するかが課題であるが、ビジョンベースのシステムは性能に限界があり、クオリティの高い合成画像を再現することは難しい。モーションキャプチャシステムは、映画やゲームの世界で一般的に利用されるが、オンラインで合成することは難しく、後処理で多くのマニュアル操作が必要とされるのが現状である。本稿では、特に顔のアクションを高い忠実度と自然なクオリティでコピーすることを目的とし、顔画像分析・合成技術を駆使して、準リアルタイムでバーチャルヒューマンを制御する手法について述べる。さらにエンタテインメントおよびコミュニケーションを目的とするアプリケーションシステムを紹介する。Copying human action accurately is main scheme in entertainment or communication application to control and generate a virtual human in a screen. Motion capture system is generally used to generate a crone human in the scene of motion picture or interactive game, however, huge manual operation at post processing is inevitable to generate high quality image. In this paper, especially copying facial action is focused on and high quality and accurate method to generate and copy natural impression of face with semi-interactive process using face image analysis and synthesis scheme. Finally, some application systems in entertainment area are introduced.
著者
アンドリューデイヴィソン 喜多 伸之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.2, pp.107-114, 2003-01-16
参考文献数
9

自由に俊敏に移動するシングルカメラの実時間運動推定は,特に解決が困難な問題ではあるが,その解決は,ロボット工学,マルチメディア,テレビ放送などにおける重要な興味のある応用へと繋がっていく.この問題は,カメラ軌道のオフラインでの再構築に焦点をおいているコンピュータビジョン分野における最近のstructure from motionというよりも,移動ロボットによる地図獲得を行う研究(ほとんどの場合カメラベーストではない)である.本研究では,拡張カルマンフィルタを用いたシングルカメラ位置推定,及び,初期の実験結果について報告し,今後の研究課題について述べる.Real-time motion estimation for a generally moving, agile single camera is a particularly challenging problem, but one whose solution will lead to interesting applications in robotics, multimedia and television. We argue that mapping research in mobile robotics, despite rarely being camera-based, is more relevant when tackling this problem than recent structure from motion work in computer vision which has focused on off-line reconstruction of camera trajectories. We present a framework for EKF-based single-camera localisation and initial experimental results, and discuss current and future research issues.