著者
阪野貴彦 長谷川 一英 池内 克史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.18, pp.213-220, 2005-03-04
被引用文献数
7

巨大物体の3次元形状計測では,クレーンやヘリコプタ等を利用した空中からのスキャンが効果的な方法の1つとして考えられる.ただし,対象物体が貴重な文化遺産である場合,安全性や効率性の面から,このような計測にはさまざまな問題が発生する.そのためわれわれは,レンジセンサを気球に搭載したFlying Laser Range Sensor(FLRS)を開発した.しかし,FLRSでは計測中にレンジセンサが運動するため,獲得する形状データに歪みが生じてしまう.そこで,本稿では計測中に移動するレンジセンサから得られるデータを補正する手法を提案する.まず,気球に取り付けたビデオカメラによる画像列と,歪んだ形状データそのものから抽出できる情報を用いて,カメラ運動に関するパラメータの高精度な推定をおこなう.このとき,初期解としてFull-Perspective Factorizationを用いた.推定されたセンサの運動パラメータを用いて,歪んだ形状データを補正した.この手法をカンボジア,バイヨン寺院の計測に適用したところ,FLRSから得られた歪んだ形状データを精度良く復元することができた.For a large scale object, scanning from the air is one of the most efficient methods of obtaining 3D data.In the case of large cultural heritage objects, there are some difficulties in scanning them with respect to safety and efficiency. To remedy these problems, we have been developing a novel 3D measurement system, the Flying Laser Range Sensor (FLRS) , in which a rage sensor is suspended beneath a balloon.The obtained data, however, have some distortion due to the intra-scanning movement.In this paper, we propose a method to recover 3D range data obtained by a moving laser range sensor; this method is applicable not only to our FLRS, but also to a general moving range sensor.Using image sequences from a video camera mounted on the FLRS enables us to estimate the motion of the FLRS without any physical sensors such as gyros and GPS.At first, the initial values of camera motion parameters are estimated by perspective factorization.The next stage refines camera motion parameters using the relationships between camera images and the range data distortion.Finally, by using the refined parameter, the distorted range data are recovered. We applied this method to an actual scanning project and the results showed the effectiveness of our method.
著者
影広 達彦 緒方 健人 酒匂 裕 Josef Kittler
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.87, pp.187-194, 2007-09-04
被引用文献数
1

監視カメラによって人物の異常な挙動を検知するために,挙動認識システムの研究を行った。本システムは,人物挙動の変化を検知することで,正常/異常の判定を行う。人物を追跡するために,最近傍法とParticle filter法の2つの手法を動的に切り替え,複数の人物が重なり合う場合でも安定した追跡を可能にした。また,学習判定機能に自己組織化マップを適用し,事前学習なしで挙動の変化検知が可能になった。本報告では,歩行状態を正常,乱闘状態を異常と定義し,CAVIAR データベースを元にシステムの精度評価を行った。その結果,フレーム単位の評価で,歩行状態に対する虚報率は1.8%,乱闘状態の検知率は64.2%となった。また,オプティカルフローの方向成分の平均値が,最も有効な特徴量であることが分かった。We developed the human behavior recognition system by using surveillance camera. This system detects human behavior changing. I adapted the hybrid method which can change the nearest tracking method and particle filter method dynamically, so this system can track some humans who are overlapped. Because of Self Organizing feature Maps, this system can output the classification result without the learning step in advance. In this report, I defined that human walking condition is normal, and the human fighting condition is abnormal. As a result, the rate of false alarm in the walking data set is 1.8%, and the sensitivity rate in the fighting data set is 64.2% in all frames. I found that the most effective feature is the average of the optical flow direction (sine and cosine).
著者
山本 輝俊 梶田 健史 山守 一徳 長谷川 純一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.1997, no.70, pp.25-32, 1997-07-24
被引用文献数
9

本論文では、デフォルメ地図自動生成のための並列型道路変形手法について述べる。道路変形には、これまで道路を順番に変形していく逐次的な手法が開発されているが、結果が変形順序に依存する、変形順序を決める合理的な方法がないなどの問題があった。そこで本文では、各道路線分にかかる4種類の力を定義し、それらの合力に基づいて道路全体を反復並列的に変形させる手法を提案する。実験では、本手法と従来手法を実際の道路地図に適用し、それらの結果を2種類の尺度を用いて定量的に評価する。This paper presents a parallel road deformation method for automated generation of deformed maps. A sequential method has already been proposed for the same deformation problem. However, the deformed results depend on the order of deformation, and there is no reasonable way to determine the order. The method proposed here can deform the roads in parallel and iteratively based on a resultant of four types of forces placed on each road segment. In experiments using real maps the results by the proposed method and the previous one are evaluated quantitatively with two kinds of criteria.
著者
金谷健一 菅谷 保之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.31, pp.25-32, 2007-03-19
被引用文献数
9

線形化可能な制約付き最尤推定のための拡張 FNS 法を提案する。これは Chojnacki らの CFNS法に変わる方法である。内部拘束の個数は任意であり、Chojnacki らの FNS 法の真の拡張になっている。基礎行列の計算を例にとり、シミュレーションによって精度を理論限界(KCR 下界)と比較して、CFNS 法は必ずしも正しい解に収束しないが、拡張 FNS 法は常に最適解に収束することを示す。We present a new method, called "EFNS" ("extended FNS"), for linearizable constrained maximum likelihood estimation. This complements the CFNS of Chojnacki et al. and is a true extension of the FNS of Chojnacki et al. to an arbitrary number of intrinsic constraints. Computing the fundamental matrix as an illustration, we demonstrate that CFNS does not necessarily converge to an correct solution, while EFNS converges to an optimal value which nearly satisfies the theoretical accuracy bound (KCR lower bound).
著者
矢野 雅之 勝間 大輔 清水 大輔 渡邊 睦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.25, pp.321-326, 2006-03-17

画像認識を行う際、まず領域分割を行って認識対象の候補となる領域を設定することが行われる。しかし、領域数は一般に未知であり、又、明度/色相値の類似性のみで領域を生成した場合には影や模様の影響により適切に設定できないという問題がある。そこで本稿では、明度による自動領域分割に対してDFT処理した領域をクラスタリングした分割結果を統合することにより、領域分割結果の精度向上を行う方式について提案する。屋内シーン、屋外シーンにおいて本手法の有効性を確認した。The first stage of object recognition is generally the region(description) creation to identify candidates of recognized objects by means of segmentation. However, several difficulties exist in the segmentation, such as, unknown region number and miss-segmentation due to shadows or irregular texture patterns. We propose a unified method of both intensity-based segmentation result and texture-based one to improve the accuracy. The texture-based segmentation is executed by clustering DFT outputs. Experimental result have shown the effectiveness of the proposed method.
著者
勝間 大輔 清水 大輔 渡邊 睦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.93, pp.241-248, 2006-09-09

室内に存在する物体の種別・位置姿勢を2次元画像認識により求める際,複数物体の重なり・遮蔽や影などの影響によるコントラスト低下が生じた部分の特徴抽出が失敗し,正しく認識が行われないという問題がある.本論文では,認識対象個々の形状・属性情報を記述した物体モデルに加え,物体相互の位置関係,および人間動作との干渉関係を記述した『関係モデル』を適用することにより,上記の問題に対処する手法を提案する.撮影したシーンからまずエッジを抽出・ラスタベクトル変換・補完した後,連結性解析により閉面領域抽出を行う.次に物体モデルと照合することによりまず閉面単位のスコアを計算した後,隣接する閉面単位スコアを統合した統合スコアを求め,認識対象物体の候補を抽出する.ここで関係モデルを適用することにより,認識対象侯補完の位置関係の整合性を検証し,矛盾の無い閉面領域の組み合わせを認識対象物体領域として得る.最後に物体同士の位置関係や人間動作との干渉関係を用いることにより,未認識領域に対する解釈当て嵌めを行う.現在実装しているのは認識対象物体の候補抽出部分までであり,室内環境シーンを対象とした実験結果について述べる.2D Object recognition system tends to fail when detected features are vastly lost caused by overlapping of multiple objects, occlusion and decline in contrast This paper proposes a method to manage the incomplete feature detection problem by applying a "relation model" in addition to the conventional object model. First, detection of edge segments, raster-to-vector transformation and supplementation of edge segments are executed and closed region-based descriptions are created. Next, candidates of recognized objects are extracted by calculating the scores of each closed region based on matching with the object model, and unified scores are calculated by unifying the closed region scores in the neighborhood. Then, the consistency among recognized object candidates are examined by applying the relation model, and combinations of closed region are selected as recognized object regions. Finally recognition of unknown regions is executed by applying the relations among object positions and the relations between objects and human motion. Experimental results in indoor scenes by the implemented system are shown
著者
金谷健一 マイケル・J・ブルックス
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.7, pp.57-64, 2000-01-20
被引用文献数
2

運動する未校正カメラで観測したオプティカルフローを特徴づけるフロー基礎行列から焦点距離とその変化速度、およびカメラの運動パラメータを計算するアルゴリズムを示す。まずオプティカルフローのエピ極線条件を導き、それを表すフロー基礎行列を定義するとともに、その分解可能条件を示す。次にフロー基礎行列を画像座標系の回転に対応する2次元回転群の既約表現で表す。シューアの補題により、これは複素数の範囲で1次元相対不変量に簡約される。これを用いると解が簡潔な代数的公式として表せる。最後に解が不定となる退化の条件を解析する。We describe an algorithm for decomposing the fundamental matrices that characterize optical flow observed by an uncalibrated camera in motion into the focal length and its rate of change and the camera motion parameters. We first derive the epipolar equation for optical flow and define its flow fundamental matrices. We also derive their decomposability condition. Then, we express them in terms of irreducible representations of the two-dimensional group of rotations associated with image coordinate rotations. According to Schur's lemma, they can be reduced to one-dimensional relative invariants with weights in the domain of complex numbers. We show that the solution can be easily obtained in a simple algebraic form in terms of them. Finally, we analyze the condition for which the solution is indeterminate.
著者
今井 康介 八木 康史 谷内田 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.4, pp.139-145, 2001-01-18
被引用文献数
1

本報告では,予めロボット移動に伴い得られた全方位ルートパノラマ画像を記憶しておくことで,ロボットを誘導する方法を提案する.ロボットの自己位置は,一対の動的輪郭モデルにより記憶画像列と入力画像とを対応付けることで求める.Described here is a route navigation method for a mobile robot with an omnidirectional image sensor. The route is memorized by a series of consecutive omnidirectional images at the horizon while the robot moves to the goal position. While the robot is navigating to the goal point, the input is matched with memorized spatio-tempral route patterns image by using dual active contour models and we can estimated the exact robot position
著者
綱島 宣浩 塩原 守人 佐々木 繁 棚橋 純一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.33, pp.111-117, 2000-03-23
被引用文献数
6

水路やダムなどにおいて水位計測を行うことは,洪水や渇水の監視のために非常に重要である.水圧式やフロート式といった従来の水位計測手法は,水路に計測器を直接設置する接触型の計測手段であったため,藻やゴミによる誤動作や景観を損ねるという問題があった.このような接触型の従来手法の問題を解決するために,本研究では水路側壁において壁と水面の境界を求めることで水位の検出ができることに着目し,水路側壁を撮影した画像から画像処理によって水位を計測する非接触型の水位計測手法を開発した.画像処理によって水位を計測するために,波の影響を受けて不定形な曲線形状をしている水面境界の検出手法,および,検出した水面境界から波の影響を除去して水位を計測する手法を開発した.開発手法の有効性を検証するために,実際の河川で取得した画像に本手法を適用したところ,波のある水面に対して±1cm精度で水位を計測できることを確認した.It is very important to measure a water level for surveying a flood or a water shortage at a dam, a canal, a waterway and so on. In this paper we described a new technique for measuring a water level using image processing. The water level can be measured to detect a borderline between the water and sidewall of the waterway. The borderline becomes indefinite under the influence of a wave. Therefore we developed two algorithms for detection of the infinite borderline and calculation of the water level from it. Verifying our method, we apply it to the images taken from Tama River. As a result we can measure the water level with ±1cm accuracy.
著者
上東 太一 柳井 啓司
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.42, pp.201-208, 2007-05-15
被引用文献数
1

近年、デジタル画像の爆発的な増大によって、実世界の一般的な画像に対する認識技術への要求が高まっている。そこで、本研究では、新しい認識の手法として G. Csurka らによって提案された bag-of-keypoints 手法を利用して、Web から収集した一般的な画像に対して画像分類実験を行った。Bag-of-keypoints 手法によって画像特徴量を抽出し、SVM によって分類実験を行った結果、100 クラスの分類において分類率 51.1%を実現した。Recently, need for generic image recognition is getting larger due to the explosive increase of digital images. Then, we have performed classification experiments for general real-world images gathered from Web employing the bag-of-keypoints method proposed by G.Csurka et al. In the experiments, we have obtained the 51.1% classification rate for 100 object classes.
著者
森田 拓磨 高松 淳 小川原 光一 木村 浩 池内 克史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.102, pp.71-78, 2002-11-07
被引用文献数
3

プログラマの労働を減らすことを目的として,Learning from Observationのパラダイムは数々のロボットシステムに適用されてきた.しかしこれらの対象は剛体であり,柔軟物に適用された例は見られなかった.状態表現の困難さ,操作の多様さがその理由である.我々は様々な柔軟物操作の中で"ひも結び"に着目した.その理由は数学の結び目理論が適用出来ること,ひもは可能な操作が比較的限定されていることである.本稿ではKPOのパラダイム,理論,現在構築中のKPOシステムについて述べる.Learning from Observation (LFO) has been widely applied in various types of robot system. It helps reduce the work of the programmer.But the available systems have application limited to rigid objects.Deformable objects are not considered because: 1) it is difficult to describe their state and 2) too many operations are possible on them.In this paper, we choose the knot tying as case study for operating on nonrigid bodies, because a ``knot theory'' is available and the type of operations is limited.We describe the Knot Planning from Observation (KPO) paradigm, a KPO theory and a KPO system.
著者
栗畑 博幸 高橋 友和 目加田 慶人 井手 一郎 村瀬 洋 玉津 幸政 宮原 孝行
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.25, pp.227-232, 2006-03-17

本報告では車載カメラ映像から雨天時に現れる画像特徴を抽出し,それを用いた状況別降雨認識手法を提案する.車載カメラを用いた運転支援技術の一環として,撮影時刻や降雨量の異なる様々な状況において天候,特に降雨の認識を試みる.具体的にはフロントガラスに付着した雨滴により変化する画像特徴を,昼夜の状況に適した方法を用いて検出することによって降雨の認識を行う.昼間の映像の場合には,様々な形状の雨滴画像から主成分分析を用いてテンプレートを作成し,テンプレートマッチングにより雨滴を検出する.我々はこれまで画像中の空領域からの雨滴検出手法を提案してきたが,本報告では入力画像を複数フレームにわたって平均化することで,画像全体からの安定した雨滴検出を行う手法を提案する.また雨滴検出結果をフレーム間で照合することで,より精度の高い雨滴検出が期待される.夜間の映像の場合には,雨滴による散乱光を定量化する.撮影時刻や降雨量の異なる実映像を用いて実験を行った結果,昼間の場合,画像全体から適合率0.97,再現率0.51と,従来と同程度の検出精度が得られた.また夜間の場合,83%の降雨判定成功率が得られた.これらのことから提案手法の有効性を確認した.In this paper, we propose a rainfall recognition method in various conditions from in-vehicle camera images using extracted image feature characteristic to rain. As a driver assistance system using an in-vehicle camera, we have been trying to recognize weather, espcially rainfall in various conditions. We recognize the rainfall by detecting the changes of image features caused by raindrops on the windshield, making use of different methods for day and night. In daytime, we make raindrop templates by principal component analysis from various raindrop images, and detect raindrops by template matching. We have previously proposed a raindrop detection method from the sky region in the image. Int this paper, we propose a method that detects raindrops from the whole image by averageing multiple input images. In addition, higher accuracy of raindrop detection is expected by matching the detected raindrops between frames. In nighttime, we propose a method that quantifies lights reflacted by raindrops. As a result, the same detection accuracy with number of the previous method was obtained (precision rate 0.97, recall rate 0.51) for daytime without restricting the target region. In nighttime, we obtained a the success rate of 83% rainfall judgment. E?ectiveness of this technique was shown from these results.
著者
本谷秀堅 中川 宗栄 馬場 一徳 釘宮 豊人 佐藤公春
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.88, pp.71-78, 2003-09-08

本稿では対象をIDタグで同定し,CADデータをネットワークより取得するCAD-based visionシステムを提案する.その例として,円形のIDタグを利用した,visual trackingシステムを示す.円形のIDタグは,内部の白黒パターンがIDを表す.円形タグの画像は楕円形となる.その楕円形状からカメラと対象の相対的な姿勢を推定する.IDの認識と姿勢の推定は,時刻0においてのみおこなう.IDを認識し姿勢を推定するためには,IDタグが画像から頑健に抽出されなければならない.そこで再帰反射板でIDタグを作成し,カメラと同期して明滅する照明を併用する.照明を駆動する信号と画素値の変化の相関を計算することにより,画像から頑健にタグ領域を抽出できる.IDタグにより対象を認識できるため,画像に基づき対象を認識するCAD-based visionシステムと比べて,より多くの対象を処理することが可能となる.We propose a CAD-based vision system that identifies an object using its ID-tag, and downloads the CAD data from the computer network. A visual tracking system that uses a circular ID-tag is shown as an example. A circular ID-tag represents the unique ID number of an object. In an image, the shape of the circular tag is an ellipse. The shape of the ellipse helps to estimate the pose of the object relative to the camera. We designe a tag sensing system that robustly extracts the ID-tag from an image. We make the circular ID-tag with a retroreflector, and mount a lighting system that illuminates objects in sync with the camera. Calculating the correlation between the light and the image, the system extracts the ID-tag from an image, robustly. Because the ID-tag helps to identify objects, our system can process more objects than a system that identifies objects using only their images.
著者
松村 未来 アヌラグアグラワル 中澤 篤志 竹村 治雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.115, pp.169-176, 2008-11-20

本研究では,取得したレーザーレンジデータと Google Maps 画像を共に複数クラスに領域分割し,クラスの関係を考慮した位置合わせを行うことによって,実環境をモデリングする手法を提案する.実環境のモデリングにおいて,近年レーザーレンジセンサなどの距離センサが広く用いられている.しかし市街地のような広域環境をモデリングするためには,環境中の様々な場所で獲得した複数の距離 (レンジ) データに対して,位置合わせを行う必要がある.本手法ではまず初めに得られたレンジデータとその周囲の地理情報をそれぞれ,あらかじめ設定したいくつかのクラスに領域分割する.その後,両データのクラスが一致する地点を探索することで,レンジデータ撮影地点の判別や,相互の位置合わせを実現する.In this research, we propose a method for taking expansive 3D models of environments using highly-ac curate laser range data. Laser range data is taken using distance sensors called laser range sensors, which have grown in use over recent years, including such practical applications like Google's street-view. However, trying to model a large-scale environment like a city requires taking data from various locations around the environment, and this data must be aligned with respect to each other. In our method, we initially decide on a location to model, taking range and map data for it and classifying it into multiple regions. We then find the location and orientation on the map that allows the two results to match, giving the location and orientation of the captured range data.
著者
西尾 裕志 山内 航一郎 佐藤 幸男
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.26, pp.1-8, 2004-03-05

近年CGや服飾の分野など 実在する人物の3次元全身計測データが必要とされる場面が増加しており すでにいくつかの人体計測装置が開発・利用されている.しかし計測データそのままでは各種分野への応用は難しい.これは計測データが人体データとしてモデル化されていないことによる問題である.そこで本稿では人体の全身計測データに対し あらかじめ用意した人体パッチモデルをアクティブバルーンモデルの原理を用いてフィッティングすることを考える.本手法では一般的なCGソフトで作成された人体データを人体モデルとして使用することを前提としており 人体モデルの構造に依存しないモデル化を行うことが可能である.またフィッティングの際に問題となる姿勢合わせについては少数の特徴点を指定することで解決する.Recently, it has been increasing that a demand for a range data of human body in the fields of Computer Graphics or apparel, and some 3D human body measurement system have been used. However, it is difficult to apply these range data to various fields, because these data is not modeled as a human body model. In this paper, we propose a method for modeling a human body from a range data by the principle of Active Balloon Model. It is premised on using a human CG data created with a general CG software as the human body patch model. And we also solve the problem about normalization of human model posture by specifying a few feature points.
著者
稲場 典康 榎本 雅幸 小川原光一 出口 光一郎 富田 文明 角 保志 加藤晃市
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.102, pp.45-46, 2002-11-07

オーガナイズドセッション「新しいロボットビジョンの動向(1) ─ 作業のための視覚」では、ハンドアイロボットに代表される作業のための画像計測、認識に関する研究に焦点を絞り、ビジョンへの期待、批判、提案等を討論していただく場をご用意いたしました。パネラーとして、産学に関わらず広い分野から一線で活躍されている研究者の方々をお招きし「CVはロボットのセンサとして成果をあげているのか」、「作業のためのセンシングとはどうあるべきか」「CVの研究はどのような方向性を目指せばよいか」等々、活発に議論して頂き「作業のためのロボットビジョン」の今後について展望致します。We have organized a panel session titled "Can "Computer Vision" become a faculty of sight for a robot". In this special session, we focus on the vision research for task implementation and we will discuss about a variety of topics, e.g., "Does the CV research show landmark achievement in the robotics field? ", "What is the role of CV for task execution?", or "What will the aim of the CV in the future?" Through these discussions, we seek the future prospects of the computer vision research field.
著者
元川 洋一 斎藤 英雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.3, pp.9-14, 2008-01-17

ギターの演奏は複雑で不慣れな指使いが必要となるため,初心者にとって非常に難しい.本稿では,拡張現実感技術を用いることによってギター演奏を支援するシステムについて紹介し,システムを実現するための,ギターの構造を効率的に利用することによるギターの追跡手法を提案する.本手法はネック部に広範囲に存在する特徴を利用するため,オクルージョンに強く,高精度な位置合わせが可能である.また,マーカを利用しないため,前準備に手間がかからず,マーカが物理的に演奏の妨げになることもないといった利点がある.Playing the guitar is very difficult for beginners because the complex and unfamiliar hand positions is required. In this article, we introduce a support system for guitar playing using augmented reality, and we propose the method to realize the system by using the structure of the guitar effectively. The system can track the guitar movement even when a part of the guitar is occluded and the visual aid information can be projected at the proper position with high accuracy because our method tracks the feature existing wide range of the neck part of the guitar. Furthermore, we don't need to attach the visual marker on the guitar, so there are no obstacle to play the guitar and the preparation required beforehand is very easy.
著者
都築 勇司 藤吉 弘亘 金出 武雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.1, pp.101-108, 2007-01-12
被引用文献数
23

本稿では,特徴点追跡法について述べる.提案手法は,回転・スケール変化・照明変化による画像の変化に不変なSIFT(Scale Invariant Feature Transform)特徴量を用い,Mean-Shift探索により追跡を行う.評価実験により,回転やスケール変化を含む対象物体の移動に対しても追跡可能であることを確認した.また,追跡結果の表現法として,追跡点をセグメンテーションすることなく動線を表現する方法について述べる.点の移動方向と密度により表示する色を決めることで,移動の方向と頻度を表現する.本手法により,長時間に及ぶ人の追跡結果をビジュアライゼーションし,移動の流れが表現されていることを示す.This paper presents a method of point feature tracking using SIFT(Scale Invariant Feature Transform).Our approach uses the Mean-Shift searching to track a point based on the information obtained by SIFT. Since the SIFT feature is invariant to changes caused by the rotation, scaling, and illumination, we can obtain higher tracking performance than the conventional approach. Using the trajectory of the points obtained by the proposed method, it is possible to visualize the traffic line of pedestrians.
著者
福谷 俊行 安村 禎明 上原 邦昭
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.27, pp.549-556, 2008-03-11

稿では,機械学習を用いた新しい 3 次元形状復元の手法を提案する.従来の 3 次元形状復元手法では様々な拘束条件が必要であるが,本手法ではこのような条件を用いずに,1 枚の画像から物体表面の法線ベクトルを復元する.これを実現するために,物体の明度と法線の関係を機械学習を用いて獲得する.まず様々な環境下において 3 次元形状が既知である画像とその法線マップから,k x k の窓を使って窓内の明度・色相と窓の中心の法線を得る.これらの関係を機械学習により獲得し,その結果を用いて未知入力画像における法線を復元する.この復元によって得られた法線を,学習を用いて補正する手法も提案する.また,法線から得られた深さを基に,異常な法線を検出して修正する手法も提案する.顔画像を対象とした実験では,従来手法よりも提案手法の方が高速で精度の高い復元ができた.We propose a new method for 3D reconstruction by a machine learning approach. Existing methods for 3D reconstruction are restricted by various assumptions. However, the proposed method does not use any assumptions and reconstructs normal vectors of an object surface from a single image. To achieve this, we acquire a relationship between brightness and normal vectors of objects by machine learning. First, k x k brightness and hues are obtained from images whose 3D shape is known under various environment in a k x k pixel window and a normal vector is obtained from center of k x k pixel window from normal map. These relations are obtained using machine learning. Then normal vectors of an unknown input image are reconstructed by using these relations. We also propose a method for correcting the reconstructed normal vectors by machine learning and a method for correcting the abnormal normal vectors detected by using the depth map. Experiments using human face images show that the proposed method achieved faster and high-precision 3D reconstruction than existing methods.
著者
山口 修 福井 和広
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.50, pp.99-106, 2000-05-31
被引用文献数
1

ヒューマンインタフェースやセキュリティの分野で、顔画像を用いた個人識別技術が注目されている。本稿では、動画像を用いたPCベースの顔画像認識システム"Smartface"について紹介する。顔認識エンジンには、環境変動にロバストな顔部品検出法と顔向きや表情変化といった変動に強い識別アルゴリズムを用いている。"Smartface"のアプリケーション機能は、(1)個人認証によるスクリーンセーバ、(2)個人識別による環境設定、(3)リアルタイム変装シミュレーション機能からなる。本システムは、カメラ付きミニノート型パソコン上で動作し、特殊な画像処理ハードウェアを用いることなくソフトウェア単体で動作する。Recently, face recognition provides an important means for man-machine interface and security. This paper presents "Smartface", a PC based face recognition system using a temporal image sequence. The face recognition engine of the system employs a robust facial parts detection method and a pattern recognition algorithm which is stable against variations of facial expression and face direction. The functions of Smartface include (i) screen-lock, (ii) customization of PC environment, and (iii) real-time disguising as an application for entertainment. The system works on a portable PC with a CMOS/CCD camera, only with software without requiring a special image processing hardware.