著者
倉爪 亮
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.156, pp.133-145, 2006-11-09
参考文献数
36
被引用文献数
2

本稿では,Active Contour Model(動的輪郭モデル)の代表的な手法として,KassらのSnakesとOsher,SethianらのLevel Set Methodに焦点を当て,その理論と実装法を概説する.特にLevel Set Methodに対しては,その基本的な考え方から,Upwind Scheme,AOS,ADIなどを用いた実装法,局所成長速度場と拡張成長速度場,Gemetric Active ContourとGeodesic Active Contour等,LSMを利用したアプリケーションの構築に必要な知識と具体的な手法を解説する.また高速で安定なLevel Set Methodの実装法として,著者らの提案するFast Level Set Methodを紹介し,ビデオ画像上の移動物体のリアルタイム追跡,および3次元モデリングへの適用例を示す.
著者
石川 博
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.158, pp.193-204, 2007-03-19
参考文献数
58
被引用文献数
31

ビジョンや画像処理の多くの問題を,エネルギー最小化の問題と捉えることができる.そのエネルギー最小化の方法として,近年,グラフの最小切断(グラフカット)アルゴリズムが,ますます有用で人気のある手法となり,ビジョンや画像処理に盛んに応用されるようになってきた.本稿では,グラフカットの離散最適化への応用を概観し,主要な3つのアルゴリズムを詳述するとともに,具体的にステレオやセグメンテーション等,ビジョンやグラフィックスヘの応用を紹介する.
著者
村田 昇
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.153, pp.155-162, 2006-03-16
参考文献数
8
被引用文献数
2

スパースコーディングは生物の初期視覚の情報処理を数学的にモデル化したもので,与えられた画像を比較的少数の基底の線形和で表現するために,適切な基底系を統計的・情報論的な基準にもとづいて構成する手法である.本稿では個々の画像を分解したとき得られる係数を確率変数として捉え,その情報量をできるかぎり削減して効率の良い表現を求めるという観点から,スパースコーディングの基本的な考え方を解説する.
著者
恒川 里子
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.2001, no.36, pp.177-184, 2001-05-10

現在、画像検索に関する研究が盛んに行われているが望ましい成果が得られていないのが現状である。そこで、本研究では「計算機は人間の認識活動を代行するもの」という観点から、画像データ管理者を代行して、計算機が誰にでも理解されやすいキーワードを付加するシステムを作成した。対象となる画像はディジタル風景画像に限定した。その理由は、対象を狭めて実験をしやすくするため、また、風景画の検索はその利便性から特に価値があるからである。本研究では画像中の色と垂直線と領域に注目することで、画像の(1)色構成、(2)情景の時間帯と空模様、(3)緑植物の有無、(4)遠景か近景か、(5)人工物の頻度を特徴として抽出することができた。そして、その特徴をキーワードとして検索システムを作成した。
著者
Luiz Sampaio Yoshio Yamada Goshiro Yamamoto Takafumi Taketomi Christian Sandor Hirokazu Kato
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.2015, no.64, pp.1-4, 2015-01-15

We present a method for detecting on-screen markers to identify physical displays and to estimate camera poses against these displays. It is difficult for humans to perceive the variation of two alternating colors when these colors switch in a frequency higher than the flicker fusion threshold. On the other hand, the variation is detectable by of-the-shelf rolling shutter cameras which have certain frame rate setting. Leveraging on the difference between the human visual characteristics and the camera characteristics, imperceptible markers can be embedded onto a display screen. In this paper, we introduce our technique in mobile device based user interfaces for manipulating digital content on large distributed displays. Furthermore, we show that our prototype system enables an augmented reality application on a mobile device using the marker embedded displays. Lastly, we discuss potential scenarios and applications.
著者
Wu Haiyuan Chen Qian Wada Toshikazu
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.139, pp.9-16, 2003-07-03
被引用文献数
1

For the camera calibration, point correspondence data between 3D and 2D points widely spreading over the image plane is necessary to get a precise result. However, in the case of wide observing area, it is impractical to use a huge calibration object that covers the camera view. This paper presents a refined calibration method using circular patterns. We already proposed a circular pattern based camera calibration method using a four-wheel mobile robot. That is, by keeping low speed and constant steering angle, the robot can draw a big circular pattern on a plane. Our previous method, however, has a limitation that roll angle around the optical axis is assumed to be zero. This paper presents an improved version of the camera calibration method. Our method estimates the extrinsic parameters of fixed camera from a single circular trajectory when the focal length of the camera is known. In the case that the focal length is not given, two co-planar un-concentric circular trajectories are enough for calibrating the extrinsic parameters and the focal length. In both cases, the center and the radius of the circle(s), the speed of the robot are not required. The extensive experiments over simulated images as well as real images demonstrate the robustness and the accuracy of our method.
著者
新島 和孝 太田 直哉 金谷 健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.118, pp.1-8, 1999-09-19
参考文献数
12
被引用文献数
1

自動車の運転者の支援を目的として、死角となりやすい左右後方から近付いて来る車両を画像処理を用いて検出する。検出のために用いる基礎的情報は画像の動き(オプティカルフロー)であるが、一般に画像の動きを計算するためのに必要な演算量は多く、それを実行するためには高価な装置を必要とする。これに対し、ここでは昆虫が複眼のような単純なセンサによる情報と、簡単な神経系による処理で十分な情報を得ていることに注目し、荒い解像度の画像情報と簡単な処理により目的を達成することを試みる。実験には通常のカメラと計算機を使用しているが、将来的にはフォトダイオードアレーのような簡単な受光素子と電子回路で装置を実現することを想定している。
著者
帷子 京市郎 鈴木 智之 中村 克行 趙 卉菁 柴崎 亮介 仲川 ゆり
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.158, pp.229-236, 2007-03-19
参考文献数
13
被引用文献数
1

本論文では,面的に測距を行うレーザスキャナを用いた群集の追跡手法,及び駅での検証実験により求められた群衆流動の可視化の方法について述べる.提案手法は,複数のレーザスキャナを時間的・空間的に同期させ,計測された歩行者の足断面のレンジデータから複数の歩行者を追跡する.追跡アルゴリズムは,レーザポイントに対して単純な時空間的クラスタリングを行うことで,実時間の処理を可能にしている.さらに得られた多数の軌跡データに対して位置と方向を考慮した三次元的なカーネル密度推定を行うことで,群衆流動の方向や通行密度,サイズといった情報の可視化を行う.また,得られた軌跡に対してOD別通行量の精度を評価した.
著者
山本 真司 子安 大士 前川 仁
出版者
情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.172, pp.Y1-Y8, 2010-05-27
参考文献数
11

本研究では,ドラムの演奏動作を撮影した動画像からの動作抽出手法を提案する.ドラムの学習支援の研究として電子ドラムやモーションキャプチャを用いて演奏動作を解析する研究があるが,普段の練習や演奏とは異なる状況で演奏しなければならない制約がある.そこで,我々は演奏動作を動画像からマーカーレスで腕とスティックの動作を抽出し,動作点の動きから奏法を解析する手法を提案している.しかし,見掛けの変化が生じる正面からの撮影では追跡ができないことや,動作点を見失うとその後のフレームの追跡ができないといった動作抽出での問題がある.そこで本研究では,複数のオプティカルフローの情報を確率的に統合することで領域の移動を推定し,その位置関係から奏法の解析に必要な動作点の検出を行う.動作を点ではなく領域により追跡することで追跡のロバスト性が向上し,同時に見え方の変化への対応が可能となる.高速度カメラで撮影された動画像に対して提案手法を適用し,手法の有効性を確かめた.Motion capturing during actual drumming is important both to support of learning and to analyze the performance. Methods based on specialized equipments such as electronic drums or dedicated capturing system with markers may affect the motion to be performed. Therefore we present a marker-less method of motion extraction of drumming stick from video image. In the method, we first track regions of each body part and stick. To track regions robustly, we use a combination of M-estimation and Bayesian approach. Then feature points such as stick-tip and the grip of basic drumming scene are extracted by the boundary of the regions.
著者
櫻井 快勢 河合 直樹 北岡 伸也 小林 秀章
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.2015, no.9, pp.1-6, 2015-01-15

本研究では,食品のおいしそうな印象を意味する 「シズル感」 に注目し,シズル感のある画像の生成法を模索する.まず,画像の印象は,画像中の色の分布に影響することが知られていることから,シズル感も色の分布に依存すると仮定する.シズル感の感度と色の分布を定量的に示す画像統計量を知覚実験にて評価する.結果,仮説は棄却され,感度は画像統計量には依存しないことが明らかになる.次に,光沢が感度に影響する可能性があるため,画像に光沢を付与し,評価する.光沢の付与は,画像に存在する鏡面反射成分を強調することで達成する.結果,光沢を付与できた画像で,シズル感の向上を確認する.全ての知覚実験は,被験者に強制選択法にて 「りんご」 と 「ご飯」,「ステーキ」 の 3 画像群に対して最もシズル感を知覚する画像を選択させる.
著者
邵 桂鳳 姚 鳳会 山田 博章 加藤 清史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.125, pp.1-11, 2001-01-18

我々はコンピュータによるジグソーパズルを解くための一方法を提案する。この方法では、ジグソーピースの形状情報と画像情報の両方を用いる。まず、入力画像からジグソーピースを切り出して、各ピースのコーナーポイントを検出する。次に、ジグソーピースモデルに基づいてジグソーピースの分類と認識を行う。そして、ジグソーピースの形状マッチングと画像融合に基づいてジグソーピース間の接続関係を計算する。最後にジグソーピース間の接続関係を復元する。本論文は、第1部としてジグソーピースの切り出し、ジグソーピースモデルの作成、コーナーポイントの検出、そしてジグソーピースの分類と認識について述べる。
著者
間下 以大 新谷 晃一 清川 清 竹村 治雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.2015, no.4, pp.1-7, 2015-05-11

人の空間知覚において,左側を見る場合は左眼を,右側を見る場合は右眼を優位に用い,正面を見る場合は利き眼を優位に用いていることが確認されている.これらの違いを考慮することで人と空間のインタラクションをより深く理解し,身体動作を用いたユーザインタフェースをより使いやすくできる可能性がある.本稿では,ユーザインタフェースとして利用される代表的な身体動作として指差しに着目し,利き目,利き手の違いと指差し動作の精度について被験者実験を行い,その分析結果について報告する.具体的には,被験者の頭部を固定し,着座した状態で,格子状のターゲット群に対して利き手および非利き手で指差しを行わせ,眼と指先を結ぶ直線を用いて指差し位置推定を行った.その結果,指差し動作においては利き手よりも利き眼の違いが重要であることなどが統計的に確認された.
著者
新井 大地 鳥居 秋彦 奥富 正敏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.2015, no.8, pp.1-5, 2015-05-11

本研究では,SfM (Structure from Motion) を用いた建物の 3 次元復元結果と地図データの位置合わせを行う手法を提案する.はじめに,3 次元復元結果を重力方向へ投影し,点群の位置と,カメラと点群を結ぶ視線情報を用いて建物の境界らしさを表す画像を作成する.次に,地図データから建物の境界を表す画像を生成する.そして,建物の境界を表す 2 つの画像から目的関数を定義し,勾配法を用いて最適化することにより位置合わせを行う.実際に SfM から得られる 3 次元復元結果を用い,建物の初期位置を与えることで,十分な精度で位置推定が可能であることを示す.
著者
浅野 哲 牧 淳人 松山 隆司
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.149, pp.151-158, 2005-05-12
参考文献数
8

なぜ人は他人と目が合うとき強烈なインパクトをもって, そしてかくも鋭く気づくのか?従来, 視線推定に関する研究は数多く行われてきたが, カメラを見ているか否かを精度良く検出することに特化した研究はあまり見受けられない.本稿では人のアイコンタクトを参考に, カメラを用いて人のカメラへの注視状態を検出する手法を検討する.まず, 人がカメラを見ている状態を知る上で視覚的な手がかりとなり得る虹彩位置の検出及び顔向きの推定を行い, その上で両者の関係を解析する.特に, 人がある点を注視している状態において, 虹彩、眼球、頭部の回転角の間の幾何的関係を基に, 上記の両者の間の線形性を示す.これに基づきカメラ注視の判別を行う手法を提案する.
著者
越澤 勇太 日浦 慎作 佐藤 宏介
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] (ISSN:09196072)
巻号頁・発行日
vol.149, pp.171-178, 2005-05-12
参考文献数
8
被引用文献数
1

今後, 家電機器はより一層高機能化し, それに伴って操作は複雑化していくものと考えられる.そのような複雑な操作に柔軟に対応でき, またリモコンのように機器を手に取る必要のない操作インタフェースとして, ジェスチャを用いたインタフェースが考えられる.ジェスチャ操作用のインタフェースにおいても, GUIのようにウィジェットと呼ばれる基本操作に対応した部品を提供し, その組み合わせでインタフェースを構築することで様々な機器の操作方法を統一し学習を容易にすること, また操作法をユーザヘアフォードすることができると考えられる.そこで本研究では, 特に音量などの連続量の操作に注目し, ジェスチャ操作に適した量操作ウィジェットを設計, 評価した.その結果, 従来のGUIに見られる量操作ウィジェットを用いた場合と比較して, 提案するウィジェットの方が高速かつ正確な操作が行えることがわかった.