著者
早坂昭裕 今岡仁
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.631-638, 2011-07-20

本論文では,姿勢変動にロバストな顔照合を実現するため,入力された顔画像を複数の異なる姿勢の顔画像へ正規化し,それら正規化顔画像から抽出した特徴量ベクトルを連結した連結特徴量ベクトルを用いる顔照合アルゴリズムを提案する.入力された顔画像を正面から撮影した顔と左右斜め上から撮影した顔の3種類の姿勢の顔画像へと変換し,それら3姿勢の顔画像から抽出した特徴量ベクトルを連結した連結特徴量ベクトルを用いて,特徴量の変換行列を学習する.3姿勢の顔画像から抽出した特徴量をひとつの高次元な特徴空間で学習することで,別々の特徴空間で学習した場合よりも最適な特徴量変換行列を構築する.3姿勢の特徴量ベクトルを別々に特徴量変換して照合スコアを統合する手法と比較し,多くの姿勢について照合精度が向上することから,提案手法の有効性を示す.
著者
山添隆文 栄藤稔 吉村健 辻野孝輔
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.409-415, 2011-07-20

本稿では,重みつき有限状態トランスデューサ(WFST)を用い,ノイズ領域が文字列として誤検出されることが課題となる情景画像からの日本語語彙検出手法を提案する.提案手法では,情景画像から網羅的な文字候補を抽出し,それらすべての組み合わせを表現したWFST と,大規模な語彙データセットから辞書を構成するWFSTとを合成することより,最終的な語彙検出結果を得る.これにより,辞書に含まれない文字候補の組み合わせとなるノイズ領域を除去することが可能となる.また,情景画像からの文字候補の抽出において,画像における位置情報を保持したままWFST を生成するため,同一の画像領域から最適な語彙を検出することができる.日本語を含む情景画像のデータセットにより検証を行い,ノイズ領域を除去しつつ日本語の語彙を検出できることを確認した.
著者
健山智子 小原伸哉 田中泰史 桶川萌 古川顕 金崎周造 若宮誠 韓先花 陳延偉
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.255-262, 2011-07-20

統計形状モデルは医用画像データから統計解析に基づいて人体臓器の個体間における大きさ,形状のバリエーションを記述したものであり, 計算解剖学や術前計画など多くの医療分野において幅広く利用されている.一方,統計形状モデルを構築する場合,各症例間における表面点の対応付けを行うためには複雑でかつ膨大な計算を要するだけでなく,統計形状モデル構築の際に用いられる学習用症例数が限られているため,症例数に対し形状特徴ベクトルは膨大な次元を要してしまう.そのため,少数症例からでも汎化能力の高いモデルを構築するためには臓器の形状情報を効率的に取り扱う必要がある.本研究では新たな統計形状モデル作成法として, 人体臓器の3次元形状を球座標により形状間における表面点対応を回転のみで行い,得られた形状表現を球面調和関数に展開することで形状情報ベクトルの次元を抑えることが可能な統計形状モデルの構築法を提案する. 提案法は球面調和関数に展開された係数により3次元形状情報を効率的に扱えることから,サンプル数に依存することなく高い汎化能力を持つ統計形状モデルの構築が行われ,そのモデルは未知のデータに対しても高い再現率で再構成が行えることを示す.
著者
武田祐一 日浦慎作 佐藤宏介
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.1026-1033, 2011-07-20

レンズの開口形状を符号化することで,逆演算によるぼけ除去を安定化する方法が提案されている.しか し,ぼけの点拡がり関数 (PSF) は物体までの奥行きにより変化するため,ぼけ除去を適切に行うためには被写体まで の奥行きを求める必要がある.そこで本研究では,ステレオカメラのレンズ開口部を符号化し,得られた画像から被 写界深度を拡張する手法を提案する.本研究ではぼけ除去に適した開口形状が奥行き推定の安定性向上にも有効であ ることを示す.また,これにより得た奥行きマップから PSF を求めることで,撮影画像からぼけを取り除いた被写界 深度拡張画像を求めることが出来ること,さらにこの被写界深度拡張画像と奥行きマップから,任意に設定した合焦 距離の前後をぼかした画像を生成するリフォーカシングが可能であることを示す.
著者
松本鮎美 ウ小軍 松浦宣彦
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.683-690, 2011-07-20

動的システムをモデル化する際には,一つのシステムに対して一つのモデルを用いるのが一般的である.しかし,このような事前モデルを用いて観測データからシステムの状態推定を行う場合,観測条件の変動などにより推定誤差が大きくなる傾向にある.これは,観測データの欠落や変動のためである.本研究では,観測データの変動によって起こる推定誤差の低減を目指し,事前モデルを構築する際に,学習データから部分的なデータを取り出し,全体データと部分データのそれぞれに対してモデル化を行う.さらにそれらの複数のモデルに対して関連付けを行うことで,一つの動的システムに対して階層的なモデル構築を行う方法を提案する.本論文では,この階層的モデルを人物の3次元動作推定に適用し,観測データの欠落や観測条件の変動にも安定して3次元動作推定が可能であることを確認した.
著者
笹尾朋貴 日浦慎作 佐藤宏介
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.899-906, 2011-07-20

本研究では,撮像素子の各画素形状をコード化することで超解像を高性能化する手法を提案する.従来の研究では撮像素子の各画素が矩形であることを前提としている.そのため,各画素のサンプリングは点サンプリングではなく正方形の畳み込みによって原画像の高周波成分が失われることになる. そこで本研究では,撮像素子の上に細かい黒色粉末を振りかけることで各画素の受光分布のランダムなコード化を行い,正方形の畳み込みによる原画像の高周波成分の損失を低減する手法を提案する.黒色粉末を振りかけた場合,どのようなコードになっているか未知となるため,その推定方法を示し,実験によりコードの推定を確かめた.更に,推定したコードを用いて作成した超解像画像を評価する.
著者
森慧 西沢和夫 高野博史 中村清実
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.599-604, 2011-07-20

接触型の指紋認証には,指表面の状態等により認証精度が低下するという問題があるため,非接触型指紋認証の開発が行われている.しかしながら,非接触型指紋認証では,指紋画像の隆線と谷線間のコントラストが小さく特徴量が抽出しにくい問題や,入力された指紋画像に指の位置ずれ,傾き,回転が生じることで認識率が低下する問題がある.本研究では,LOG フィルタを用いて指紋画像のコントラストの問題に対応する,局所特徴量を用いた非接触型指紋認証法を提案する.本手法では,局所特徴量として,Histograms of Oriented Gradients(HOG)特徴量および局所輝度特徴量を用いる.また,指の回転が与える影響について調査を行い,指の回転変化への許容性を明らかにした.
著者
田中士郎 田中弘美
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.1521-1526, 2011-07-20

実世界に忠実かつ物体操作が可能な仮想空間を実現するためには,物体の形状等の視覚情報だけでなく, 重量,摩擦,弾性等の触覚情報が必要である.我々は, 摩擦の研究分野において提案されている摩擦モデルに基づいて, 摩擦現象を仮想空間で再現する研究を進めている. 実世界に存在する物体の摩擦特性を推定するには, 外力を与えられた物体の変位を取得する必要があるが, 特に予すべりはその変位が数マイクロと微小であるため, 観測は非常に困難である. そこで本論文では, 安定姿勢に置かれている物体に対して, 外力を与えた際の物体の変位を高精度に求める手法を提案する. まず, 物体に外力を与える手段としてロボットマニピュレータを使用し, 物体が滑り出す過程を1秒間に500フレームの撮影が可能な高速度カメラで観測し画像を取得する. 次に1フレーム目の画像において基準領域を指定し, 他のフレーム画像の各ピクセルを中心とした領域との相関値を求める. 本論文で提案する相関値のモデル式を用いて, 相関値分布とのフィッティングを行い, 相関値の最も高い物体座標を推定する. 各フレーム画像のフィッティングにおける評価値および真値からの誤差標準偏差から, 物体変位の信頼性が高いことを確認した.
著者
井上学 和田俊和
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.1279-1285, 2011-07-20

位相シフト法は,比較的少数の画像の解析のみで高精度な形状計測を行うことが可能である.しかしながら,投影した格子パターンの位相が何番目の周期に含まれるかを求めないと物体全体の三次元形状の計測を行えない問題がある.本論文では,この問題を離散最適化問題として定式化し,Belief Propagation(信念伝搬)法を用いて解くことにより,位相接続を行う方法を提案する.本手法では,計測物体の絶対的な奥行きではなく,各点の周期を決定することで滑らかな三次元形状を計測することを目的にしている.
著者
清田祥太 川崎洋 古川亮 佐川立昌
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.488-495, 2011-07-20

アクティブステレオによる形状計測における問題点として,一視点から観測可能な形状しか計測できないことや静的なシーンしか計測できないことが挙げられる.本論文では,多視点のプロジェクタ・カメラシステムを利用して,動的シーンの形状を全周囲から計測する手法を提案する.高いフレームレートで形状を計測するためには,プロジェクタから照射するパターンを切替えずに静的なパターンを投影することが望ましい.しかし,従来の静的パターンによるアクティブステレオは,複雑なパターンを利用することが多く,パターンの重なりによる相互干渉の問題から,全周囲計測に適用することは難しかった.本研究では,単純な平行線によるパターンを利用し,むしろ干渉から得られる情報を利用して形状を復元する.具体的には,各プロジェクタは一方向の少数(1または2個)の色を持つ平行線のみを投影し,その直線同士の交点から連立線形方程式を多数構成して解く.我々は,6台のカメラと6台のプロジェクタから成るシステムを実際に構築し,運動する人物の密な3次元形状復元に成功した.
著者
安倍満 吉田悠一
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.1682-1689, 2011-07-20

本論文では,高速に計算可能であり,128ビット程度のバイナリコードで表現可能な局所特徴量Compact And Real-time Descriptors(CARD)を提案する.CARDはSIFTやGLOHと同様に,勾配ヒストグラム特徴量の一種である.提案手法は,(1) ルックアップテーブルによる高速な局所特徴量抽出,(2) Supervised Sparse Hashing(SSH)による高速なバイナリコード化の2段階から成る.本手法では,2種類のルックアップテーブルを用いることで,1つのキーポイントあたりSIFTの約16倍の速度で局所特徴量を計算可能とした.また,抽出された特徴量をハッシュ関数によりバイナリコードに変換することで,メモリ消費量を低減した.ここで用いるハッシュ関数は疎行列の掛け算により構成されているため,高速にバイナリコードへ変換が可能である.実験により,CARDは実行速度,メモリ消費量の二つの点において,既存の手法よりも優れていることを示した.
著者
中澤篤志 ニチュケクリスチャン ラドコフアレクサンダー 竹村治雄
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.41-48, 2011-07-20

注視点推定技術は心理学やライフサイエンス,マーケティングやユーザインタフェースの分野で広く使用されている.従来の注視点推定システムは,ユーザの装着装着が必要だったり,システムの使用前に校正(キャリブレーション)を行う必要があり使用が煩雑であるという問題点がある.またこの校正は,ユーザの前面に仮想的な平面を想定し,眼球の角度と平面上の位置を対応づけるという原理に基づいており,ユーザが校正時と異なる環境に移動したり複雑な奥行きを持つ環境では大きな誤差が生じる.本論文ではこれらの問題を解決するため,眼球表面上で反射する環境光の反射像を用いた新しい注視点検出手法を提案する.本手法は眼球に入射する環境の反射光から直接注視点を推定するため,従来法の問題点を解決することができる.まず我々は眼球の幾何モデルに基づき,注視点からの光が眼球表面反射画像中で反射する位置(Gaze Reflection Point(GRP))を求める手法を開発した.これにより,眼球表面反射画像中のGRPでの画像特徴と環境画像の特徴を比較することで注視点を推定することが可能だが,実際の眼球表面反射画像は輝度・解像度ともに低く,品質の良い画像が得にくいため直接的な比較は困難である.これを解決するため,環境に高速度のパターン光を投影することで,眼球表面反射画像と環境中の点を高速かつ頑健に対応付ける手法を開発した.我々は高輝度LEDを格子状に配置しパターン光を高速にコントロールする高速度パターン光プロジェクタを開発し,高速かつ頑健な注視点検出を実現した.複数の被験者による注視点推定結果により,事前の校正や装置装着を必要とせず,従来法と同程度の精度で注視点を推定できることを確認した.
著者
寺門和哉 RaytchevBisser 玉木徹 金田和文
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.753-756, 2011-07-20

本論文では新しいアピアランスベースの姿勢推定手法であるLocal Procrustes Regression (LPR)を提案する.LPRでは,全ての学習サンプルとその姿勢パラメータ空間とのマップを学習するのではなく,テストサンプル近傍の学習サンプル同士の距離関係を学習に利用し,テストサンプルの姿勢パラメータを推定する.このとき Procrustes Analysis を用いてテストサンプル近傍の学習サンプルの低次元空間と,それに対応する姿勢パラメータ空間との位置合わせを行う.物体ごとに2つの回転軸において5度ずつサンプリングされた703枚の画像データセット Object Pose Estimation Database (OPED) を用いて実験を行った結果,提案手法の姿勢推定精度は半数以上の物体でSupport Vector Regressionより優れていることが示された.
著者
上柿普史 中島悠太 馬場口登
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.1645-1652, 2011-07-20

映像の要約や編集などのアプリケーションでは,重要な領域を推定し,その領域に基づいて映像を処理することから,重要な領域の推定手法が必要とされている.一方,YouTube などにはモバイルカメラで撮影された映像が多く投稿されており,これらの映像には「自分の子供を撮影したい」などの撮影意図が存在する.このとき「子供の領域」のような撮影者が意図的に撮影した領域(意図領域)は撮影意図に不可欠である.本稿では,意図領域を重要な領域として推定する手法について述べる.提案手法では,撮影者はフレーム中で意図領域を適切に配置するようにカメラを動かすことから,撮影者の行動が反映されるカメラの動きと映像特徴のモデルを構築し,このモデルに基づいて意図領域を推定する.さらに,実験により提案手法の有効性を示す.
著者
小野智司 前田浩志 中山茂
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.1705-1706, 2011-07-20

ユーザとシステムとが協調して最適化を行う協調型進化計算を用いて,画像処理フィルタを設計する方式を提案する.本方式を利用することで,探索の序盤に専門家によるフィルタ構造の設計を行い,探索の中盤以降にシステムが詳細な構造や閾値の調整を行うような探索が可能となる.逆に,探索の序盤から中盤にかけてシステムがフィルタを自動的に設計することで,利用者の発想を支援し,探索の終盤に利用者がフィルタ構造を手動で調整することも可能となる.
著者
嶋田恭兵 東海彰吾 長谷博行
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.1715-1716, 2011-07-20

近年,様々な機能を有した携帯端末,スマートフォンが使用されるようになってきた.本システムでは複数のAndroid携帯端末を用いて時間と空間を共有した場の撮影を行うことで,様々な視点の映像を手軽に収集することが可能となる.構成は,1台のマスター端末からの開始・停止といった信号を複数のスレーブ端末に送信することにより同時刻での撮影を行い,命令やデータ保存はサーバで処理する.また,各端末の時計をNTPにより撮影前に合わせており,撮影映像利用の際にはフレーム同期の手間を軽減することできる.端末内には磁気・加速度センサが搭載されており,各端末の姿勢情報を得ることができる.将来的にこれら多視点の映像情報とセンサ情報を利用した映像統合処理を目指している.
著者
松崎隆 鈴木俊光 高橋和晃 矢口勇一 岡隆一
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.1717-1718, 2011-07-20

本論文では自由視点テレビのOcclusion問題を解決するための手法を提案する. 以前に高橋らが提案した自由視点テレビは3 台の未校正カメラによって撮影された時系列画像に対して, 各フレーム毎に2 次元連続DP(2DCDP) を用いたピクセル毎の物体の運動計測を行い, 因子分解法により被写体の3 次元モデルを復元するというものであるが, 3次元モデル復元の一般的な課題であるOcclusion問題が解決されていない. 本論文ではこのシステムのカメラ台数を6台にし, 2つの3Dモデルを復元し, それを合成することでのOcclusion問題の改善手法を提案する.