著者
高木浩光
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2013, no.9, pp.1-1, 2013-03-07

監視カメラとプライバシーの問題は古くから議論の続いてきた課題であるが,昨今,情報処理技術と通信技術の高度化と低廉化により,単に映像を録画すするのではなく,様々な形で情報を加工,分析(例えば,被写体の人物の顔画像から性別や年齢を推定する等)し,通信回線を通じてデータを集約する形態のシステムが登場し,防犯や監視の目的以外の,商用目的等にも用いられ始めている.そこではカメラはもはや撮影をしているとは言えず,「性別センサー」あるいは「年齢センサー」として機能しているとも言え,その情報自体は個人情報保護法の個人情報に当たらないとの理由から,被写体となる人々に告知することなく公共の場所でカメラが見えない形で設置される例が現れ始めている.本講演では,こうした見えないカメラの設置をプライバシーの観点でどのように捉えるべきかについて再考すべく,カメラ以外の他の分野における従来のプライバシー上の問題点について整理し,比較することで,何が問題となり得るのか,その原理は何かを明らかにすることを試みる.また,諸外国の動向を交えながら,日本における法制度の現状と今後の可能性について考察し,関連技術の研究開発と普及に際して考慮すべきことを示したい.
著者
櫻井 快勢 河合 直樹 北岡 伸也 小林 秀章
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2015-CVIM-195, no.9, pp.1-6, 2015-01-15

本研究では,食品のおいしそうな印象を意味する 「シズル感」 に注目し,シズル感のある画像の生成法を模索する.まず,画像の印象は,画像中の色の分布に影響することが知られていることから,シズル感も色の分布に依存すると仮定する.シズル感の感度と色の分布を定量的に示す画像統計量を知覚実験にて評価する.結果,仮説は棄却され,感度は画像統計量には依存しないことが明らかになる.次に,光沢が感度に影響する可能性があるため,画像に光沢を付与し,評価する.光沢の付与は,画像に存在する鏡面反射成分を強調することで達成する.結果,光沢を付与できた画像で,シズル感の向上を確認する.全ての知覚実験は,被験者に強制選択法にて 「りんご」 と 「ご飯」,「ステーキ」 の 3 画像群に対して最もシズル感を知覚する画像を選択させる.
著者
阿部 尚之 島田 敬士 長原 一 谷口 倫一郎
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2011, no.30, pp.1-6, 2011-08-29

Web の集合知を活用し,未知の画像に対してその撮影内容に関するラベル付けを行う画像アノテーションという研究が盛んに行われている.従来の画像アノテーションは,収集した全ての訓練データセットから画像特徴とラベル特徴の関係を学習するものが多かった.しかし,それらのデータには入力である未知画像とまったく関係のない不要なデータも数多く含まれている.そこで本稿では,未知画像に付与されている位置情報と画像構図を利用して,そのような不要なデータを排除することで,画像アノテーションの精度を向上させる手法を提案する.実験では,提案手法と従来手法の比較実験を 100 シーンで行い,その得られた結果について報告をする.In recent years, many researchers use collective intelligence of the web to study an image annotation problem. The image annotation problem is to assign a proper label into an unknown image. In the training process, many conventional methods use relationship between image features and label features extracted from all collective training data set. However, the training data set includes much unrelated data to the unknown image. Therefore, we use the unknown image's geo information andcomp osition to eliminate unnecessary data. We report the result that we make a comparison between proposed methodan dt he conventional method.
著者
中澤 桂介 阿部 雅樹 渡辺 大地 三上 浩司
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2017-CVIM-209, no.13, pp.1-6, 2017-11-01

「カタンの開拓者たち」 (以下 「カタン」 ) はボードゲームの一種である.カタンは,プレイヤー同士の交渉による資源交換が重要な意味を持ち,この際の駆け引きが大きな魅力と言える.現状でカタンのコンピュータ上での実装はいくつかあるが,これらの AI では交渉についてあまり考慮されておらず,人間同士の対戦に比べて面白さが損なわれている.これは,AI 側がプレイヤーの状況についての認識把握が不十分であることと,それを活かした駆け引きが行われないことが一因である.本研究は,既存の AI の特性に対し,AI 側がプレイヤーの状況を分析した上で,真偽を交えた情報を伝える機能を持たせるという手法を提案する.これにより,プレイヤーの認識を AI に有利なように誘導した上で交渉を行う事で,AI が既存実装よりも人間同士の対戦に近い行動を取る事を実現した.
著者
間下 以大 新谷 晃一 清川 清 竹村 治雄
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2015-CVIM-197, no.4, pp.1-7, 2015-05-11

人の空間知覚において,左側を見る場合は左眼を,右側を見る場合は右眼を優位に用い,正面を見る場合は利き眼を優位に用いていることが確認されている.これらの違いを考慮することで人と空間のインタラクションをより深く理解し,身体動作を用いたユーザインタフェースをより使いやすくできる可能性がある.本稿では,ユーザインタフェースとして利用される代表的な身体動作として指差しに着目し,利き目,利き手の違いと指差し動作の精度について被験者実験を行い,その分析結果について報告する.具体的には,被験者の頭部を固定し,着座した状態で,格子状のターゲット群に対して利き手および非利き手で指差しを行わせ,眼と指先を結ぶ直線を用いて指差し位置推定を行った.その結果,指差し動作においては利き手よりも利き眼の違いが重要であることなどが統計的に確認された.
著者
楽詠灝 BreannanSmith ChristopherBatty ChangxiZheng EitanGrinspun
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2014, no.13, pp.1-6, 2014-11-13

本稿では,極小の泡から構成された密泡 (フォーム,foam) のためのシミュレーション手法を考慮する.提案法では,個々の泡 (バブル,bubble) を別々に扱わず,バブルの集合を連続体として扱い,物質点法 (material point method) を用いてハーシェル・バークレーモデルに基づく超弾性の構成方程式を離散化する.ハーシェル・バークレーモデルは非ニュートン性塑性流動を扱うモデルの一つであり,フォームの挙動をよく近似できることが知られている.提案法の評価として,様々なフォームについて提案法が適用できることを示し,また実世界のフォームの挙動との比較を行う.
著者
橋塚和典 神原誠之 萩田紀博
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2014, no.25, pp.1-6, 2014-01-16

拡張現実感 (AR) は,現実物体へ直観的な情報提示が可能であることから,作業習得のための教示への応用が期待されている.本研究では,単純な作業の繰り返しであるルービックキューブの解法の習得を目的とした AR を利用した教示システムを提案する.本稿では,作業中の手などの隠蔽に対して,ルービックキューブの形状と色情報を利用した物体の追跡による頑健なルービックキューブの位置姿勢の実時間推定手法,および,推定した結果を用いた,ユーザに解法を記憶し理解させること目的とした情報提示法を提案した.実験では,手による隠蔽が発生した画像での位置姿勢推定実験を行うと共に,実際にルービックキューブを解く教示実験を行い提案手法の有効性を示す.
著者
松本 大輝 松井 勇佑 山崎 俊彦 相澤 清晴 片桐 孝憲
出版者
一般社団法人情報処理学会
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2014, no.6, pp.1-6, 2014-08-25

イラストは身近な表現手段であり,近年では,pixiv といったイラスト投稿 SNS サイトで多くのイラストが共有・閲覧されている.しかし,イラストの検索方法や表示方法にはあまり注視されていないというのが現状である.そこで,本稿では,著者の画風の類似性に基づいてイラストを平面上にマッピングし可視化する手法を提案する.これにより,ユーザは好みのイラストに似た画風のイラストを一度に複数閲覧することができ,より効率よくイラストを閲覧することができる.Illustration is a common way of communication. A lot of illustrations are uploaded, shared and viewed on illustration-sharing SNSs such as pixiv. However, how to retrieve and display illustrations has received relatively sparse attention. We propose a method of visualizing illustrations based on drawing style similarity of authors. By using this method, users can see illustrations which have similar drawing styles to their favorite one at a time and enjoy seeing illustrations more efficiently and effectively in illustration-sharing SNSs.
著者
関晃仁
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2014-CVIM-190, no.40, pp.1-8, 2014-01-16

SLAM (Simultaneous Localization and Mapping) は,未知の環境の中でセンサの自己位置と,周囲の環境地図を構築していく技術である.本稿では,SLAM 技術を用いた移動カメラで撮影された画像からの周囲環境の 3 次元形状復元と,カメラの自己位置推定について,処理の流れに沿って基本的な理論と公開されているソースコードを結びつけて説明する.一度カメラの自己位置が推定できれば,より密度の高い詳細な 3 次元形状を復元できる.高密度な 3 次元形状復元を,画像間の対応づけを画像内でローカルに行う方法と画像全体を使う方法の 2 つに分けて説明する.また,実験に適したカメラとレンズの選定方法について説明する.本稿では,これから 3 次元形状復元やカメラの自己位置推定を実装する読者がどのような処理が必要なのかを理解し,より深く調べるためのポインタとなることを念頭に説明を進める.
著者
新妻 弘崇 プラサンナ・ランガラヤン 金谷 健一
出版者
情報処理学会
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.55, pp.1-8, 2010-01-14
参考文献数
20
被引用文献数
1

2 画像の対応点から射影変換を計算する高精度な解法を提案する.最尤推定に基づく方法は理論的には最適であるが,反復を要するため誤差が大きいと収束しないことがある.提案手法は代数的解法であるため反復なしに解が求まる.代数的解法には正規化の重み行列の自由度があることに着目し,これを 2 次の偏差項まで 0 になるように定める.シミュレーションにより,これが最尤推定に匹敵する精度があり,精度の理論限界 (KCR 下界) をほぼを達成すること,および計算を簡略化する 「Taubin 近似」 を行っても同程度の精度であることを示す.最後に実画像によるパノラマ画像の生成を行い,提案方法によって精度のよい合成ができることを示す.We present highly accurate least-squares (LS) alternatives to the theoretically optimal maximum likelihood (ML) estimator for homographies between two images. Unlike ML, our estimators are non-iterative and yield solutions even in the presence of large noise. By rigorous error analysis, we derive a "hyperaccurate" estimator which is unbiased up to second order noise terms. Then, we introduce a computational simplification, which we call "Taubin approximation", without incurring a loss in accuracy. We experimentally demonstrate that our estimators have accuracy surpassing the traditional LS estimator and comparable to the ML estimator.
著者
美濃導彦 坂井利之 金井武雄 美濃導彦
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2013, no.1, pp.1-8, 2013-03-07

様々な環境に設置された防犯カメラで観測された人物画像の特徴量は被写体の姿勢,照明などの撮影条件によって大きく変化する.そのため,人物照合には撮影条件によって(1)同一人物の人物画像の特徴量間の距離が大きい,(2)別人同士の人物画像の特徴量間の距離が小さい,という2つの問題がある.特定人物画像検索において,従来提案されてきた適合性フィードバックでは,問題(1)には対応できるが,問題(2)には対処できない.本稿で提案する条件分割型適合性フィードバックでは,各防犯カメラでの人物迫跡で得られる情報をもとに,撮影条件を分類してフィードバックすることで,各撮影条件の画像特徴量が混合されることを回避し,問題(1)(2)の両方に対処する.複数の防犯カメラ映像に対して人物画像を検索し,通常の適合性フィードバックと比較することで本手法の有効性を確認した.
著者
韓 先花 陳 延偉
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2015-CVIM-198, no.12, pp.1-6, 2015-09-07

近年,食事の乱れや健康意識の向上に伴い,食生活の管理が重要となっている.そこで,携帯電話のカメラ機能と用いて撮影された食事画像から自動で食事内容の認識を行なうことで,健康を容易に促進できるシステムの構築を目指している.高精度な食事画像を認識するために画像表現としてコードブークモデル及びその改善法を幅広く用いられ,ある程度の認識精度を得ることが検証された.しかし,実用食事ログを構築するため,更なる認識精度の向上を必要がある.それで,本研究では近年様々な分野で高い汎化性能を検証された Deep Convolutional Neural Network (DCNN) を用いた食事画像認識を行い,大幅な精度の向上を検証された.
著者
白井 良明
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2016-CVIM-200, no.16, pp.1-6, 2016-01-14

これは,CVIM 研究会の 200 回を記念した講演の概要である.まず,これまでの発展を概観し,現在の CV の傾向と問題点を述べる.とくに,最近盛んになっている学習による画像認識の限界を指摘する.人の能力に近付けるためには,まだやることがある.そこで,人の視覚能力実現のため,のアプローチとして,これまで筆者が試みてきた研究をいくつか簡単に紹介する.
著者
池松 大志 中江 俊博 長森 藤江 井前 麻理子 宮下 直也 木全 英明
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2016-CVIM-200, no.14, pp.1-6, 2016-01-14

機械学習を用いた画像認識では,高精度の判定を可能にするために,大量の画像データと正解ラベルからなる学習データセットを用意する必要がある.学習データセット構築作業の効率化を目的としてラベル付与の自動化やクラウドソーシングが実施されているが,属人的・専門的な判断を要する場合については,むしろエンドユーザ自身によってラベル付与を実施することが望ましいと考える.そこで,本研究ではエンドユーザ自身が画像収集からエンジン生成までを効率的に実施することが可能な学習器のインターフェースの開発を行い,エンジン生成に要する作業時間の短縮を図った.具体的には,Deep Learning フレームワークとして広く利用されている Caffe を用いた Deep Learning 学習 API(Application Programming Interface) の開発および画像検索 API とのマッシュアップによる画像収集・登録・学習インターフェースを開発した.
著者
鈴木 浩二 松川 徹 栗田 多喜夫
出版者
一般社団法人情報処理学会
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.29, pp.7-12, 2009-03-06
被引用文献数
2

局所特徴を SVM により背景領域からの特徴と対象領域からの特徴に分類し利用する手法 (初期特徴選択) を提案する.初期特徴選択の有効性を検証するために,UIUC Image Database を用いて SIFT 特徴を車領域からの SIFT 特徴と背景領域からの SIFT 特徴に分類する SVM を作成し,SIFT 特徴を用いた Bag-of-Features の特徴選択に適用する実験を行った.この実験の結果,Bag-of-Features において背景領域からの SIFT 特徴を SVM で選択的に取り除くことにより,クラスタ数が少ない場合において従来手法よりも識別率を向上させることできた.We propose a local feature selection method that classifies local features into background's features and target's features using SVM. We applied this feature selection method to "bag-of-features" method in generic object recognition problem. To verify the effectiveness of the proposed method, we conducted experiments using UIUC Image data base. Experimental results showed the proposed method outperformed the conventional Bag-of-Features representation with a fewer number of clusters.
著者
本田 卓士 松永 力 金谷 健一
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2012, no.18, pp.1-8, 2012-11-26

空間をわずかに移動する複数の点の移動前後の位置を 3 次元センサーで計測し,どのような並進,回転,スケール変化が生じているのか,あるいは生じていないのかを判断するモデル選択のために,誤差のある 3 次元データにさまざまな運動モデルを最適に当てはめる新しい方法を提案する.これは, 3 次元アフィン変換の部分群が変数にさまざまな内部拘束を指定して得られることに着目して,内部拘束をもつ 3 次元アフィン変換を拡張 FNS 法によって計算するものである.これにより,従来のように運動ごとに別々のパラメータを導入する必要がなく,すべての部分群が同一の方法で計算できる.この手法をステレオ視による 3 次元シミュレーションデータに対する幾何学的 AIC,幾何学的 BIC,幾何学的 MDL を用いたモデル選択に応用する.Given 3-D sensing data of points slightly moving in space, we consider the problem of discerning whether or not translation, rotation, and scale change take place and to what extent. For this purpose, we propose a new method for fitting various motion models to 3-D noisy data. Based on the observation that subgroups of the 3-D affine transformations are defined by imposing various internal constraints on the variables, our method fits 3-D affine transformations with internal constraints using the scheme of EFNS, which, unlike conventional methods, dispenses with particular parameterizations for particular motion models. We apply our method to simulated stereo vision data and show how model selection using the geometric AIC, the geometric BIC and the geometric MDL works.
著者
大石 圭 斎藤 英雄 梶田 大樹 高詰 佳史
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2019-CVIM-215, no.18, pp.1-6, 2019-01-10

手術のビデオ撮影による記録の有用性は以前から認識されてきた.すでに多くの手術室では固定式の術野カメラが設置されている.しかし,実際には外科医の頭部や体によって術野が隠れてしまいカメラによる手術の記録が困難である.我々はこの問題を解決するために,無影灯に複数のカメラを取り付け記録するシステムを提案した.また,術野を認識し自動的にカメラを切り替えることで,頭部の映り込みの少ない映像の生成を試みる.その際,一般的に頻繁なカメラの切り替えは,動画の視聴品質 (Quality of View,QoV) が低下する.そこで我々は,組み合わせ最適化の手法で,最短経路問題で広く用いられるダイクストラ法をこの問題に応用し,一定時間カメラの切り替えが行われず,動画全体で観測している術野領域が最大になるカメラスケジューリング手法を提案する.
著者
香川 椋平 和田 俊和
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2016-CVIM-203, no.24, pp.1-6, 2016-08-29

最近傍探索は,類似画像検索や,BoF 特徴ベクトルの生成,画像間の特徴の対応付けなど,多岐にわたって用いられている.手法としては Hash 型,木探索型,森探索,グラフ探索,など様々な手法があり,問題としては,1- 最近傍探索,k- 最近傍探索,Radius 探索,などがある.近年では格納データの分布の次元が上昇することによって探索速度が低下するという問題を回避するために,近似最近傍探索がよく使われている.これに対し,本稿では,クエリ側の分布を利用した検索の高速化問題を提案する.これを 「学習型最近傍探索問題」 と呼ぶことにする.この分布は逐次与えられるクエリ自身から学習することもできるため,近似最近傍探索と近似のない最近傍探索を並列動作させればオンライン学習もできる.本稿では,その一歩として,クエリに基づいて k-d tree を再構築し,木探索のみで最近傍探索を行う高速化手法を提案する.学習した k-d tree を用いた最近傍探索時間と精度の比較を行い,その活用法を論じる.
著者
廖 若辰 守脇 幸佑 槇原 靖 村松 大吾 武村 紀子 八木 康史
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2019-CVIM-218, no.17, pp.1-6, 2019-08-28

体組成は健康状況を把握するための重要な指標である.体脂肪率や体水分率,筋肉量などを把握することにより,肥満や生活習慣病の予防や改善が可能になり,現代社会における健康維持のためにその必要が増しつつある.市販の体組成計の多くは,生体電気インピーダンス分析法を用いるものが多く,正確な結果を出せる一方,設備が高価という問題点がある.また一人ずつしか計測できないため,多人数を効率よく計測するには不向きである.そこで,本研究では,多人数を効率よく計測するための,歩行映像解析による体組成推定を試みる.具体的には,歩行映像から抽出するシルエットに基づく特徴表現である歩容エネルギー画像 (Gait energy image, GEI) を入力,各体組成の値を出力とする畳み込みニューラルネットワーク (Convolutional neural network,CNN) を構成し,被験者の歩行映像から抽出した GEI と市販の体組成計で計測した体組成の値の組を学習データとして,ネットワークパラメタを学習する.ここで,体組成を計測できる被験者数には限りがあることから,CNN を適切に学習することが困難となる.そこで,まず,大規模歩行映像データベースから抽出した GEI を入力,同データベースから抽出可能な,体組成と関連性のありそうな歩容個性 (腕振りの大きさや歩幅) を出力とする CNN を事前学習する.次に,事前学習されたパラメタを持つ中間層までのネットワークに対して,いくかの層を追加した,即ち,構造的に成長させたネットワークの出力に体組成値を設定し,ネットワークのファインチューニングを行うことで,限られた体組成の学習データからでも効果的に学習可能なことを示す.実験では,体組成の学習データのみを用いた,サポートベクター回帰や CNN による推定手法と比較して,提案手法が高い精度を得られることを確認した.
著者
山﨑 賢人 柴田 史久 木村 朝子 田村 秀行
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2015, no.34, pp.1-6, 2015-01-15

我々の研究グループでは,商品物流における仕分け作業への複合現実感 (MR) 技術の応用に取り組んできた.本取組みが目指すのは,いきなり仕分け作業を支援する既存の商用システムを置き換えることではなく,MR 化によるシステム設計の自由度向上や作業者が関与する他のシステムへの発展的な展開であり,まずは第 1 ステップとして,作業者への情報提示デバイスとして光学シースルー型 HMD を使用した試作システムを開発した.試作システムを評価・分析する過程で様々な問題点が顕在化したが,とりわけ,システムが提示する CG の奥行き方向の距離感が掴みにくいため,作業者が目標の商品に隣接する商品を誤って把持するという事象が頻発した.そこで本稿では,この問題を解決するために,光学シースルー型 HMD に適した注釈情報提示法を検討した結果を述べるとともに,システムの改良点についても述べる.