著者
西山 昴志 當間 愛晃 赤嶺 有平 山田 孝治 遠藤 聡
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2020-CVIM-220, no.4, pp.1-3, 2020-01-16

日本においてアニメの歴史は長くそれに伴い様々な変化を経ている.例えば 1980 年代はセルアニメーションの作品が多かったが,現在ではコンピュータの発展に伴い,ほとんどがコンピュータアニメーションとなっている.製作方法の変化や技術の発展に伴い,アニメ作品の画風 (絵タッチ,背景,色合い等) も同様に変化していると考えられる.画風を変換する研究分野においては,芸術絵画や写真の画風を別の画風に変換する方法が提案されている.そこで,対象画像をアニメの静止画像とし,セルアニメーションが主流であった年代のアニメ画像を,現代のデジタル作画のアニメの画風に変換するタスクを考えた.本研究では,Image-to-image の手法の 1 つである CycleGAN をベースにアニメ画像の画風変換結果を報告する.
著者
中澤 桂介 阿部 雅樹 渡辺 大地 三上 浩司
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2017-CVIM-209, no.13, pp.1-6, 2017-11-01

「カタンの開拓者たち」 (以下 「カタン」 ) はボードゲームの一種である.カタンは,プレイヤー同士の交渉による資源交換が重要な意味を持ち,この際の駆け引きが大きな魅力と言える.現状でカタンのコンピュータ上での実装はいくつかあるが,これらの AI では交渉についてあまり考慮されておらず,人間同士の対戦に比べて面白さが損なわれている.これは,AI 側がプレイヤーの状況についての認識把握が不十分であることと,それを活かした駆け引きが行われないことが一因である.本研究は,既存の AI の特性に対し,AI 側がプレイヤーの状況を分析した上で,真偽を交えた情報を伝える機能を持たせるという手法を提案する.これにより,プレイヤーの認識を AI に有利なように誘導した上で交渉を行う事で,AI が既存実装よりも人間同士の対戦に近い行動を取る事を実現した.
著者
浦西 友樹 五十川 麻理子 井下 智加 牛久 祥孝 大倉 史生 川西 康友 上瀧 剛
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2018-CVIM-212, no.40, pp.1-7, 2018-05-03

本発表では,第 20 回画像の認識・理解シンポジウム (MIRU 2017) で行われた若手プログラムについて報告する.MIRU 2017 若手プログラムにおいては,プログラム応募者である若手研究者 46 名が 9 つの班に分かれ,班ごとに研究テーマについて議論し,研究を立ち上げた.MIRU 2017 大会期間中には研究テーマについてプレゼンテーションし,予選を通過した 4 つのグループが MIRU 2017 本大会で開催されたイベント中で研究計画を発表した.いくつかの班は MIRU 2017 終了後においても研究を継続し,研究成果が国際会議に採択されるなどの成果を挙げている.本稿では,若手プログラムの準備や大会期間中のイベントについて,実行委員会の視点から述べる.
著者
間下 以大 新谷 晃一 清川 清 竹村 治雄
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2015-CVIM-197, no.4, pp.1-7, 2015-05-11

人の空間知覚において,左側を見る場合は左眼を,右側を見る場合は右眼を優位に用い,正面を見る場合は利き眼を優位に用いていることが確認されている.これらの違いを考慮することで人と空間のインタラクションをより深く理解し,身体動作を用いたユーザインタフェースをより使いやすくできる可能性がある.本稿では,ユーザインタフェースとして利用される代表的な身体動作として指差しに着目し,利き目,利き手の違いと指差し動作の精度について被験者実験を行い,その分析結果について報告する.具体的には,被験者の頭部を固定し,着座した状態で,格子状のターゲット群に対して利き手および非利き手で指差しを行わせ,眼と指先を結ぶ直線を用いて指差し位置推定を行った.その結果,指差し動作においては利き手よりも利き眼の違いが重要であることなどが統計的に確認された.
著者
韓 先花 陳 延偉
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2015-CVIM-198, no.12, pp.1-6, 2015-09-07

近年,食事の乱れや健康意識の向上に伴い,食生活の管理が重要となっている.そこで,携帯電話のカメラ機能と用いて撮影された食事画像から自動で食事内容の認識を行なうことで,健康を容易に促進できるシステムの構築を目指している.高精度な食事画像を認識するために画像表現としてコードブークモデル及びその改善法を幅広く用いられ,ある程度の認識精度を得ることが検証された.しかし,実用食事ログを構築するため,更なる認識精度の向上を必要がある.それで,本研究では近年様々な分野で高い汎化性能を検証された Deep Convolutional Neural Network (DCNN) を用いた食事画像認識を行い,大幅な精度の向上を検証された.
著者
白井 良明
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2016-CVIM-200, no.16, pp.1-6, 2016-01-14

これは,CVIM 研究会の 200 回を記念した講演の概要である.まず,これまでの発展を概観し,現在の CV の傾向と問題点を述べる.とくに,最近盛んになっている学習による画像認識の限界を指摘する.人の能力に近付けるためには,まだやることがある.そこで,人の視覚能力実現のため,のアプローチとして,これまで筆者が試みてきた研究をいくつか簡単に紹介する.
著者
池松 大志 中江 俊博 長森 藤江 井前 麻理子 宮下 直也 木全 英明
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2016-CVIM-200, no.14, pp.1-6, 2016-01-14

機械学習を用いた画像認識では,高精度の判定を可能にするために,大量の画像データと正解ラベルからなる学習データセットを用意する必要がある.学習データセット構築作業の効率化を目的としてラベル付与の自動化やクラウドソーシングが実施されているが,属人的・専門的な判断を要する場合については,むしろエンドユーザ自身によってラベル付与を実施することが望ましいと考える.そこで,本研究ではエンドユーザ自身が画像収集からエンジン生成までを効率的に実施することが可能な学習器のインターフェースの開発を行い,エンジン生成に要する作業時間の短縮を図った.具体的には,Deep Learning フレームワークとして広く利用されている Caffe を用いた Deep Learning 学習 API(Application Programming Interface) の開発および画像検索 API とのマッシュアップによる画像収集・登録・学習インターフェースを開発した.
著者
吹上 大樹 河邉 隆寛 西田 眞也
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2017-CVIM-206, no.8, pp.1-6, 2017-03-02

プロジェクションマッピングは実物体の見た目を編集する光投影技術として注目されており,これまで対象のテクスチャや色味,ダイナミックレンジ,質感などの編集に利用されてきた.こうしたプロジェクションマッピングの新たな応用例として,著者らは対象に動きの情報を付加する手法 (変幻灯) を提案した.変幻灯では,輝度信号の視覚運動パターンのみを投影するため,投影対象物が本来もつ見た目やテクスチャの質感には一切影響せずに,非常に現実感の高い動き印象を知覚させることが可能となる.本研究報告では,変幻灯の基本的な仕組みを解説すると共に,変幻灯の応用例として,インタラクティブに実物体に見かけの動きを付与し,編集することができるアプリケーションを紹介する.
著者
岩口 尭史 久保 尋之 川崎 洋
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2022-CVIM-229, no.19, pp.1-4, 2022-03-03

本発表ではすりガラスなどの拡散体の背後にある鏡面反射物体形状の再構成に取り組む.拡散体背後の物体は環境光の下ではボケて観測されるため形状の復元は困難だが,拡散体上の微小領域に光源を照射すると,拡散板の表面には反射による集光模様であるコースティックスが現れる.本論文では,光学現象を考慮した微分可能レンダリングによりコースティクスを解析し拡散板の背後にある物体の表面法線を復元する方法を提案する.提案するレンダリング手法はメッシュ表現を利用するため,レンダリング画像だけでなく,幾何学的なパラメータを対象に最適化を行うことができる.実験では,反射光分布から形状を復元し,反射光の位置から幾何学的パラメータを最適化することが可能であることを示す.さらに,正確なコースティクスの再現が要求される Goal-based caustics へ応用しレンダリング能力を示す.
著者
植田 泰士 片平 真史 鈴木 新一
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2016-CVIM-202, no.4, pp.1-6, 2016-05-05

人工衛星や探査機などの宇宙機システムは多くが非修理系であることから一発勝負の中での高い信頼性確保が必要となる.その信頼性を確保するための方策の一つとして,クリティカルな異常が発生した場合には自律的に故障を検知し,故障を分離し,正常状態へ回復させる耐故障設計が多くの宇宙機システムには導入されている.これまでそのような宇宙機システムの機能の実現,あるいは宇宙機システムの開発プロセスにおいて,コンピュータビジョン技術が直接的に活用される局面は少ないが,本稿では,コンピュータビジョン研究者による今後の宇宙機システムへのコンピュータビジョン技術応用検討の一助となることを期待し,陸域観測技術衛星 2 号 (ALOS-2) を主な題材として耐故障設計の考え方などを紹介する.
著者
下山 拓流 菅野 裕介
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2022-CVIM-229, no.2, pp.1-6, 2022-03-03

視線推定はアノテーションコストの高いタスクであリ,応用時と全く同じ撮影環境・方法のもとでデータを集めることは容易ではない.そのため応用時にはドメインギャップが課題となる.従来の教師無しドメイン適応手 法では主にアピアランスの異なるドメイン間での適応を行なっているが,視線推定においてはアピアランスの違いだ けでなく,頭部姿勢分布や視線方向分布の違いもドメインギャップの要因になる.そこで本研究では特徴分離と擬似 ラベルを組み合わせた手法を提案し,頭部姿勢分布や視線方向分布の異なるドメインに対する教師無し適応を行う.そして提案手法が未知の頭部姿勢を含むドメインへの適応に有効であることを実験を通して示す.
著者
史 宇華 松村 耕平 Roberto Lopez-Gulliver 野間 春生
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2017-CVIM-205, no.16, pp.1-6, 2017-01-12

本論文では,マイクロソフト社の Kinect の深度画像から得られるユーザーのスケルトン情報に対して,Random Forest 分類器と AdaBoost を使用してユーザの姿勢をリアルタイムで自動認識するシステムを開発した.ここでは特に食事中の姿勢を対象とし,Kinect で深度データが含まれる悪い姿勢の学習データを録画する.これらの学習データから,ユーザーの Joint の特徴量を抽出し,悪い食事姿勢のデータベースを構築して学習し,五つの悪い姿勢を動画から自動認識できるシステムを開発した.悪い姿勢を食事中の映像から学習し,50 名の被験者に対して行った食事の映像から 93% の認識機能を実現した.本システムを応用し,将来はユーザーの悪い食事姿勢を検出した後,ユーザーにフィードバックを与え,食育トレーニングすることを目指している.
著者
中川 陽介 内山 英昭 長原 一 谷口 倫一郎
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2015-CVIM-197, no.20, pp.1-6, 2015-05-11

3 次元点群間の位置合わせは,点群内の点数が増加するほど計算コストが増加するため,3 次元点群を均一リサンプリングやランダムリサンプリングによって間引くことにより,位置合わせの高速化が行われてきた.しかし,リサンプリングによって点を削減した場合,疎な 3 次元点群となるため,位置合わせの精度が低下する.本稿では,3 次元形状を保ちつつ点を削減するために,3 次元点群の局所特徴に基づいてリサンプリングする手法を提案する.リサンプリング処理を高速化するために,3 次元点群から推定される法線と 2 次元距離画像の勾配の関係に着目した.距離画像の勾配は 2 次元画像処理によって高速に算出されるため,各点の法線を距離画像の勾配によって表現することで,距離画像から高速な法線推定を行うことが可能である.その後,3 次元形状が特徴的な領域であるほど点を残すように 3 次元点群を間引いてリサンプリングを行う.実験では,位置合わせの精度と処理時間に関する比較評価を行い,提案手法の有効性を示した.
著者
大石 圭 斎藤 英雄 梶田 大樹 高詰 佳史
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2019-CVIM-215, no.18, pp.1-6, 2019-01-10

手術のビデオ撮影による記録の有用性は以前から認識されてきた.すでに多くの手術室では固定式の術野カメラが設置されている.しかし,実際には外科医の頭部や体によって術野が隠れてしまいカメラによる手術の記録が困難である.我々はこの問題を解決するために,無影灯に複数のカメラを取り付け記録するシステムを提案した.また,術野を認識し自動的にカメラを切り替えることで,頭部の映り込みの少ない映像の生成を試みる.その際,一般的に頻繁なカメラの切り替えは,動画の視聴品質 (Quality of View,QoV) が低下する.そこで我々は,組み合わせ最適化の手法で,最短経路問題で広く用いられるダイクストラ法をこの問題に応用し,一定時間カメラの切り替えが行われず,動画全体で観測している術野領域が最大になるカメラスケジューリング手法を提案する.
著者
香川 椋平 和田 俊和
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2016-CVIM-203, no.24, pp.1-6, 2016-08-29

最近傍探索は,類似画像検索や,BoF 特徴ベクトルの生成,画像間の特徴の対応付けなど,多岐にわたって用いられている.手法としては Hash 型,木探索型,森探索,グラフ探索,など様々な手法があり,問題としては,1- 最近傍探索,k- 最近傍探索,Radius 探索,などがある.近年では格納データの分布の次元が上昇することによって探索速度が低下するという問題を回避するために,近似最近傍探索がよく使われている.これに対し,本稿では,クエリ側の分布を利用した検索の高速化問題を提案する.これを 「学習型最近傍探索問題」 と呼ぶことにする.この分布は逐次与えられるクエリ自身から学習することもできるため,近似最近傍探索と近似のない最近傍探索を並列動作させればオンライン学習もできる.本稿では,その一歩として,クエリに基づいて k-d tree を再構築し,木探索のみで最近傍探索を行う高速化手法を提案する.学習した k-d tree を用いた最近傍探索時間と精度の比較を行い,その活用法を論じる.
著者
廖 若辰 守脇 幸佑 槇原 靖 村松 大吾 武村 紀子 八木 康史
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2019-CVIM-218, no.17, pp.1-6, 2019-08-28

体組成は健康状況を把握するための重要な指標である.体脂肪率や体水分率,筋肉量などを把握することにより,肥満や生活習慣病の予防や改善が可能になり,現代社会における健康維持のためにその必要が増しつつある.市販の体組成計の多くは,生体電気インピーダンス分析法を用いるものが多く,正確な結果を出せる一方,設備が高価という問題点がある.また一人ずつしか計測できないため,多人数を効率よく計測するには不向きである.そこで,本研究では,多人数を効率よく計測するための,歩行映像解析による体組成推定を試みる.具体的には,歩行映像から抽出するシルエットに基づく特徴表現である歩容エネルギー画像 (Gait energy image, GEI) を入力,各体組成の値を出力とする畳み込みニューラルネットワーク (Convolutional neural network,CNN) を構成し,被験者の歩行映像から抽出した GEI と市販の体組成計で計測した体組成の値の組を学習データとして,ネットワークパラメタを学習する.ここで,体組成を計測できる被験者数には限りがあることから,CNN を適切に学習することが困難となる.そこで,まず,大規模歩行映像データベースから抽出した GEI を入力,同データベースから抽出可能な,体組成と関連性のありそうな歩容個性 (腕振りの大きさや歩幅) を出力とする CNN を事前学習する.次に,事前学習されたパラメタを持つ中間層までのネットワークに対して,いくかの層を追加した,即ち,構造的に成長させたネットワークの出力に体組成値を設定し,ネットワークのファインチューニングを行うことで,限られた体組成の学習データからでも効果的に学習可能なことを示す.実験では,体組成の学習データのみを用いた,サポートベクター回帰や CNN による推定手法と比較して,提案手法が高い精度を得られることを確認した.
著者
井上 慶彦 岩村 雅一 黄瀬 浩一
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2018-CVIM-212, no.20, pp.1-6, 2018-05-03

視覚障害者は,晴眼者 (視覚に障害を持たない人) と比べて視覚から得られる情報が限られている.それを補うために,スマートフォンのカメラを用いて物体情報を取得できるような補助アプリもあるが,そもそも知りたい物体の位置を把握すること自体が困難である場合が少なくない.全方位カメラは一度に全方向の情報を取得できることから,対象物にカメラを向ける必要がなく,視覚障害者支援に適していると考えられる.全方位カメラにより周辺画像を取得し,得られた画像に対して物体検出及び認識を行い,音声情報などで視覚障害者にどこに何があるのかを伝えることができるようなシステムが実現できれば,汎用性の高い視覚障害者支援システムとなる.このようなシステムを実現するためには,まず全方位画像に対する正確な物体検出及び認識と,動画において前後フレームで物体情報を保持するためのトラッキングを行う必要がある.全方位カメラから得られる画像は,通常のカメラから得られる画像とは異なった投影方法なので,通常の画像を対象とした物体検出アルゴリズムやトラッキング手法をそのまま適用することは難しい.本稿では物体検出とトラッキングを別々の投影方法で行い,結果を統合することで,全方位画像に対して高精度な物体検出とトラッキングを実現する手法を提案する.
著者
Kosuke Takahashi Shohei Nobuhara
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2018-CVIM-212, no.39, pp.1-16, 2018-05-03

This paper addresses the use of mirror reflections for camera calibration. Camera calibration is an essential technique for analyzing the geometric and radiometric relationship between a 3D space and a 2D image. Most conventional camera calibration methods are based on a fundamental assumption: a camera can directly observe a reference object of known geometry. However, there are cases in which this assumption does not hold in practical scenarios. One approach to camera calibration in such cases is the use of a “mirror” as a supporting device. A mirror generates a virtual reference object that can be expressed using a small number of parameters. In addition, the 2D projection of the reflection object is equal to that of the known reference object from the virtual viewpoint. This paper utilizes these features and tackles two challenges of the geometric camera calibration; the first challenge is the intrinsic camera calibration when a known reference object is not available and the second challenge is the extrinsic camera calibration when the camera cannot directly observe a known reference object due to a physical constraint on the imaging system. The proposed algorithms introduce novel constraints, kaleidoscopic projection constraint and orthogonality constraint, which are hold with the mirror reflections for solving these problems. Evaluations with synthesized and real data demonstrates that the proposed algorithms can work properly and report the robustness of it in comparison with conventional methods.
著者
金子 卓弘 平松 薫 柏野 邦夫
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2017-CVIM-208, no.36, pp.1-8, 2017-09-08

本稿では生成的属性制御と呼ぶ新しい問題に取り組む.生成的属性制御では,画像の生成または編集を,属性内多様性 (例えば,笑顔属性であれば微笑み,大笑い,にやり笑いなどの様々な笑い方) を直感的に制御しながら行えるようにすることを目指す.これを実現するためには,画像の表現空間があった時に,(1) 個人性と属性が分離され,さらに,属性に対して (2) 高い表現力と (3) 高い操作性が得られていることが必要になる.これらを満たすために,本稿では Conditional Filtered Generative Adversarial Networks (CFGAN) と呼ぶ Conditional GAN (CGAN) の新しい拡張モデルを提案する.CGAN は GAN を条件付き設定に拡張したもので,属性の観測変数を生成器と識別器の入力に組み込むことで,表現空間内で個人性と属性を分離することを可能にしている.一方で,表現力と操作性は観測変数に強く制約されており,例えば,観測変数が属性の有無を表すバイナリであればオン ・ オフの制御しかできなかった.これに対して,CFGAN では新たにフィルタリング構造と多次元の隠れ変数を導入し,属性の観測変数の値に応じて隠れ変数のフィルタリングを行う.これにより属性は多次元的に表現されるため表現力を高めることが可能であり,さらに,フィルタリング構造と隠れ変数の分布形状を工夫することで様々な制御を実現することが可能である.実験では,CFGAN を MNIST,CUB,CelebA データセットに適用し,様々なデータに対して属性内多様性を制御しながら画像を生成または編集できることを示す.さらに,本手法を属性転写と属性に基づく画像検索の二つのタスクに適用し,本手法が属性の表現学習にも有用であることを示す.
著者
戸田 真志
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2015-CVIM-197, no.6, pp.1-6, 2015-05-11

近年の撮像機器や耐水/耐圧部材の安価化により,水中カメラを駆使して, 「海中をみる」 行為が盛んに行われている.カメラを用いた水産資源量調査は,その代表格といえよう.カメラを用いた調査は,従来の音響探査等に比して圧倒的な空間解像度を有し,さらにユーザにとってわかりやすく直感的な情報が得られるが故に,実用化が大いに期待されている.本報告では,著者らが取り組む視覚を用いた水産業支援の試み,特に漁場の水中視覚情報から水産資源量を自動計測するシステムの開発について,北海道常呂地区や野付地区のホタテ漁などにおける事例を取り上げ,取り組みの背景や研究開発の詳細を紹介する.