著者
木村 翔 筧 康明 高橋 桂太 苗村 健
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.91, no.12, pp.2781-2790, 2008-12-01
被引用文献数
1

筆者らは,プロジェクタ映像の中に,人間には見えないメタ情報を埋め込んで投影できる可視光通信プロジェクタの開発を進めてきた.このメタ情報による機械の制御は,人が目にする映像と画素単位の精度で一致させることができる.本研究は,実世界に根ざした様々なインタフェースを実現するための基盤技術として位置づけられる,これまで,埋め込まれたメタ情報を読み出すにあたり,ホトセンサ付きの受光端末を用いて,映像中の1点での情報を取得していた.本論文では,高速度カメラを用いてこのメタ情報を読み出す手法を提案する.高速度カメラを用いることで,映像全体から複数のメタ情報を同時に取得可能になる.いくつかのアプリケーション例を示すとともに,実験を通じて,その有効性を明らかにする.
著者
澤田 耕司 高橋 桂太 苗村 健
出版者
一般社団法人 映像情報メディア学会
雑誌
映像情報メディア学会誌 (ISSN:13426907)
巻号頁・発行日
vol.62, no.2, pp.256-261, 2008-02-01 (Released:2010-05-01)
参考文献数
12

We have been developing a thermo-key system that segments human regions from video in real-time using thermal information. We developed a new segmentation method for this system based on Bayesian estimation, which uses both chroma and thermal information integratively. Segmentation algorithms were previously based on a simple threshold processing of thermal images, which often results in wrong segmentation of objects/environments whose temperatures are close to body temperature. Trained with only a few sets of chroma and thermal images, our algorithm can extract human regions from video with much higher accuracy compared to previous algorithms.
著者
内田 雄基 大橋 一輝 高橋 桂太 藤井 俊彰
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J99-D, no.9, pp.823-835, 2016-09-01

本論文では,代表的なlight field cameraの一つであるLytro Illumを対象とし,カメラの物理的な画素配列を考慮した超解像手法を提案する.Lytro Illumでは,イメージセンサの手前に挿入されたマイクロレンズアレーの働きにより,多視点画像の同等のデータ(light fieldデータ)がイメージセンサ上に多重化されるため,一度の撮影で三次元情報を取得できる.取得データ(RAW画像)に逆多重化を施すことで,多視点画像(sub-aperture image)を取り出せるが,個々の画像の解像度は限られる.そこで,多視点画像を相互に位置合わせして超解像を行い,解像度を向上させる方法が考えられる.しかしながら,従来の手法では,Lytro Illumのようなカメラに特有のRAW画像の画素配列の扱い方に問題がある.RAW画像では,各画素はRGBのうち一つの色情報をもち,かつ,マイクロレンズが六角格子状に並んでいる.従来の手法では,デモザイキングにより色情報を復元し,レンズ配列が正方格子状になるように画素をリサンプリングする.これらの過程には重みづけ和のような演算を伴うデータの補間が含まれるため,RAW画像のもつオリジナルの情報が損なわれ,超解像の効果を妨げると考えられる.それに対して我々は,演算を伴う補間処理を行わず,RAW画像の画素配列を維持したsub-aperture imageを用いて超解像を行う手法を提案する.また,幾つかの実写画像を用いた実験により,提案手法の有効性を示す.
著者
藤田 秀 高橋 桂太 藤井 俊彰
雑誌
研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:21888582)
巻号頁・発行日
vol.2016-AVM-95, no.16, pp.1-6, 2016-12-01

光線空間法は,光線を単位として 3 次元空間の視覚情報を記述する手法である.光線空間は一般に 4 次元信号空間となるが,その信号は特有の構造をもつ.すなわち,光線空間の 2 次元部分空間では,信号は直線状の軌跡の集合となり,局所的にみれば,それらの直線の傾きはほぼ一定となる.この性質は,光線空間の補間等の処理において有用である.本研究では,光線空間の直線状の軌跡を効率よく記述するために,スパースコーディングの枠組みを検討する.従来研究においても,光線空間のスパースコーディングが試みられてきたが,直線の傾きが局所的に一定である性質は必ずしも十分に用いられていなかった.そこで,我々は,この性質を十分に用いるため,光線空間の離散フーリエ変換 (DFT) 領域に対して,グループスパース性を導入し,より効率的に光線空間を記述する.この際,DFT 係数に対して直接グループスパース性を適用する手法と,方向別の DFT 領域を記述する shearlet 変換係数に適用する手法を提案する.また,従来提案されていた shearlet の最適化手法を見直し,解析的に行うことで性能を向上させる.
著者
宮崎 斉 高橋 桂太 金子 正秀
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会技術報告 (ISSN:13426893)
巻号頁・発行日
vol.37, no.7, pp.55-58, 2013-02-09

本論文では、人間とロボットが円滑なインタラクションを行うための手法を提案する。同伴対象である人間に対し、ロボットから積極的に「手つなぎ動作」を提案し、つないだ手で様々な行動をとることによって、的確に人間にロボットの意図を伝えることを可能とする。さらに「手つなぎ」状態を人間からロボットへの意思伝達手段にも利用し、人間の手の動きや接触の状態などをセンシングすることで速度調節などの人間側からの要望を即座にロボットに伝達する。このように人間からロボットへの意思伝達機能、ロボットから人間への意図伝達機能をもって、人間-ロボット間の相互的な意図の伝達を実現する。手法の応用例として案内ロボットについて述べる。
著者
田口 裕一 高橋 桂太 苗村健
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.27, pp.79-86, 2008-03-10
被引用文献数
5

64台のネットワークカメラアレイを用いた実時間全焦点自由視点映像合成システムについて報告する.本システムでは,所望の視点位置における画素単位の奥行きマップを実時間で推定し,高品質な全焦点自由視点映像を合成する.画像合成処理をすべてGPU上で実装することにより,CPUとGPUで効率的な並列計算を行うシステムを1台のPCで実現した.これにより,解像度QVGAの入力多視点映像を用いて,フレームレート24fpsでの自由視点映像合成が可能となった.さまざまなシーンにおける高品質な自由視点映像を実験結果として示す.We present a real-time video-based rendering system using a network camera array. Our system consists of 64 commodity network cameras which are connected to a single PC through Gbit Ethernet. To render a high-quality novel view, we estimate a view-dependent per-pixel depth map in real-time based on a layered representation. The rendering algorithm is fully implemented on GPU, which allows our system to efficiently perform independent and parallel processing of CPU and GPU. Our system renders free-viewpoint videos at 24 fps using QVGA input video resolution. Experimental results show high-quality images synthesized from various scenes.
著者
石川 彰夫 奥井 誠人 山本 健詞 井ノ上 直己 寺谷 メヘルダド 高橋 桂太 藤井 俊彰
出版者
一般社団法人 映像情報メディア学会
雑誌
映像情報メディア学会誌 (ISSN:13426907)
巻号頁・発行日
vol.72, no.10, pp.J174-J182, 2018 (Released:2018-09-26)
参考文献数
26

近年,臨場感を高めるため,人物を等身大で表示できる大型のディスプレイが注目されている.さらに大型の裸眼立体ディスプレイも研究開発が進められており,臨場感のある視聴体験が期待されている.しかし,大型ディスプレイで裸眼立体のための運動視差を実現するためには,100~200視点の映像が必要になる.一方,2020年頃に第5世代移動通信システム(5G)の実用化が予定されており,この通信帯域で数百視点の映像を視覚的な劣化が少なく伝送できれば,場所を限らず視聴できることになる.筆者らは数百視点の映像を圧縮伝送するアルゴリズムSecond-MVDを開発し,既に開発していた200視点の多視点映像伝送システム「REI」に実装して,5Gで想定されている大量のデバイスとの同時通信環境における平均スループットである100Mbps以下の環境を想定した主観評価実験を行った.その結果,想定環境下で4以上のMOSを達成する結果が得られた.
著者
前田 哲汰 パナヒプル テヘラニ メヒルダド 高橋 桂太 藤井 俊彰
雑誌
研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:21888582)
巻号頁・発行日
vol.2017-AVM-96, no.3, pp.1-6, 2017-02-17

我々は,サッカーなどの広大な空間を用いて行うスポーツを対象として,疎に配置した多数のカメラでシーンを撮影し,visual hull 法を用いてその 3D モデルを生成し,可視化する研究を行っている.Visual hull 法では微小なボクセルの集合によって 3D モデルを表す.扱う空間が広大かつ多数の選手が存在する場合,処理時間の削減やボクセル同士のオクルージョンの効率的な扱いが課題となる.そこで本稿では,処理時間を削減するために,8 分木構造を用いてボクセル群を多重解像度化し,内部を削りながらモデルを生成した.また,オクルージョンを明示的に扱わずに各ボクセルに対して矛盾のない色付けを可能にするために,仮想視点の角度に応じて表示色の変化をフーリエ級数で近似した.この表示色の推定において,周辺のカメラから得た色の中央値を用いることで比較的正しい色付けを行うことができた.
著者
杉田 馨 高橋 桂太 苗村 健 原島 博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎 (ISSN:09135685)
巻号頁・発行日
vol.103, no.351, pp.25-30, 2003-09-29
被引用文献数
1

バーチャルリアリティなどのインタラクティブ性を必要とするアプリケーションでは,高速画像処理が重要な要素技術となる.本稿では,合焦判定を用いたLight fieldからの全焦点画像合成アルゴリズムをATI RADEON 9800 Pro GPU上に効率的に実装する手法を提案する.画像合成に必要となるすべての処理をGPU上で実行することで,システムバス上のデータの転送量を削減し,処理の高速化を実現できる.実験の結果,提案手法による実装は,合焦判定にIntel Pentium 4 3.06GHz CPUを用いる実装に比べ約7.7倍高速であることが確認できた.
著者
遠藤千麻 高橋桂太 金子正秀
出版者
一般社団法人情報処理学会
雑誌
全国大会講演論文集
巻号頁・発行日
vol.2012, no.1, pp.671-673, 2012-03-06

実写顔画像から顔の形状を表す特徴点を取得し、主成分分析を行うことにより、顔特徴を定量的に扱うことができる。人の顔は様々な要素を含んでいるが、その中の一つとして、例えば、のんきや勇ましいなど顔全体の印象を言葉によって記述することがある。本研究では、顔部品(特に目、眉、口)の形状特徴と配置の印象が顔の全体的印象にどのような影響を与えるかを調べる。さらに、顔部品の形状・配置印象に基づいた顔の全体的印象に対する定量的な判定方法を提案する。
著者
高橋 桂太 久保田 彰 苗村 健
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.3, pp.573-584, 2005-03-01
被引用文献数
25

Light field rendering (LFR)とは, あらかじめ取得された多視点画像から自由視点画像を合成する, イメージベーストレンダリングの基本的な手法である.この手法では, 合成画像において焦点ぼけのような現象が現れることが知られている.現実のシステムでは, この"焦点"が合う範囲が非常に狭い場合が多いという問題点がある.本論文では, LFRの合成画像における"合焦"の度合を, 安定に判定する新しい尺度を提案する.また, この尺度を用いて, "合焦"距離が異なる多数枚の画像から, "焦点"が合っている領域を統合することで, シーン全体を鮮明にとらえた"全焦点"画像を合成する手法を提案する.更に, 画像合成の実験を行い, 提案手法によって, 最終的な合成画像の品質が向上することを確認した.