著者
後藤 道彦 植松 裕子 斎藤 英雄 仙田 修司 池谷 彰彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. MI, 医用画像 (ISSN:09135685)
巻号頁・発行日
vol.110, no.28, pp.1-6, 2010-05-06

Augmented Reality(AR)技術を利用した作業支援は,ユーザに対して直感的な支援が可能である.一般に,ARシステムを構築するためには,重畳するコンテンツを用意する必要があり,従来はそのコンテンツを用途に合わせてCGなどで新たに作り出していた.本論文で提案するARシステムでは,そのコンテンツを新たに作るのではなく,既に多く存在しているビデオをお手本となる教師ビデオとして利用し,ユーザの視点に合わせて教師ビデオを変換して重畳表示することで,情報提示を行う.このとき,ユーザの作業と教師ビデオ映像が視覚的に混同しやすい問題を解決するために,教師ビデオに対して透明度変化や輪郭線の強調表示などの様々な加工を施す.また,作業内容に合わせて教師ビデオをいくつかの手順に分割し,ユーザ側の作業が完了してから次の手順へと進めるようなインタラクティブ性を持たせることで,ユーザが各自のペースで作業を行うことのできるシステムとなっている.本システムの有効性を検証するためのユーザ評価実験では,折り紙を折る作業とブロックを配置する作業の2つの状況を想定し,本システムでの教師ビデオの提示方法について評価を行った.その結果,本システムで提案するようにユーザの視点に合わせてビデオを提示することで,ユーザの視認性が向上するということが分かった.また,教師ビデオに施すエフェクトについての評価では,作業内容ごとに適したエフェクトを分類することができ,今後さらに他の作業へと適用する際の指標を得ることができた.
著者
松本 一紀 ドゥ ソルビエ フランソワ 斎藤 英雄
出版者
一般社団法人 映像情報メディア学会
雑誌
映像情報メディア学会誌 (ISSN:13426907)
巻号頁・発行日
vol.69, no.3, pp.J113-J120, 2015 (Released:2015-02-25)
参考文献数
16
被引用文献数
1

近年登場した距離センサーを搭載したデバイスの中でもその価格と汎用性ゆえに最も多く利用されているのがMicrosoftのKinectに代表されるRGB-Dカメラである.しかし,RGB-Dカメラから得られる3次元点群は多くのノイズを含んでおり,精密な距離情報の取得が求められるアプリケーションでの利用は依然として困難である.そこで本論文ではRGB-Dカメラから得られた3次元点群の観測ノイズの低減と補間を実時間で行う手法を提案する.本手法はRGB-Dカメラから得られた3次元点群からSuperpixel Segmentaiotnとラベリングを併用して平面で構成される小領域群を検出し,領域毎に平面方程式を推定し3次元点群をフィッティングさせることにより,もとの距離画像に含まれるノイズの低減と補間を行うものである.本手法では検出された領域内の点群の法線分布を算出し,その領域が平面の場合平面フィッティングを適用し曲面の場合Joint Bilateral Filterを適用することで,曲面分布した点群を保持しながら平面分布した点群のみを平面フィッティングすることができる.また,領域分割と平面フィッティングはすべて局所領域ごとに並列化できる手法を用いているため,本手法の実装はすべてGPUで行い実時間での処理が可能である.従来の手法と比べて,本手法はRGB-Dカメラから取得した点群に対して,曲面領域を保持したまま平面領域を平滑化することでノイズ低減と補間を行うことができる.
著者
森山 剛 斎藤 英雄 小沢 慎治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.95, no.319, pp.9-16, 1995-10-20
被引用文献数
6

本研究では、人が声を聞いた時に知覚する感情の概念と、平静時から変化した音響パラメータとを定量的に対応付ける分析合成系を提案する。まずいくつかの言葉で感情音声を発し、それを聞いた際に受ける印象を主観評価した結果を因子分析して因子を得る。この時同時に感情音声の音響パラメータを主成分分析してその主成分を得る。こうして得られた因子と主成分の重回帰分析を行うことにより得られる重回帰係数行列を対応情報とする。分析系では、対応情報に基づいて得られた音響パラメータから感情情報を獲得する。合成系では、対応情報に基づいて、感情情報から音響パラメータの平静時からの変化分を得る。本稿では、構築するシステムの概要を述べると共に抽出された因子の妥当性を検証する。
著者
稲本 奈穂 柿本 正憲 高谷 優樹 榎本 暁人 斎藤 英雄
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会技術報告 (ISSN:13426893)
巻号頁・発行日
vol.33, no.42, pp.29-32, 2009-10-21

複数のカメラで撮影される実写画像から,立体視可能なスポーツコンテンツを生成する手法を提案する.従来,立体視用の実写コンテンツを生成するためには,キャリブレーションされた複数のカメラで被写体を撮影し,被写体のデプス情報を取得する必要があった.もしくは,表示ディスプレイと同じ視点数分のカメラを用意し,ディスプレイの視差に合わせて撮影を行う必要があった.それに対し本手法では,カメラ間の相対的な位置関係から,視点補間技術を用いて,立体視に必要な視点数分の画像を生成し,立体視画像の合成を行う.カメラのキャリブレーションを省力化できること,ソフトウェア処理にてディスプレイの個体差を吸収できることから,高効率かつ出力先を選ばない柔軟な立体視コンテンツ生成が可能となる.
著者
内山 英昭 斎藤 英雄 セルヴィエル ミリアム モロ ギヨム
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.88, pp.113-118, 2009-06-11
被引用文献数
1

本稿では,交差点マーク付き地図と交差点データベースを用いた地理データマッチングに基づくGISデータのAR提示システムを提案する.本システムでは,交差点マーク付き地図を撮影すると,その地図に関連するGISデータをディスプレイを通してAR提示する.地理データとして交差点を使用し,点検索手法のLLAHによって画像中とデータベース中の交差点の対応付けを行うことで地図の識別を行う.また,任意の方向から撮影した画像に対して交差点の対応付けを可能にするため,LLAHにトラッキングを導入する.実験では,LLAHによる交差点の対応付けによって実時間地理データマッチングが可能であることを示す.また,LLAHにトラッキングを導入することで自由なカメラの動きに応じたAR提示が可能になることを示す.
著者
皆川 卓也 斎藤 英雄
出版者
The Institute of Electrical Engineers of Japan
雑誌
電気学会論文誌. C, 電子・情報・システム部門誌 = The transactions of the Institute of Electrical Engineers of Japan. C, A publication of Electronics, Information and System Society (ISSN:03854221)
巻号頁・発行日
vol.129, no.5, pp.947-955, 2009-05-01
被引用文献数
1 1

In this paper, we present an object category recognition method for an information search system which is queried by camera of mobile phone or by servers of internet services. In such a system, processing speed is an important requirement.<br>To improve processing speed, the hierarchical object category recognition technique proposed by Serre<sup>(23)</sup> is modified using Haar-Like features, vector quantization of feature models, and reduction of processing area. In addition, by retaining the information of each feature's position, it compensates the accuracy which is a little reduced in exchange of processing speed. We implemented this method to web server, and proved this system can work in practical processing time. Through the experiment for Caltech-101 image database and natural scene category images, we also confirm the accuracy of our approach.
著者
大石 圭 斎藤 英雄 梶田 大樹 高詰 佳史
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2019-CVIM-215, no.18, pp.1-6, 2019-01-10

手術のビデオ撮影による記録の有用性は以前から認識されてきた.すでに多くの手術室では固定式の術野カメラが設置されている.しかし,実際には外科医の頭部や体によって術野が隠れてしまいカメラによる手術の記録が困難である.我々はこの問題を解決するために,無影灯に複数のカメラを取り付け記録するシステムを提案した.また,術野を認識し自動的にカメラを切り替えることで,頭部の映り込みの少ない映像の生成を試みる.その際,一般的に頻繁なカメラの切り替えは,動画の視聴品質 (Quality of View,QoV) が低下する.そこで我々は,組み合わせ最適化の手法で,最短経路問題で広く用いられるダイクストラ法をこの問題に応用し,一定時間カメラの切り替えが行われず,動画全体で観測している術野領域が最大になるカメラスケジューリング手法を提案する.
著者
世木 寛之 田高 礼子 清山 信正 都木 徹 斎藤 英雄 小澤 愼治
出版者
一般社団法人 映像情報メディア学会
雑誌
映像情報メディア学会誌 (ISSN:13426907)
巻号頁・発行日
vol.65, no.1, pp.76-83, 2011-01-01 (Released:2011-04-01)
参考文献数
24
被引用文献数
1 1

The design method of a sentence set for a speech-synthesis database strongly influences the quality of the synthesized speech. To minimize the costs associated with making the speech recordings and constructing the speech database, the number of the sentence set should be limited. However, if a sentence set does not include sufficient data, the quality of the synthesized speech can be inadequate. In this paper, we propose a method for generating a sentence set from templates. When applied to the templates in the "Weather Report" radio program, the proposed method reduced the number of the sentence set to less than several percent of that required by a comparison method. In addition, the mean opinion score of speech samples synthesized using the proposed method was 4.32 on a five-point scale.
著者
小林 巧 家永 直人 杉浦 裕太 斎藤 英雄 宮田 なつき 多田 充徳
出版者
公益社団法人 精密工学会
雑誌
精密工学会誌 (ISSN:09120289)
巻号頁・発行日
vol.84, no.12, pp.996-1002, 2018-12-05 (Released:2018-12-05)
参考文献数
15
被引用文献数
2

This paper presents a method to measure foot shape from a 3D point cloud as input captured from multiple directions using a smartphone depth camera. Such a 3D point cloud could potentially include noise or omit parts of the foot due to occlusion. To deal with this occlusion problem, we propose to use a dataset of 3D foot shapes collected by a precise 3D shape scanner of foot shapes. According to the dataset of 3D foot shapes, we can generate a deformable model by performing a principal component analysis (PCA) on the dataset. Then we minimize the error of the shape represented by the deformable model and the 3D point cloud acquired by the smartphone camera, to recover a complete 3D shape of the entire foot with high accuracy. We test this method by comparing the 3D shape produced by our proposed method to the 3D shape precisely measured by the 3D scanner. Our proposed method can scan the foot shape with an error of about 1.13mm.
著者
森山 剛 斎藤 英雄 小沢 慎治
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J82-D2, no.4, pp.703-711, 1999-04-25

本論文では,感情を含むことによって音声に生ずる物理的変動と,そこから 知覚される感情とを線形に対応づけるモデルを提案する. 本モデルでは,日常の感情語と物理パラメータを直接対応づける代わりに, それぞれから抽出した物理的基底及び心理的基底を対応付けに用いている ため,感情語や物理パラメータの選び方に依存しないという特長を有する. また,話し手の抱いた感情ではなく聞き手側に存在する感情のステレオタイプ を基準とすることで,感情を可観測で一般性を有するものとしている. 本研究では統計的な手法を用い,まず種々の感情が含まれた音声の韻律 パラメータと心理実験によって得た主観評価値を用いて,それぞれ物理的 基底(主成分)及び心理的基底(因子)を求めた. 更にこれらの基底空間に写像した物理量及び心理量に重回帰分析を施す ことにより,音声の物理量と感情を双方向に変換することの可能な対応情報 を獲得した.
著者
中川 航 松本 一紀 ドゥ ソルビエ フランソワ 杉本 麻樹 斎藤 英雄 仙田 修司 柴田 剛志 池谷 彰彦
出版者
一般社団法人 映像情報メディア学会
雑誌
映像情報メディア学会誌 (ISSN:13426907)
巻号頁・発行日
vol.69, no.4, pp.J160-J168, 2015 (Released:2015-03-25)
参考文献数
14
被引用文献数
1

近年、温度カメラは、機械設備・建築物の検査や,人間や動物の体温の検査等,多くの目的に利用されるようになってきた.本論文では,RGB-Dカメラで取得した3次元環境モデルを利用して、このモデル上に温度分布をレンダリング表示することにより,対象環境の温度分布を自由な視点から観察可能なシステムを提案する.本システムでは,3D環境モデルを利用したカメラ位置姿勢のトラッキング手法に基づき,事前に取得しておいた温度分布に対して,現在の温度変化を表示することも可能である.提案システムの有効性を検証するために,幾つかのシーンに対して本システムを利用して表示した温度分布や温度変化分布を示す.
著者
岩瀬 幸子 斎藤 英雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.34, pp.119-124, 2002-05-09
被引用文献数
2

現在,サッカーは世界で最も盛んなスポーツであり,その映像データをもとに選手追跡を基本としたさまざまなシーン解析が報告されている.しかし,サッカーはプレーヤーが多いため,選手が重なって見えるといったオクルージョンにより追跡が失敗してしまうことが多かった.特に,移動物体が複数あるサッカーシーンの場合は,オクルージョン発生後の対象物体の対応付けが非常に難しい.そこで本研究では,サッカーのゲームシーンにおいて,複数の固定カメラから撮影された多視点画像を用いることでオクルージョンの問題を解決し,全カメラにおいて選手1人のロバストな追跡を行う手法を提案する.Soccer is one of the most popular sports around the world, and various researches have done for soccer scene analysis by tracking soccer players. However, tracking is often failed when occlusion occurs, then we can not get accurate location of the player. In this presentation, we will show a method of tracking a soccer player using multiple cameras. By using multiple view images, we can get over the occlusion problem, and obtain robustness in player tracking.
著者
蔭山 佳輝 斎藤 英雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会総合大会講演論文集
巻号頁・発行日
vol.1996, no.2, 1996-03-11
被引用文献数
5

「感性工学」とは,「人間が持つイメージをモノの設計要素に翻訳する技術と定義されている.「感性工学」の実践例として,「かわいい」・「豪華な」といった曖昧なイメージから画像を検索するシステムが考案されている.しかし,こうしたシステムはSD法と重回帰分析を用いて得られる統計量と感性とを対応付けしているため,十分に個人性を考慮できていないという問題があった.そこで本稿では,逆誤差伝播法によるニューラルネットワークを用いてユーザの感性の個人差に対応できる画像検索システムを提案する.
著者
内山 英昭 斎藤 英雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告エンタテインメントコンピューティング(EC) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.18, pp.71-78, 2007-03-02
参考文献数
8

本システムは,ユーザがハンデイカメラを用いて撮影した入力画像からビリヤード台上の球の位置を検出し,力学シミュレーションによって次の戦略として適切な打ち方を算出して,その打ち方に基づく球の挙動を支援情報として提示する.初めにユーザがビリヤード台全体を任意の方向から撮影する次に,本システムがビリヤード台上における球の座標を算出し,球の配置を解析することで 複数の戦略を提示する.最後にユーザが選択した戦略についての球の挙動をVR表示,または実際の画像にCGを用いてAR表示する.This paper presents a strategy based pool supporting system which presents the way to hit the ball by considering the ball arrangement. First, our system estimates positions of solid balls from images which are captured using a handy camera moving around the pool table. Next, our system analyzes the behavior of balls after shooting by using physical simulation, and shows some strategies for winning the pool game. After an user choosing one strategy, our system shows the physical behavior of the balls in the captured image by using CG.
著者
大田 友一 尾野 徹 秋道 慎志 藤田 米春 井上 誠喜 斎藤 英雄 北原 格 大城 英裕 藤野 幸嗣 金出 武雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.100, no.633, pp.17-22, 2001-02-15
被引用文献数
4

現実空間を多数のビデオカメラで撮影した映像を統合して仮想化現実空間を構成し、臨場感の高いコミュニケーションを可能にすることを目指して進めているプロジェクトについて述べる。多数の2D映像と、それらを加工することにより構築される3Dモデルを、CV技術とCG技術を駆使してシームレスに統合することにより、受け手の視点選択の自由度と実時間性を両立させた自由視点映像スタジアムを開発していく。特に、多数の固定カメラと少数の可動カメラの併用により画質を飛躍的に向上させる技術を開発するとともに、現実のスタジアムの空間に複数のカメラを設営した大規模な実験を行うことによって、実用化のために要求される開発課題の検討を実証的に進めている。
著者
林 邦彦 斎藤 英雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.51, pp.173-180, 2006-05-18
被引用文献数
3

近年、スポーツ映像などで自由な視点からの映像の要求が高まっている。従来手法[5]では、サッカースタジアムのような大規模な空間で、カメラの中間視点画像しか合成できなかった。この従来手法は、空間の3次元モデルを復元をせずに、入力画像間の対応点を算出することで自由視点画像を生成している。そこで、本稿では、サッカーシーンを幾何的な特徴に応じて、動的領域と静的領域に分割し、各領域を平面近似して、それぞれ3次元モデルを簡易的に復元することによって、中間視点画像に限らない自由視点画像を生成する手法を提案する。本手法では、対象の3次元モデルを復元するために、まず、カメラキャリブレーションを行う。その際、サッカーグラウンドにマーカーを置く事はできないので、グラウンド面の平面パターンを利用してカメラキャリブレーションを行う。分割された各領域のうち、選手やボールである動的領域がグラウンドに垂直に立つ1枚の板(ビルボード)で表されるものとして3次元モデルを復元する。一方、静的領域に対しては、複数の平面領域に分割し、各平面の3次元モデルをあらかじめ復元する。本手法をサッカーシーンに適用し、従来生成できなかった中間視点以外の自由視点画像を生成することで有用性を示す。We propose a new method for synthesizing free-viewpoint images from multiple view videos in soccer stadium. The previous method[5] can synthesize virtual viewpoint images at intermediate viewpoint between real cameras. The previous method estimates only pixel-wise correspondences between input images for synthesizing virtual viewpoint images without a 3D reconstruction. In this paper, we propose a new method that can synthesize virtual viewpoint images at free-viewpoints which are not limited at intermediate viewpoint by reconstructing simple 3D models after dividing a soccer scene into static regions and dynamic regions. To reconstruct the object soccer scene, we perform camera calibration without marker objects because we can't put such objects on the soccer ground. For reconstructing of dynamic regions, we employ a billboard representation of dynamic regions. The billboard representation can realize a simple 3D reconstruction and transform textures into the appropriate appearance of the aspect of dynamic regions at virtual viewpoint. For reconstructing of static regions, we divide two planes that are a ground region and a background region. We reconstruct 3D models in each region beforehand. By applying our method to a soccer scene, we can synthesize free-viewpoint images which are not limited at intermediate viewpoint by employing only pixel values of real images.
著者
橋本 昂宗 植松 裕子 斎藤 英雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.374, pp.85-90, 2010-01-14
被引用文献数
2

本論文では,多視点のカメラの映像を合成することにより,中央カメラに映る障害物を取り除くとともに,障害物に隠れていた物体を透視することで,シースルー映像を生成する手法を提案する.本手法を野球の試合映像に適用し,審判とキャッチャーに隠されたピッチャーの姿を透視した映像を生成する.本手法は,ピッチャーの合成,審判とキャッチャーの除去,ボール軌跡の可視化の処理から成る.ピッチャーの合成では,左右カメラにおけるピッチャー領域を,Homographyによって中央カメラ視点へ変換して合成する.審判とキャッチャーは,Graph cutを用いた領域検出によって除去する.ボール軌跡は,左右および中央カメラ間に成立するTrifocal Tensorを用いて中央カメラでのボール位置を推測することで可視化する.最後に,それぞれの処理によって生成された結果を領域ごとに合成することで,シースルー映像を生成する.実験では,球場にて撮影した多視点映像に本手法を適用し,障害物であるキャッチャーと審判を除去したシースルー映像を合成することができた.
著者
橋本 昂宗 植松 裕子 斎藤 英雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.109, no.375, pp.85-90, 2010-01-14
被引用文献数
1

本論文では,多視点のカメラの映像を合成することにより,中央カメラに映る障害物を取り除くとともに,障害物に隠れていた物体を透視することで,シースルー映像を生成する手法を提案する.本手法を野球の試合映像に適用し,審判とキャッチャーに隠されたピッチャーの姿を透視した映像を生成する.本手法は,ピッチャーの合成,審判とキャッチャーの除去,ボール軌跡の可視化の処理から成る.ピッチャーの合成では,左右カメラにおけるピッチャー領域を,Homographyによって中央カメラ視点へ変換して合成する.審判とキャッチャーは,Graph cutを用いた領域検出によって除去する。ボール軌跡は,左右および中央カメラ間に成立するTrifbcal Tensorを用いて中央カメラでのボール位置を推測することで可視化する.最後に,それぞれの処理によって生成された結果を領域ごとに合成することで,シースルー映像を生成する.実験では,球場にて撮影した多視点映像に本手法を適用し,障害物であるキャッチャーと審判を除去したシースルー映像を合成することができた.