著者
山内 悠嗣 山下 隆義 藤吉 弘亘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J96-D, no.9, pp.2017-2040, 2013-09-01

人検出とは,画像中から人が存在する位置と大きさを自動的に求める技術である.人検出は古くから取り組まれてきた顔検出の研究がベースとなっている.近年では多様な見えの変化が生じることから検出が困難とされている人画像に研究対象が遷移している.こうした中で,人検出を難しくする要因を克服するような手法が数多く提案されている.そこで,本論文では人検出を難しくする要因を整理し,この要因を克服するための特徴抽出と統計的学習手法による識別器の二つの観点から手法をサーベイする.また,人検出法を定量的に評価するために利用されている人画像データベースと統一的な評価指標についても紹介する.
著者
高木 雅成 山内 悠嗣 藤吉 弘亘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.8, pp.1429-1438, 2010-08-01
被引用文献数
3

近年,人や車両などを対象とした物体検出は,HOG特徴量などのアピアランスベースの局所特徴量が用いられる.しかし,アピアランスベースの特徴量のみを用いた物体認識は,識別が困難なサンプルが存在する.この問題に対して,コンテクストとして物体カテゴリー間の共起性を利用した物体認識法が提案され,その有効性が確認されている.しかし,学習サンプル中には同時に存在する確率が低いカテゴリー間の物体に対しても共起性を表現するため,識別精度に悪影響を及ぼす可能性がある.そこで,本論文では特徴量レベルで検出対象カテゴリーと非検出対象カテゴリーの特徴量間の共起性を利用した高精度な物体検出法を提案する.提案手法では,アピアランスベースの特微量に加え,Geometric Contextから得られる"空"や"地面"などの確信度を特徴量として利用し,Real AdaBoostの弱識別器の出力を演算子により結合することで共起性を表現する.従来の共起表現法では,和演算子と積演算子を用いた共起表現法のみであったが,本論文では新たに差演算子を導入する.これにより,アピアランス情報から得られる検出対象の確率を,ジオメトリ情報により補正するような共起を表現することが可能となる.提案手法の有効性を確認するために人と車両のデータベースを用いた評価実験を行い,提案手法は高精度な検出が可能であることを確認した.
著者
三井 相和 藤吉 弘亘 秋田 時彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.94, no.7, pp.1135-1144, 2011-07-01

本論文では,textonに用いられるフィルタをボックスフィルタ(平均化フィルタ)の組合せで近似した,近似texton特徴量による高速な人検出法を提案する.textonによる特徴抽出は処理が容易であることから,テクスチャ解析やパターン認識,一般物体認識など多岐の分野で多く用いられる.しかし,単純なフィルタリング処理では,フィルタ内の1ピクセルごとにアクセスし演算しなければならないため,特徴抽出の処理コストが非常に高い.そこで,本論文では特徴抽出の処理コストを削減するために,textonに用いられるフィルタを近似することで高速な人検出を実現する.textonの近似には処理が簡易なボックスフィルタを用いる.このボックスフィルタをピラミッド上に組み合わせることで,擬似的にtextonのフィルタの形状を構築する.また,ボックスフィルタの応答値の算出には,方形領域の画素値の合計を一括算出することが可能なIntegral Imageを用いる.これらを組み合わせることで,近似フィルタの応答値を高速に求めることが可能となる.評価実験より,提案手法は人検出の特徴量として有効であるHistograms of Oriented Gradients(HOG特徴量)と同精度であり,2.3倍高速な識別が可能であることを確認した.
著者
藤吉 弘亘 安倍 満
出版者
公益社団法人 精密工学会
雑誌
精密工学会誌 (ISSN:09120289)
巻号頁・発行日
vol.77, no.12, pp.1109-1116, 2011-12-05 (Released:2012-06-05)
参考文献数
11
被引用文献数
1
著者
長谷川 昂宏 山内 悠嗣 山下 隆義 藤吉 弘亘 秋月 秀一 橋本 学 堂前 幸康 川西 亮輔
出版者
一般社団法人 日本ロボット学会
雑誌
日本ロボット学会誌 (ISSN:02891824)
巻号頁・発行日
vol.36, no.5, pp.349-359, 2018 (Released:2018-07-15)
参考文献数
27

Automatization for the picking and placing of a variety of objects stored on shelves is a challenging problem for robotic picking systems in distribution warehouses. Here, object recognition using image processing is especially effective at picking and placing a variety of objects. In this study, we propose an efficient method of object recognition based on object grasping position for picking robots. We use a convolutional neural network (CNN) that can achieve highly accurate object recognition. In typical CNN methods for object recognition, objects are recognized by using an image containing picking targets from which object regions suitable for grasping can be detected. However, these methods increase the computational cost because a large number of weight filters are convoluted with the whole image. The proposed method detects all graspable positions from an image as a first step. In the next step, it classifies an optimal grasping position by feeding an image of the local region at the grasping point to the CNN. By recognizing the grasping positions of the objects first, the computational cost is reduced because of the fewer convolutions of the CNN. Experimental results confirmed that the method can achieve highly accurate object recognition while decreasing the computational cost.
著者
山内 悠嗣 山下 隆義 藤吉 弘亘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.92, no.8, pp.1125-1134, 2009-08-01
被引用文献数
5 12

本論文では,Boostingに基づく特徴量の共起表現による人検出法を提案する.既に,特徴量間の共起を表現する手法としてAdaBoostにより2値に識別した符号を複数組み合わせる手法が提案され,顔検出においてその有効性が確認されている.しかし,入力特徴がオクルージョンなどの影響によって,どちらのクラスとも言いがたい場合にも2値に識別して共起を表現するため,間違えた符号を組み合わせる問題がある.そこで,弱識別器の出力が連続値であるReal AdaBoostを用いて,出力を演算子によって結合した共起表現による人検出法を提案する.提案手法は,オクルージョンなどの影響を抑制することができるため,高精度な検出が期待できる.評価実験により,従来法と比較して誤検出率5.0%において検出率を約6.8%向上させることができた.
著者
池村 翔 藤吉 弘亘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.3, pp.355-364, 2010-03-01
被引用文献数
4

近年,統計的学習法と局所特徴量を用いた人検出に関する研究が多く取り組まれている.従来の人検出法では,HOG(Histograms of Oriented Gradients)特徴量のようなこう配情報に基づく特徴量を用いる手法が多いが,人の重なりや複雑な背景に対して人検出が困難となる場合がある.更に,検出時には検出ウィンドウのスケールを変化させながら画像上を複数回にわたりラスタスキャンするため処理コストが高く,リアルタイム処理が困難である.そこで,本論文ではTOFカメラから得られる距離情報を用いて人の重なりや複雑なシーンに頑健なリアルタイム人検出手法を提案する.提案手法では,距離画像から二つの局所領域の距離関係をとらえることができる距離ヒストグラム特徴量を抽出する.抽出された特徴量を用いてReal AdaBoost識別器を構築し,人の識別を行う.検出時には三次元実空間における検出ウィンドウのラスタスキャンをすることで,人の大きさに合わない検出ウィンドウを削除して,高速化を実現する.三次元実空間におけるMean-Shiftクラスタリングにより人と識別された検出ウィンドウを統合することで,人がどこにいるかを自動的に検出することができる.評価実験の結果,誤検出率5.0%において検出率98.9%となり,HOG特徴量を用いた従来法と比較して4.9%検出率を向上させることができた.また,提案手法は約10fpsでリアルタイムに人検出が可能であることを確認した.
著者
松島 千佳 山内 悠嗣 山下 隆義 藤吉 弘亘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.8, pp.1172-1182, 2011-08-01

本論文では,物体検出に有効なHOG特徴量のメモリ量を削減するために,Relational HOG特徴量とワイルドカードを用いたバイナリーのマスキングを提案する.HOGは,人検出に有効な特徴量であるが,局所領域に着目しているため高次元な特徴量である.そこで,本論文では特徴量の情報量を削減するために,二つの局所領域から抽出したHOG特徴量の大小関係によりバイナリーパターン化するR-HOG特徴量を提案する.これにより,局所領域間の関係性を捉えたバイナリーパターンを作成することが可能であるが,R-HOG特徴量には識別に不必要なバイナリーが含まれる.そこで,Real AdaBoostを用いて学習する際に,“0”と“1”の二つのバイナリーを許容するワイルドカード(*)を導入することにより,識別に悪影響を及ぼす一部のバイナリーを観測しないようにマスキングする.評価実験の結果より,提案手法はメモリ量を削減したにもかかわらず,従来法であるHOG特徴量の検出性能と同程度以上であることを確認した.
著者
三井 相和 山内 悠嗣 藤吉 弘亘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J92-D, no.9, pp.1591-1601, 2009-09-01

本論文では,複数のHistograms of Oriented Gradients(HOG)特徴量を2段階に構築したBoostingにより組み合わせたJoint特徴量による特定対象(例えば人や車両)の物体検出法を提案する.近年,統計的学習手法と局所領域より得られるlow-level特徴量を組み合わせた物体検出法に関する研究が多く取り組まれている.本手法では,複数のlow-level特徴量であるHOG特徴量をReal AdaBoostにより組み合わせることでJoint特徴量を自動生成する.Joint特徴量は,複数のセル間のHOG特徴量の共起を表現し,1段階目のReal AdaBoostにより組み合わせる.このため,単一のHOG特徴量のみではとらえることのできない物体の対称的な形状や連続的なエッジをとらえることが可能となる.次に,生成されたJoint特徴量のプールを入力とした2段階目のReal AdaBoostによって最終識別器を構築する.これにより,識別に有効なJoint特徴量のみを選択するため,高精度な検出が可能となる.本論文では,提案手法の有効性を確認するために,検出対象を人と車両として,評価実験により提案手法の有効性を示す.また,提案手法ではHOG特徴量同士のみでなく異なるlow-level特徴量間での組合せも可能である.本論文では,歩行者のアピアランスを表すHOG特徴量と,動きを表す時空間特徴であるPSA特徴量との共起を表現することで,効果的な識別器を構築することが可能となることを示す.
著者
松島 千佳 山内 悠嗣 山下 隆義 藤吉 弘亘
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2009-CVIM-167, no.32, pp.1-8, 2009-06-02

本稿では,人検出のための Real AdaBoost に基づく HOG 特徴量の効率的な削減法を提案する.提案手法は,人検出において用いられる HOG 特徴量をバイナリパターン化することにより,特徴量数の削減を行い,必要なメモリ量を抑制することが可能となる.しかし,バイナリパターン化することにより,識別時に用いる確率密度分布が疎になる問題が発生する.そこで,学習時に Real AdaBoost を用いてバイナリパターンの統合を行い,密な確率密度分布を作成する.提案手法の有効性を確認するために,人の識別実験と処理に必要なメモリ量の比較を行う.その結果,HOG 特徴量と同程度の識別精度を維持し,処理に必要なメモリ量を削減することができた.
著者
藤吉 弘亘 梅崎 太造 今村 友彦 金出 武雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.6, pp.1627-1634, 1997-06-25
被引用文献数
19

本論文では, ナンバープレートの重心位置を出力するように学習させたニューラルネットワークを使用して, プレート領域を抽出する方法を提案し, その有効性を示す. 学習パターンの提示位置は, 乱数で与えられるため, 毎回異なるパターンがニューラルネットワークに学習され, 汎化能力の高いニューラルネットが形成される. 学習パターン中に含まれるナンバープレートの最適学習面積, バンパーとヘッドライト部分の抑制学習による効果, および学習パターンの拡大縮小と濃度値変換による効果について検討する. 地下駐車場で撮影された595台の車に対して評価実験を行った結果, それぞれ98.5%, 98.7%および100%の検出率を得た.
著者
清水 彰一 西尾 和晃 木村 誠 藤吉 弘亘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.11, pp.1909-1918, 2011-11-01

人の行動意図を認識しようとするFirst Person Visionでは,人の状態とその人が何を見ているのかという情報が必要となる.そこで我々は,人の眼球と人の視界映像を同時に取得するInside-Outカメラを提案し,そのカメラの構成を活かした注視点の推定法も提案する.Inside-Outカメラはハーフミラーを介して眼球を正面から,視界映像を眼球と同等の位置から撮影することができる.Inside-Outカメラでは,眼球を撮影した画像から得られる視線ベクトルと視界を撮影した画像から得られる注視点位置の関係を変換式で表すことが可能である.そのため,変換式のパラメータをあらかじめ推定することにより,視線ベクトルから注視点を推定する.評価実験では,指標を注視した際の両眼,両視界映像を撮影し,視界画像の指標位置を真値として視線ベクトルから推定された注視点との誤差を算出した.評価実験から視野角において約1.5度の平均誤差で注視点を推定可能であることを確認した.人間は1点を注視しているとき,注視箇所だけではなく視野角で約2度の範囲がはっきり見えていることが報告されていることから,この範囲を評価基準とすると,提案手法は,十分な精度をもつことが分かる.
著者
藤吉 弘亘
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会技術報告 (ISSN:13426893)
巻号頁・発行日
vol.32, no.35, pp.113-120, 2008-08-21
参考文献数
24

インビジブルロボットは,環境に配置されたカメラ等のセンサ群から刻々と変化する人の状態を認識し,ユーザである人に対して快適な空間をアシストすることが重要な課題である.このようなインビジブルロボットの実現には,特に,人画像解析(People Image Analysis)として,動画像からの人の検出,追跡,顔の検出,顔の部位の追跡,モーション理解が不可欠な技術要素となる.現在までに,固定カメラによる背景差分に基づく人等を対象とした動体検出法は数多く提案されているが,このような動体検出をベースとしたアプローチでは,対象とする動体の検出に失敗すると次段の処理である物体識別が不可能となる問題がある.この問題を解決するアプローチとして,近年のコンピュータの高速化に伴い,画像全体を検出ウィンドウによってラスタスキャンし,low-levelな特徴量と統計的学習手法の組み合わせによる物体検出法が提案されている.本稿では,インビジブルロボットのためのビデオ解析として,VSAMプロジェクトで開発された動画像理解アルゴリズムと,その実用化例について紹介する.また,人画像解析のための新しいアプローチとして,検出ウィンドウのラスタスキャンベースによる人検出法とモーション解析についても紹介する.
著者
西 貴行 藤吉 弘亘 梅崎 太造
出版者
The Institute of Electrical Engineers of Japan
雑誌
電気学会論文誌. C, 電子・情報・システム部門誌 = The transactions of the Institute of Electrical Engineers of Japan. C, A publication of Electronics, Information and System Society (ISSN:03854221)
巻号頁・発行日
vol.124, no.12, pp.2433-2438, 2004-12-01

In archiving video for surveillance, frame-based coding has been used and it makes storage size large because the whole image is stored even if there is no object in the image. On the other hand, object-based coding has the capability to make storage size small, because it distinguishes between the foreground and the background regions of the image, and stores only foreground objects such as people. This paper describes object-based coding by pixel state analysis. In our method, pixel state analysis detects the foreground objects and background regions in video frames. Furthermore, it distinguishes foreground object pixels as <i>stationary</i> or <i>transient</i> pixels. For <i>stationary</i> pixels, it is possible to restore the color intensity by refering to the same pixel location in the last frame. Therefore, our method makes the storage size smaller. Additionally, the <i>transient</i> pixels of foreground objects are compressed using LZH codec. Since LZH codec uses lossless compression, the object region can be compressed with lesser loss in image quality. We have evaluated our method over 9 test sequences and obtained an improvement of 15% in compression ratio and better quality for the moving parts of the object region compared to MPEG-4.
著者
篠木 雄大 藤吉 弘亘
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会誌 : 映像情報メディア (ISSN:13426907)
巻号頁・発行日
vol.63, no.2, pp.209-215, 2009-02-01
被引用文献数
1

Personal video sharing services such as YouTube have become popular because videos can easily be recorded in high-definition (HD) using a personal camcorder. However, it is difficult to broadcast an HD video via the Internet due to the large amount of data involved. We describe a method for generating videos with virtual camerawork based on object tracking technology. Once the user specifies the positions of the region of interest (ROI) on keyframes, our method can be used to generate virtual camerawork between two keyframes in a row based on the results of bi-directional tracking. We evaluated our method with subjective experiments that demonstrate its effectiveness.
著者
都築 勇司 藤吉 弘亘 金出 武雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.1, pp.101-108, 2007-01-12
被引用文献数
23

本稿では,特徴点追跡法について述べる.提案手法は,回転・スケール変化・照明変化による画像の変化に不変なSIFT(Scale Invariant Feature Transform)特徴量を用い,Mean-Shift探索により追跡を行う.評価実験により,回転やスケール変化を含む対象物体の移動に対しても追跡可能であることを確認した.また,追跡結果の表現法として,追跡点をセグメンテーションすることなく動線を表現する方法について述べる.点の移動方向と密度により表示する色を決めることで,移動の方向と頻度を表現する.本手法により,長時間に及ぶ人の追跡結果をビジュアライゼーションし,移動の流れが表現されていることを示す.This paper presents a method of point feature tracking using SIFT(Scale Invariant Feature Transform).Our approach uses the Mean-Shift searching to track a point based on the information obtained by SIFT. Since the SIFT feature is invariant to changes caused by the rotation, scaling, and illumination, we can obtain higher tracking performance than the conventional approach. Using the trajectory of the points obtained by the proposed method, it is possible to visualize the traffic line of pedestrians.