著者
内田 祐介 山下 隆義
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J102-D, no.3, pp.203-225, 2019-03-01

2012年の画像認識コンペティションILSVRCにおけるAlexNetの登場以降,画像認識においては畳み込みニューラルネットワーク(CNN)を用いることがデファクトスタンダードとなった.ILSVRCでは毎年のように新たなCNNのモデルが提案され,一貫して認識精度の向上に寄与してきた.CNNは画像分類だけではなく,セグメンテーションや物体検出など様々なタスクを解くためのベースネットワークとしても広く利用されてきている.本論文では,AlexNet以降の代表的なCNNの変遷を振り返るとともに,近年提案されている様々なCNNの改良手法についてサーベイを行い,それらを幾つかのアプローチに分類し,解説する.更に,代表的なモデルについて複数のデータセットを用いて学習及び網羅的な精度評価を行い,各モデルの精度及び学習時間の傾向について議論を行う.
著者
山内 悠嗣 山下 隆義 藤吉 弘亘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J96-D, no.9, pp.2017-2040, 2013-09-01

人検出とは,画像中から人が存在する位置と大きさを自動的に求める技術である.人検出は古くから取り組まれてきた顔検出の研究がベースとなっている.近年では多様な見えの変化が生じることから検出が困難とされている人画像に研究対象が遷移している.こうした中で,人検出を難しくする要因を克服するような手法が数多く提案されている.そこで,本論文では人検出を難しくする要因を整理し,この要因を克服するための特徴抽出と統計的学習手法による識別器の二つの観点から手法をサーベイする.また,人検出法を定量的に評価するために利用されている人画像データベースと統一的な評価指標についても紹介する.
著者
上田 磨歩 鈴木 裕利 山下 隆義 板井 陽俊 石井 成郎
雑誌
研究報告コンピュータと教育(CE) (ISSN:21888930)
巻号頁・発行日
vol.2017-CE-139, no.17, pp.1-6, 2017-03-04

著者らは,これまでペア活動によるプログラミングの授業に関して様々な評価,分析,および,改善を行ってきた.本稿では,授業の改善によって確認された学習行動の変化に着目して評価した.具体的には,モデリング,および,プログラミング活動に関する分析の結果について報告する.
著者
長谷川 昂宏 山内 悠嗣 山下 隆義 藤吉 弘亘 秋月 秀一 橋本 学 堂前 幸康 川西 亮輔
出版者
一般社団法人 日本ロボット学会
雑誌
日本ロボット学会誌 (ISSN:02891824)
巻号頁・発行日
vol.36, no.5, pp.349-359, 2018 (Released:2018-07-15)
参考文献数
27

Automatization for the picking and placing of a variety of objects stored on shelves is a challenging problem for robotic picking systems in distribution warehouses. Here, object recognition using image processing is especially effective at picking and placing a variety of objects. In this study, we propose an efficient method of object recognition based on object grasping position for picking robots. We use a convolutional neural network (CNN) that can achieve highly accurate object recognition. In typical CNN methods for object recognition, objects are recognized by using an image containing picking targets from which object regions suitable for grasping can be detected. However, these methods increase the computational cost because a large number of weight filters are convoluted with the whole image. The proposed method detects all graspable positions from an image as a first step. In the next step, it classifies an optimal grasping position by feeding an image of the local region at the grasping point to the CNN. By recognizing the grasping positions of the objects first, the computational cost is reduced because of the fewer convolutions of the CNN. Experimental results confirmed that the method can achieve highly accurate object recognition while decreasing the computational cost.
著者
山内 悠嗣 山下 隆義 藤吉 弘亘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.92, no.8, pp.1125-1134, 2009-08-01
被引用文献数
5 12

本論文では,Boostingに基づく特徴量の共起表現による人検出法を提案する.既に,特徴量間の共起を表現する手法としてAdaBoostにより2値に識別した符号を複数組み合わせる手法が提案され,顔検出においてその有効性が確認されている.しかし,入力特徴がオクルージョンなどの影響によって,どちらのクラスとも言いがたい場合にも2値に識別して共起を表現するため,間違えた符号を組み合わせる問題がある.そこで,弱識別器の出力が連続値であるReal AdaBoostを用いて,出力を演算子によって結合した共起表現による人検出法を提案する.提案手法は,オクルージョンなどの影響を抑制することができるため,高精度な検出が期待できる.評価実験により,従来法と比較して誤検出率5.0%において検出率を約6.8%向上させることができた.
著者
松島 千佳 山内 悠嗣 山下 隆義 藤吉 弘亘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.8, pp.1172-1182, 2011-08-01

本論文では,物体検出に有効なHOG特徴量のメモリ量を削減するために,Relational HOG特徴量とワイルドカードを用いたバイナリーのマスキングを提案する.HOGは,人検出に有効な特徴量であるが,局所領域に着目しているため高次元な特徴量である.そこで,本論文では特徴量の情報量を削減するために,二つの局所領域から抽出したHOG特徴量の大小関係によりバイナリーパターン化するR-HOG特徴量を提案する.これにより,局所領域間の関係性を捉えたバイナリーパターンを作成することが可能であるが,R-HOG特徴量には識別に不必要なバイナリーが含まれる.そこで,Real AdaBoostを用いて学習する際に,“0”と“1”の二つのバイナリーを許容するワイルドカード(*)を導入することにより,識別に悪影響を及ぼす一部のバイナリーを観測しないようにマスキングする.評価実験の結果より,提案手法はメモリ量を削減したにもかかわらず,従来法であるHOG特徴量の検出性能と同程度以上であることを確認した.
著者
松島 千佳 山内 悠嗣 山下 隆義 藤吉 弘亘
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2009-CVIM-167, no.32, pp.1-8, 2009-06-02

本稿では,人検出のための Real AdaBoost に基づく HOG 特徴量の効率的な削減法を提案する.提案手法は,人検出において用いられる HOG 特徴量をバイナリパターン化することにより,特徴量数の削減を行い,必要なメモリ量を抑制することが可能となる.しかし,バイナリパターン化することにより,識別時に用いる確率密度分布が疎になる問題が発生する.そこで,学習時に Real AdaBoost を用いてバイナリパターンの統合を行い,密な確率密度分布を作成する.提案手法の有効性を確認するために,人の識別実験と処理に必要なメモリ量の比較を行う.その結果,HOG 特徴量と同程度の識別精度を維持し,処理に必要なメモリ量を削減することができた.