著者
内田 祐介 山下 隆義
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J102-D, no.3, pp.203-225, 2019-03-01

2012年の画像認識コンペティションILSVRCにおけるAlexNetの登場以降,画像認識においては畳み込みニューラルネットワーク(CNN)を用いることがデファクトスタンダードとなった.ILSVRCでは毎年のように新たなCNNのモデルが提案され,一貫して認識精度の向上に寄与してきた.CNNは画像分類だけではなく,セグメンテーションや物体検出など様々なタスクを解くためのベースネットワークとしても広く利用されてきている.本論文では,AlexNet以降の代表的なCNNの変遷を振り返るとともに,近年提案されている様々なCNNの改良手法についてサーベイを行い,それらを幾つかのアプローチに分類し,解説する.更に,代表的なモデルについて複数のデータセットを用いて学習及び網羅的な精度評価を行い,各モデルの精度及び学習時間の傾向について議論を行う.
著者
山内 悠嗣 山下 隆義 藤吉 弘亘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J96-D, no.9, pp.2017-2040, 2013-09-01

人検出とは,画像中から人が存在する位置と大きさを自動的に求める技術である.人検出は古くから取り組まれてきた顔検出の研究がベースとなっている.近年では多様な見えの変化が生じることから検出が困難とされている人画像に研究対象が遷移している.こうした中で,人検出を難しくする要因を克服するような手法が数多く提案されている.そこで,本論文では人検出を難しくする要因を整理し,この要因を克服するための特徴抽出と統計的学習手法による識別器の二つの観点から手法をサーベイする.また,人検出法を定量的に評価するために利用されている人画像データベースと統一的な評価指標についても紹介する.
著者
箕浦 大晃 平川 翼 山下 隆義 藤吉 弘亘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J105-D, no.5, pp.372-404, 2022-05-01

経路予測は,歩行者や自動車などの移動物体が未来にどのような経路を辿るかを過去の軌跡から予測する技術である.経路予測は古くからベイズモデルやSocial Force Modelを利用して研究されてきたが,Deep Learning (DL)の発展によりConvolutional Neural Network及び,Recurrent Neural Networkを利用した手法に大きく移り変わっている.これらを利用した予測手法は車載カメラ映像視点や俯瞰視点,移動物体の位置情報や物体情報など様々な要素を組み合わせてモデル化することで高精度な経路を予測できる.特に,移動物体間の衝突を避けるインタラクションを考慮することは,多くのアプリケーションで必要となるため近年盛んに研究されている.そこで,本論文ではDLを活用した経路予測手法についてサーベイする.その中でも,インタラクションに着目した予測手法について述べつつ分類する.また,定量的評価のために使用されるデータセット及び,評価指標についても紹介する.更に,代表的なモデルについて複数のデータセットを用いて精度評価を行い,各モデルの精度及び予測結果について議論を行う.
著者
堂前 幸康 川西 亮輔 白土 浩司 原口 林太郎 藤田 正弘 山内 悠嗣 山下 隆義 藤吉 弘亘 秋月 秀一 橋本 学
出版者
一般社団法人 日本ロボット学会
雑誌
日本ロボット学会誌 (ISSN:02891824)
巻号頁・発行日
vol.38, no.1, pp.95-103, 2020 (Released:2020-01-16)
参考文献数
16

We proposed a picking robot system which is apllicable to various mixed items in shelves. The robot has a two-finger gripper which can change the open width of the finger. To determine the position, the pose and the open width when the gripper pick items, we proposed efficient determination algorithm which is based on a RGBD sensor data. In our experiments, 25 items of Amazon Picking Challenge 2015 can be picked well by our proposed system. In this paper, we describe the system, the algorithms and the experimental results.
著者
西行 健太 日向 匡史 田崎 博 木下 航一 長谷川 友紀 山下 隆義 藤吉 弘亘
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.35, no.6, pp.C-K53_1-10, 2020-11-01 (Released:2020-11-01)
参考文献数
24

Driver pose estimation is a key component in driver monitoring systems, which is helpful for driver anomaly detection. Compared with traditional human pose estimation, driver pose estimation is required to be fast and compact for embedded systems. We propose fast and compact driver pose estimation that is composed of ShuffleNet V2 and integral regression. ShuffleNet V2 can reduce computational expense, and integral regression reduce quantization error of heat maps. If a driver suddenly gets seriously ill, the head of the driver is out of view. Therefore, in addition to localizing body parts, classifying whether each body part is out of view is also crucial for driver anomaly detection. We also propose a novel model which can localize and detect each body part of the driver at once. Extensive experiments have been conducted on a driver pose estimation dataset recorded with near infrared camera which can capture a driver at night. Our method achieves large improvement compared to the state-of-the-art human pose estimation methods with limited computation resources. Futhermore, We perform an ablation study of our method which composed of ShuffleNet V2, integral regression, and driver body parts detection. Finally, we show experimental results of each driver action for driver monitoring systems.
著者
上田 磨歩 鈴木 裕利 山下 隆義 板井 陽俊 石井 成郎
雑誌
研究報告コンピュータと教育(CE) (ISSN:21888930)
巻号頁・発行日
vol.2017-CE-139, no.17, pp.1-6, 2017-03-04

著者らは,これまでペア活動によるプログラミングの授業に関して様々な評価,分析,および,改善を行ってきた.本稿では,授業の改善によって確認された学習行動の変化に着目して評価した.具体的には,モデリング,および,プログラミング活動に関する分析の結果について報告する.
著者
長谷川 昂宏 山内 悠嗣 山下 隆義 藤吉 弘亘 秋月 秀一 橋本 学 堂前 幸康 川西 亮輔
出版者
一般社団法人 日本ロボット学会
雑誌
日本ロボット学会誌 (ISSN:02891824)
巻号頁・発行日
vol.36, no.5, pp.349-359, 2018 (Released:2018-07-15)
参考文献数
27

Automatization for the picking and placing of a variety of objects stored on shelves is a challenging problem for robotic picking systems in distribution warehouses. Here, object recognition using image processing is especially effective at picking and placing a variety of objects. In this study, we propose an efficient method of object recognition based on object grasping position for picking robots. We use a convolutional neural network (CNN) that can achieve highly accurate object recognition. In typical CNN methods for object recognition, objects are recognized by using an image containing picking targets from which object regions suitable for grasping can be detected. However, these methods increase the computational cost because a large number of weight filters are convoluted with the whole image. The proposed method detects all graspable positions from an image as a first step. In the next step, it classifies an optimal grasping position by feeding an image of the local region at the grasping point to the CNN. By recognizing the grasping positions of the objects first, the computational cost is reduced because of the fewer convolutions of the CNN. Experimental results confirmed that the method can achieve highly accurate object recognition while decreasing the computational cost.
著者
山内 悠嗣 山下 隆義 藤吉 弘亘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.92, no.8, pp.1125-1134, 2009-08-01
被引用文献数
5 12

本論文では,Boostingに基づく特徴量の共起表現による人検出法を提案する.既に,特徴量間の共起を表現する手法としてAdaBoostにより2値に識別した符号を複数組み合わせる手法が提案され,顔検出においてその有効性が確認されている.しかし,入力特徴がオクルージョンなどの影響によって,どちらのクラスとも言いがたい場合にも2値に識別して共起を表現するため,間違えた符号を組み合わせる問題がある.そこで,弱識別器の出力が連続値であるReal AdaBoostを用いて,出力を演算子によって結合した共起表現による人検出法を提案する.提案手法は,オクルージョンなどの影響を抑制することができるため,高精度な検出が期待できる.評価実験により,従来法と比較して誤検出率5.0%において検出率を約6.8%向上させることができた.
著者
小椋 忠志 MAGASSOUBA Aly 杉浦 孔明 平川 翼 山下 隆義 藤吉 弘亘 河井 恒
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.1Q3GS1105, 2020 (Released:2020-06-19)

生活支援ロボットは,在宅介護労働者の不足に対する有望な解決策である. 一方で,生活支援ロボットの主な制限の1つに,言語を介して自然に相互作用できない点がある. 近年の研究では,data-drivenのアプローチがあいまいな指示の処理に有効であることが示されているものの,大規模なデータセットを必要とすることが多く,その構築は時間と費用を要する. したがって,生活支援ロボットにおける命令文の自動生成手法は,このコストを大幅に削減し,アノテーション作業の負担を軽減することが期待できる. そこで本稿では,入力画像から把持命令文を生成する手法を提案する. 提案手法は,subword-levelの注意機構を持ち,subword embeddingに基づいて文を生成するMultimodal Attention Branchを有する. 実験では,画像キャプショニングに適した4つの標準的な尺度を使用して提案手法とベースライン手法との比較を行った. 実験結果では,提案手法がこれらの尺度においてベースライン手法を上回ることを示した.
著者
五藤 強志 平川 翼 山下 隆義 藤吉 弘亘
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.2J6GS205, 2020 (Released:2020-06-19)

複数のエージェントが存在する場合,自己利益だけを考えてエージェント同士が衝突したり,他エージェントに影響を与えるようなケースが発生する.このようなデッドロックが起きるような環境では,複数エージェントを同時に学習するマルチエージェント強化学習により,他エージェントを考慮しながら行動を行う必要がある. 本研究では,マルチエージェント強化学習に深層学習を導入する際に,単一ネットワークをエージェントごとの複数のブランチに分けて同時学習を行う手法を提案する.これにより,エージェント同士のインタラクションを考慮しつつ,学習を行うことが可能となる. 評価実験では,自動運転環境においてデッドロックが発生するような環境を想定し,各エージェントを個別に学習する従来手法と提案手法を比較する.また,提案手法によってエージェントがどのような行動を獲得したかを可視化し,インタラクションの効果を示す.
著者
松島 千佳 山内 悠嗣 山下 隆義 藤吉 弘亘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.8, pp.1172-1182, 2011-08-01

本論文では,物体検出に有効なHOG特徴量のメモリ量を削減するために,Relational HOG特徴量とワイルドカードを用いたバイナリーのマスキングを提案する.HOGは,人検出に有効な特徴量であるが,局所領域に着目しているため高次元な特徴量である.そこで,本論文では特徴量の情報量を削減するために,二つの局所領域から抽出したHOG特徴量の大小関係によりバイナリーパターン化するR-HOG特徴量を提案する.これにより,局所領域間の関係性を捉えたバイナリーパターンを作成することが可能であるが,R-HOG特徴量には識別に不必要なバイナリーが含まれる.そこで,Real AdaBoostを用いて学習する際に,“0”と“1”の二つのバイナリーを許容するワイルドカード(*)を導入することにより,識別に悪影響を及ぼす一部のバイナリーを観測しないようにマスキングする.評価実験の結果より,提案手法はメモリ量を削減したにもかかわらず,従来法であるHOG特徴量の検出性能と同程度以上であることを確認した.
著者
松島 千佳 山内 悠嗣 山下 隆義 藤吉 弘亘
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2009-CVIM-167, no.32, pp.1-8, 2009-06-02

本稿では,人検出のための Real AdaBoost に基づく HOG 特徴量の効率的な削減法を提案する.提案手法は,人検出において用いられる HOG 特徴量をバイナリパターン化することにより,特徴量数の削減を行い,必要なメモリ量を抑制することが可能となる.しかし,バイナリパターン化することにより,識別時に用いる確率密度分布が疎になる問題が発生する.そこで,学習時に Real AdaBoost を用いてバイナリパターンの統合を行い,密な確率密度分布を作成する.提案手法の有効性を確認するために,人の識別実験と処理に必要なメモリ量の比較を行う.その結果,HOG 特徴量と同程度の識別精度を維持し,処理に必要なメモリ量を削減することができた.