著者
橋本 敦史 井上 中順 牛久 祥孝 濱屋 政志 松原 崇充 森 信介 VON・DRIGALSKI FELIX
出版者
オムロンサイニックエックス株式会社
雑誌
基盤研究(A)
巻号頁・発行日
2021-04-05

生産年齢人口が減少する中,ロボットの産業活用は喫緊の課題である.ロボットによる作業代替を低コストで実現する方法として言語指示の活用が注目されている.しかし,「言語指示→ロボット制御」の従来型演算モデルは特定の作業に特化したものとなってしまっている.本研究では,多様な作業を対象とした汎用的な演算モデルを提案・検証する.言語・映像資源が豊富な調理を対象とし,サラダなどの比較的簡単な料理を言語指示に従って調理するロボットを最終年度までに実現することでコンセプト実証を目指す.
著者
上嶋 勇祐 井上 中順 篠田 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.112, no.441, pp.185-190, 2013-02-14

この研究では、大量のインターネット映像の中から、対象のイベントを検出するイベント検出を目的とする。ここでの「イベント」は、「誕生日会」や「乗り物のタイヤ交換」など、いくつかの動作や物体の組み合わせで構成される事象を指す。イベント検出を対象とした多くの研究では、局所特徴抽出と特徴量のモデル化による手法が用いられている。特徴量の中でも、動作を表す時空間特徴量がイベント検出に効果的であることが示されているが、カメラの動きに対して頑健でないという問題がある。本論文では、この問題に対し、オプティカルフローによるカメラの動き推定とその補正を適用した時空間特徴量を提案する。この特徴量を含む、相補的な特徴量をそれぞれGMM supervectorによってモデル化し、SVMの入力として用いることでイベント検出を行う。TRECVID2012 Multimedia Event Detectionタスクで、Mean Normalized Detection Cost O.5296となり、参加17機関中3番目の精度であった。
著者
篠田 浩一 井上 中順 岩野 公司 宇都 有昭
出版者
東京工業大学
雑誌
基盤研究(B)
巻号頁・発行日
2019-04-01

音声に関する音声認識、音声合成、話者認識などの様々なタスクを担当するエージェントが互いに競争・協調・調整しながら個々のタスクを学習する、マルチエージェントによる深層学習基盤を構築する。個々のタスクに関わる音声因子の間の含有・排他・共有などの関係を用いて音声データを因子分解することにより、個々のタスクの性能を高める。マルチタスク学習に比べ、少量・非均一のデータでより高い性能を得ることを目標とする。
著者
片岡 裕雄 中村 明生 井上 中順 前田 英作
出版者
国立研究開発法人産業技術総合研究所
雑誌
基盤研究(A)
巻号頁・発行日
2019-04-01

2010年代になり画像認識の精度が飛躍的に向上したことで「自然画像とは何だろうか?」そして「その画像カテゴリとは?」という問いがより重要になっている。本研究課題では自然の形成原理に即し能動的に生成した画像パターンとその画像カテゴリを教師ラベルとした機械学習方法を網羅的に探索することで両者の問いに迫る。さらに、従来の画像認識で問題とされていた人手による膨大な画像ダウンロードや画像カテゴリ付与が不要であるだけでなく、個人情報保護法や著作権法などに依らず大規模画像データベースを構築可能である。
著者
井上 中順 斉藤 辰彦 篠田 浩一 古井 貞煕
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.12, pp.2633-2644, 2010-12-01

本研究では,映像の中から「飛行機」や「歌っている人」といった高次特徴を検出するタスクに対し,SIFT特徴とMFCC特徴の混合ガウス分布(GMM)を用いた統計的手法を提案する.検出手法には,話者認識などで用いられてきたゆう度比による検出と,GMM Supervector SVM (GS-SVM)による検出の二つを用いる.ゆう度比による検出では,高次特徴が出現する部分としない部分のGMMをそれぞれ学習し,二つのモデルから得られるゆう度の比をもとに高次特徴を検出する.GS-SVMでは,各ショットに対するGMMを求め,GMM間の距離から定義されるRBFカーネルを用いたSVMで学習・識別を行う.最後に,各手法から対数ゆう度比を求め,その重み付き和により手法の融合を行う.TRECVID2009のデータセットを用いて評価実験を行った結果,Mean Average PrecisionはSIFT特徴とGS-SVMを用いた場合の0.141から,融合手法により0.173まで向上した.