著者
岡谷 貴之
出版者
一般社団法人 日本ロボット学会
雑誌
日本ロボット学会誌 (ISSN:02891824)
巻号頁・発行日
vol.33, no.2, pp.92-96, 2015 (Released:2015-04-15)
参考文献数
9
被引用文献数
10
著者
土斐崎 龍一 飯場 咲紀 岡谷 貴之 坂本 真樹
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.1, pp.124-137, 2015-01-06 (Released:2015-01-06)
参考文献数
51
被引用文献数
1 1

With the widespread use of online shopping in recent years, consumer search requests for products have become more diverse. Previous web search methods have used adjectives as input by consumers. However, given that the number of adjectives that can be used to express textures is limited, it is debatable whether adjectives are capable of richly expressing variations of product textures. In Japanese, tactile and visual textures are easily and frequently expressed by onomatopoeia, such as ``fuwa-fuwa'' for a soft and light sensation and ``kira-kira'' for a glossy texture. Onomatopoeia are useful for understanding not only material textures but also a user's intuitive, sensitive, and even ambiguous feelings evoked by materials. In this study, we propose a system to rank FMD images corresponding to texture associated with Japanese onomatopoeia based on their symbolic sound associations between the onomatopoeia phonemes and the texture sensations. Our system quantitatively estimates the texture sensations of input onomatopoeia, and calculates the similarities between the users' impressions of the onomatopoeia and those of the images. Our system also suggests the images which best match the input onomatopoeia. An evaluation of our method revealed that the best performance was achieved when the SIFT features, the colors of the images, and text describing impressions of the images were used.
著者
植芝 俊夫 岡谷 貴之 佐藤 智和
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2005, no.18(2004-CVIM-148), pp.1-18, 2005-03-03

カメラキャリブレーションについて,特にその幾何学的側面に絞って最近の主要な研究のサーベイを行う.準備として,本稿で必要とされる射影幾何の基礎事項の解説の後,透視投影カメラモデルを導入してその射影空間における振る舞いについて述べる.そして,このモデルに基づくキャリブレーション方法として,参照物体を利用する方法とそれを利用しないセルフキャリブレーションに分類して様々なアルゴリズムを紹介する.さらにバンドル調整による推定パラメータの高精度化に言及し,最後に透視投影に従わないレンズ歪みのモデル化とその校正について述べる.
著者
岡谷 貴之 出口 光一郎
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.41, no.1, pp.92-100, 2000-01-15

陰影から形状を復元する問題は1階の偏微分方程式として定式化される.解法には古典的な特性方程式による方法のほかに,等高線の発展によって解を計算する方法がある.従来のやり方ではランバート面が仮定されていた.本論文では,ランバート面に限らない一般の拡散反射を考慮する.等高線に基づく形状復元が可能になるために反射率分布図が満たすべき条件を示す.
著者
田井 政行 関屋 英彦 岡谷 貴之 中村 聖三 清水 隆史
出版者
公益社団法人 土木学会
雑誌
AI・データサイエンス論文集
巻号頁・発行日
vol.2, no.2, pp.378-385, 2021

<p>耐候性鋼橋梁の点検・診断は,防食機能の劣化状態の判定に基づき行われており,その判定には外観評点法が用いられる.しかしながら,外観評点法により的確な評価を行うためには,相応の経験を要するが,昨今の人材不足や点検費用の確保などの課題があり,簡易かつ精度が高い評価手法の確立が求められている.本研究では,耐候性鋼橋梁のさび近接画像と既存の CNNモデルを活用し,外観評点の識別精度について検討を行った.また,識別精度に及ぼす学習・検証用近接画像の画像サイズの影響についても検討を行った.その結果,VGG19及び SEnetの CNNモデルが高い識別精度を示した.また,入力画像サイズが大きいほど識別精度が向上することを明らかにした.さらに,学習と検証に用いた画像の解像度が異なる場合,識別精度が低下する傾向があることを示した. </p>
著者
白川悠太 岡谷貴之
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2013-CVIM-187, no.30, pp.1-6, 2013-05-23

ディープラーニングの方法は,画像認識の様々なベンチマークテストにおいてよい結果を残しているが,それらは主に畳込みニューラルネットワークを用いた教師あり学習によるものである.一方,画像を学習対象とした無教師学習,特に全結合型の多層ネットワークを用いたものは,必ずしもベンチマークテストで注目されるような結果は残していない.本論文では,ディープボルツマンマシンを用いた多層ネットワークの無教師学習により,線画の生成モデルを学習し線画の欠損修復を行う方法を述べる.その上で自由度を揃え単層のモデルと比較し,全結合型の多層ネットワークの有効性について比較実験を行う.
著者
岡谷 貴之
出版者
一般社団法人 映像情報メディア学会
雑誌
映像情報メディア学会誌 (ISSN:13426907)
巻号頁・発行日
vol.68, no.6, pp.466-471, 2014 (Released:2016-07-30)
参考文献数
17
被引用文献数
3 4
著者
岡谷 貴之
出版者
東京大学大学院工学系研究科計数工学専攻
巻号頁・発行日
1999-03-29

報告番号: 甲14272 ; 学位授与年月日: 1999-03-29 ; 学位の種別: 課程博士 ; 学位の種類: 博士(工学) ; 学位記番号: 博工第4398号 ; 研究科・専攻: 工学系研究科計数工学専攻
著者
岡谷 貴之
出版者
情報処理学会
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.37, pp.1-16, 2009-06-02
被引用文献数
4

バンドルアジャストメントは,画像から幾何学的なモデルのパラメータを推定する問題において,高い推定精度の達成を目指して,非線形最適化を数値的に-それが大規模なものになっても避けることなく-実行する方法である.本稿では,このバンドルアジャストメントを解説する.具体的には,数値計算の基本的アルゴリズムと実装方法,統計的推測としての理論的背景,そして座標選択に関わるゲージの自由度についてそれぞれ述べる.また,時系列の観測に対するオンライン推定を実現するための再帰的計算方法についても述べる.Bundle adjustment is a general method for the problem of estimating parameters of a geometric model from images. It is characterized by that nonlinear optimization is numerically performed to attain high estimation accuracy, even if the size of the optimization is very large. In this article I present a tutorial on this method. Specifically, I describe basic numerical algorithms with their implementation techniques, theoretical grounds in terms of statistical inference, and gauge freedom associated with the choice of a coordinate system. Moreover, I present a method for recursive computation that realizes online estimation for time series observations.
著者
岡谷 貴之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理
巻号頁・発行日
vol.2015, no.11, 2015-05-18

一枚の画像からそこに写る物体の名前を答える物体カテゴリ認識は,コンピュータビジョンの長年の課題であったが,ディープラーニングの登場,正確には畳込みニューラルネットの 「再発見」 により大きく進展し,人の視覚と比肩するほどまでになった.一方,その他の多くの画像認識のタスク,例えば特定の物体を画像中で位置決めする 「物体検出」 や,人のポーズ認識,さらには動画像を使った人の行動認識に対しては,物体カテゴリ認識ほどはディープラーニングは成功していない.従来法を超えるという意味では一定の有効性が確認されているものの,これらのタスクでの性能は,人の視覚まではまだ相当の隔たりがある.また,物体カテゴリ認識あるいはその類似タスクに極めて高い精度を発揮する畳込みニューラルネットだが,なぜそんなに高い性能が出るのかの理解が追い付いていない.本講演では,この辺りの現状についてまとめ,今後を占うことを試みたい.
著者
岡谷貴之 齋藤真樹
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2013-CVIM-185, no.18, pp.1-17, 2013-01-16

ディープラーニングは,多層のニューラルネットワーク(以下NN)を用いる機械学習の方法論である.最近,これに基づく方法群が,画像認識のベンチマークテストで従来の記録を次々に塗り替えた他,音声認識やその他の学習・認識の問題に応用されて同様に高い性能を示すに至り,幅広い関心を集めつつある.本稿では,このディープラーニングについて,画像認識への応用を念頭に,現時点で知られている様々な方法をなるべく網羅的に説明する.具体的には,NNの基本構成から,Convolutional NN,プーリング,局所コントラスト正規化,教師なし学習であるプレトレーニング,オートエンコーダ,スパースな特徴表現を可能にする複数の方法,Restricted Boltzmann MachineやDeep Belief Networkなどの生成モデルに基づくディープラーニングの各手法を,それぞれ説明する.またディープラーニングのためのソフトウェアライブラリにも触れる.
著者
岡谷 貴之
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会誌 : 映像情報メディア (ISSN:18816908)
巻号頁・発行日
vol.68, no.6, pp.466-471, 2014-06-01
被引用文献数
4

多層ニューラルネットを用いる機械学習の方法(ディープラーニング)が最近注目を集めており,画像や音声の認識などの難問を解決し得る有力な方法として期待されている.本解説では,ニューラルネットの基礎から始め,過学習の克服を可能にし今の研究ブームのきっかけを作ったプレトレーニングと,さらには画像認識で本命視される畳込みネットワークについて述べる.
著者
岡谷貴之著
出版者
講談社
巻号頁・発行日
2015
著者
岡谷 貴之
出版者
東北大学
雑誌
基盤研究(B)
巻号頁・発行日
2010

カメラで撮影した画像を元に,撮影対象の3次元形状をはじめとする幾何学情報を推定する問題について,その理論上最も高精度な方法を探求し,その応用を開拓した.研究成果は,行列因子分解の数値計算法,プロジェクタカメラシステムの校正法,高精度平面追跡法,車載カメラを用いた市街地の時空間モデリングと可視化の方法,車載ステレオカメラの校正法,光学的方法との融合に基づく高精度形状計測,マルコフ確率場の最適化計算法等である.
著者
鳥居 秋彦 岡谷 貴之 延原 章平
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2011-CVIM-176, no.1, pp.1-22, 2011-03-10

多視点画像を使って物体やシーンの3次元形状およびカメラの姿勢を得る問題は,コンピュータビジョンの中心的課題として長い間研究されてきた.活発な研究活動を通じて得られた成果は,ロボット視覚から,CGや拡張現実(AR)を始めとする映像メディア応用まで,様々な形で実社会にフィードバックされている.本稿は,多視点3次元復元の最近の研究動向をサーベイしたもので,大量未整列画像からのSfM,実時間SfM/Visual SLAM,人物の全周囲3次元形状・運動復元の3つのトピックについて述べる.