- 著者
-
柳井 啓司
- 出版者
- 社団法人人工知能学会
- 雑誌
- 人工知能学会誌 (ISSN:09128085)
- 巻号頁・発行日
- vol.19, no.1, 2004-01-01
なぜ「ライオン」画像はライオンなのか?「トラ」画像はトラなのか?現在においても「人間の顔」などの特定の対象以外の一般的な画像の分類・認識はまったく実現されていない.本論文では,実世界画像のもつ二つの困難な問題(1)多数の種類の物体が存在しており,物体の種類によって適する認識方法,モデル表現が異なる,(2)単一種類の物体でもさまざまな個体が存在し,画像中に現れる見え方が多様である,に対して,それぞれシステム構成法と認識方法の観点から行った研究について述べる.(1)の問題に対しては,従来の画像認識の研究で多数提案されている特定種類の物体に対する認識手法と知識表現を統合して対処することとし,そのためのマルチエージェントによる画像認識システムの構築法を提案する.システムは単一種類の物体のみを認識する独立した認識システムの集合体として構築する.最終的な認識結果はエージェント間の相互作用によって求める.また,物体間の定性的な位置関係に関する推論機構を導入し複雑な画像の認識を可能とし,エージェント間の相互作用によるスケール選択を可能としたマルチエージェント多重解像度画像認識システムの実現も行う.(2)の問題に対して,単一種類の物体の画像中でのさまざまな現れ方に対応するために,多数の学習画像をWWW(World-Wide Web)から自動収集し,自動的に画像認識のための知識ベースを構築する方法「Web画像マイニングによる一般画像分類」を提案する.まず,実世界画像を大量にしかも手軽に収集する方法として,WWWから自動的に大量の実世界画像を収集する方法について提案する.次に,自動収集した実世界画像をクラス既知の学習画像として,実世界画像に対する認識を行うことを提案する.この手法によって,単語入力のみで画像に関する知識をまったく与えることなく,一般画像の画像分類が実現できる.