著者
黄瀬 浩一 岩村 雅一 馬場口 登
出版者
大阪府立大学
雑誌
基盤研究(B)
巻号頁・発行日
2007

あたかも物体そのものにハイパーリンクが張られているように,カメラで物体を撮影(クリック)すると,その物体の関連情報が取得できたり,また撮影した画像を介してその物体の関連情報を登録できれば,高齢者や障害者にも優しい実世界指向インタフェースが実現できる.本研究では,100万枚の平面物体,55個の小型立体物,関東および関西の歴史的な建物,および2万ページの文書を対象として,大規模高速認識・検索技術を構築することにより,この目的を実現した.
著者
黄瀬浩一 百田 賢一 杉山 淳一 馬場口 登 手塚慶一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.34, no.8, pp.1716-1730, 1993-08-15
被引用文献数
5

印刷文書こ記録された情報を計算機を介して有効利用するためには、文書中の文字を認識し、論理構造により構造化するという文書画像理解が不可欠となる。一般に、文書の論理構造は、章、節などの論理オブジェクトの木構造として表現され、文書のレイアウトとともに、コンテントとも深い関連性を持つものである。したがって、文書画像理解のロバスト性を向上させるためには、いずれか一方ではなく、両者を知識として蓄え、協調的に使用することが望ましい。本論文では、仮説駆動型の処理戦略の導入により、この目標の達成を試みる。本手法では、まず文書のレイ・アウトに関する知識を用いて、論理オブジェクトの領域を抽出する。ここで、抽出結果に複数の可能性が残る場合には、互いに矛盾する仮説として生成する。生成された仮説は、依存関係を保持する依存関係データベースにより記録・管理され、処理の制御に使用される。また、処理の途中で発見された仮説の矛盾は矛盾データベースに記録され、探索空間の削減に用いられる、次に仮説の依存関係、矛麿を考慮しつつ、コンテントに関する知識を用いて仮説を検証する。本手法では、単語の接続性、単語列の矛盾という二つの概念を導入し、知識を表現する。縦書き名刺100枚を対象とした仮説生成検証実験から、文字の摘出率93.0%、論理オブジェクトの抽出率92.6%、コンテントの同定率86.8%を得、本手法の有効性を確認した。
著者
黄瀬 浩一 大町 真一郎 内田 誠一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. TL, 思考と言語 (ISSN:09135685)
巻号頁・発行日
vol.104, no.740, pp.85-90, 2005-03-11
被引用文献数
2

デジタルカメラの小型化, 高解像度化, 一般化に伴い, これを入力手段として用いた文字認識・文書画像解析への期待が高まりつつある.本稿では, デジタルカメラを用いた文字認識・文書画像解析について現在の代表的な技術を俯瞰するとともに, バーコードなどの関連技術との比較によって, 文字認識, 文書画像解析の立場や将来への課題を浮き彫りにする.また, 将来に向けた試みの一つとして, 著者らが「バーコードリーダ並みに手軽で高精度な文字認識」を目指して行っている研究「複比を用いた文字への情報埋め込み」の一端についても紹介する.
著者
瀬崎 直人 黄瀬 浩一
出版者
The Institute of Electrical Engineers of Japan
雑誌
電気学会論文誌. C, 電子・情報・システム部門誌 = The transactions of the Institute of Electrical Engineers of Japan. C, A publication of Electronics, Information and System Society (ISSN:03854221)
巻号頁・発行日
vol.129, no.3, pp.475-480, 2009-03-01

In this paper, we propose a system for recommending tags of images. The proposed method presents to its user various tags with high precision by taking into account both the co-occurrence of tags and tags of similar images. Additional search with the user feedback enables us to find some new tags relevant to the image of interest. In order to test the proposed method, we compare it with a method based only on the co-occurrence of tags, as well as a method based only on the similarity of images. From the experimental results using 16002 images, we have confirmed that the proposed method is capable of finding more tags as compared to the methods for comparison. We have also confirmed that the additional search is effective to find additional tags.
著者
三宅 弘志 黄瀬 浩一
出版者
一般社団法人情報処理学会
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.29, pp.211-216, 2009-03-06

リンク機能は,インターネットを代表とする電脳世界でしばしば用いられる機能である.実世界に存在するリンク機能について考えてみると,バーコードや RFID 等,物体を手掛かりとして情報を得る技術は存在する.しかし,これらの技術を利用しても情報の登録に手間がかかるため,個人が気軽に使用できるとは言えない.そこで本稿では,個人ユーザが手軽に利用できる,リンク機能を実世界に拡張す るシステムを提案する.本システムには,本稿で述べる考察の結果から得られる条件を満たす物体認識技術を用いる.そして既存技術では実現されていない受動的な情報獲得に対応するために,複数 物体の認識,物体の位置の推定,処理の高速化を行う.個人ユーザがこのシステムを利用する様々な場合を想定した実験を行い,本システムの有用性を確認した.The link function makes the cyber world such as the Internet attractive. Technologies such as bar codes and RFIDs enable us to use the link function for objects in the real world. Although users can follow the links provided by these technologies, they cannot easily make new links; the link function for objects are partially available. In this report, we propose a new system for the full link function for objects. For the better use of the link function, it is also required to find links on objects without pointing them by the camera (passive acquisition of information). The system provides the passive acquisition with the help of multiple object recognition, estimation of object positions, and real-time processing. Experimental results show that users feel that the system is useful for establishing and finding links from objects in the real world.
著者
本道 貴行 黄瀬 浩一
出版者
一般社団法人情報処理学会
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.29, pp.171-176, 2009-03-06

SIFT (Scale-Invariant Feature Transform) などの局所特徴量を用いて,大規模特定物体認識を行う場合には,データベースに保持しておく局所特徴量 (特徴ベクトル) の数が増大する.そのため,メモリ容量の削減が課題となる.本稿では,局所特徴量のベクトル量子化の手法と,取捨選択の方法によって,メモリ容量の削減を試みる.実験の結果,ベクトル量子化では,好ましい結果は得られなかった.一方,局所特徴量の取捨選択では,スケール耐性を犠牲にすることにはなるものの,入力画像のスケールがおおよそ決まっていれば,無削減のデータベースの 1/10程度にしても,認識率はほとんど変化しないことが分かった.In case of conducting large-scale specific objects recognition using local features such as SIFT, the number of local features increases. Hence, reduction of the memory utilization is an important issue. In this report, we attempt memory reduction with two approaches; one is a method using vector quantization, and the other is one using selection of local features. Prom experimental results, we confirm that good results could not be acquired by vector quantization. On the other hand, if we employ feature selection as the method, the recognition rate hardly decreases with a database whose size is 10% of its original.
著者
野口 和人 黄瀬 浩一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.107, no.115, pp.99-104, 2007-06-21

SIFTなどの局所記述子の最近傍探索によって物体認識を行う場合には,一画像あたりの特徴ベクトルの数が膨大になるため,最近傍探索の効率が重要となる.本稿では,「認識に必要な最近傍探索の精度は画像によって異なる」という観点から処理を削減した効率的認識法を提案する.具体的には,近似最近傍探索に基づく識別器を多段階に縦列接続することにより,認識に用いる近似の程度を画像に応じて変更し,大幅な効率化を実現する.一万画像のデータベースを用いた実験の結果,処理時間を,多段階化を行わなかった場合の約1/5,ANNやLSHを近似最近傍探索の手法として用いた場合の約1/40に削減でき,例えば,認識率98%,処理時間1ms/queryを達成できることが分かった.また,12.2%のリジェクトを行うことによって,誤認識率を0.25%に抑えることもできた.
著者
三宅 弘志 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.484, pp.211-216, 2009-03-06

リンク機能は,インターネットを代表とする電脳世界でしばしば用いられる機能である.実世界に存在するリンク機能について考えてみると,バーコードやRFID等,物体を手掛かりとして情報を得る技術は存在する.しかし,これらの技術を利用しても情報の登録に手間がかかるため,個人が気軽に使用できるとは言えない.そこで本稿では,個人ユーザが手軽に利用できる,リンク機能を実世界に拡張するシステムを提案する.本システムには,本稿で述べる考察の結果から得られる条件を満たす物体認識技術を用いる.そして既存技術では実現されていない受動的な情報獲得に対応するために,複数物体の認識,物体の位置の推定,処理の高速化を行う.個人ユーザがこのシステムを利用する様々な場合を想定した実験を行い,本システムの有用性を確認した.
著者
本道 貴行 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.484, pp.171-176, 2009-03-06
被引用文献数
5

SIFT(Scale-Invariant Feature Transform)などの局所特徴量を用いて,大規模特定物体認識を行う場合には,データベースに保持しておく局所特徴量(特徴ベクトル)の数が増大する.そのため,メモリ容量の削減が課題となる.本稿では,局所特徴量のベクトル量子化の手法と,取捨選択の方法によって,メモリ容量の削減を試みる.実験の結果,ベクトル量子化では,好ましい結果は得られなかった.一方,局所特徴量の取捨選択では,スケール耐性を犠牲にすることにはなるものの,入力画像のスケールがおおよそ決まっていれば,無削減のデータベースの1/10程度にしても,認識率はほとんど変化しないことが分かった.