著者
黄瀬浩一 岩村 雅一
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.49, no.9, pp.1082-1089, 2008-09-15
参考文献数
22
被引用文献数
8
著者
黄瀬 浩一 大町 真一郎 内田 誠一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.104, no.742, pp.85-90, 2005-03-11
参考文献数
49
被引用文献数
16

デジタルカメラの小型化, 高解像度化, 一般化に伴い, これを入力手段として用いた文字認識・文書画像解析への期待が高まりつつある.本稿では, デジタルカメラを用いた文字認識・文書画像解析について現在の代表的な技術を俯瞰するとともに, バーコードなどの関連技術との比較によって, 文字認識, 文書画像解析の立場や将来への課題を浮き彫りにする.また, 将来に向けた試みの一つとして, 著者らが「バーコードリーダ並みに手軽で高精度な文字認識」を目指して行っている研究「複比を用いた文字への情報埋め込み」の一端についても紹介する.
著者
中居 友弘 黄瀬 浩一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.89, no.9, pp.2045-2054, 2006-09-01
参考文献数
10
被引用文献数
14

本論文では,ディジタルカメラで撮影して得られた文書画像をもとに,データベースから対応する文書画像を見つける文書画像検索の手法を提案する.従来のスキャナを利用した文書画像検索と異なり,ディジタルカメラを利用する場合には射影ひずみなどのディジタルカメラ特有の問題に対処する必要がある.また,大規模データベースでの利用を可能にするため,検索の効率性も重要である.これらの問題に対処するため,本論文では特徴点の局所的配置を特徴量とし,ハッシュ表を用いた投票によって検索する手法を提案する.本手法では,射影ひずみを実用的な範囲に制限し,特徴点の組合せを局所領域に限定することで,計算量の削減を実現する.また,高精度な検索を実現するため,射影変換の不変量である複比で特徴点の配置を表現し,特徴量としている.実験により,10,000ページのデータベースから精度98%,平均処理時間約160ms(特徴点抽出の画像処理に要する約1sを除く)で検索できることが示された.
著者
黄瀬浩一 岩村 雅一
雑誌
情報処理
巻号頁・発行日
vol.49, no.9, pp.1082-1089, 2008-09-15
著者
中居 友弘 黄瀬 浩一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.432, pp.157-162, 2009-02-12
被引用文献数
1

本稿では,デジタルカメラで撮影された,撮影範囲の異なる複数の文書画像をつなぎ合わせるモザイキング法を提案する.デジタルカメラで撮影された文書画像は任意の射影歪みを受けているため,その位置合わせは従来手法では困難なものであった.提案手法では,特徴点に基づく文書画像検索法であるLLAHを利用することで,射影歪みを受けた文書画像の特徴点の対応関係を得て,それに基づいて画像間の変換パラメータを推定して位置合わせを行う.LLAHは射影歪みに対して不変であるため,射影歪みの補正なしに特徴点の対応付けが可能である.実験により,デジタルカメラで撮影された文書画像のつなぎ合わせが可能であることが示された.
著者
浅田 伸彦 岩村 雅一 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.110, no.467, pp.183-188, 2011-03-03

本稿では,環境中のあらゆる文字・単語を認識する「全方位認識」の実現のために,厳しい射影歪みに対応する手法について検討する.我々は実時間認識可能,レイアウトフリー,射影歪みに頑健といった3つの要件を満たすカメラベースの単語認識手法を提案している.この手法は斜め45度から撮影した文字を認識できる頑健さを持つが,前述の全方位認識に際しては,射影歪みに対する更なる頑健性が求められる.そこで本稿では,前述の単語認識手法の文字認識誤りをオープンソースのスペルチェッカであるGNU Aspellを利用して補正する.その際,Aspellが持つ音素の類似性に基づくMetaphoneという仕組みを文字誤認識傾向に基くMetashapeに置き換える.提案手法を用いて実験を行った結果,文字が書かれた紙面に対して撮影角度が20度のときに単語認識精度には最大で約24%から約74%の向上が見られた.
著者
武藤 大志 多田 匡志 岩村 雅一 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CQ, コミュニケーションクオリティ (ISSN:09135685)
巻号頁・発行日
vol.109, no.373, pp.109-114, 2010-01-14

近似最近傍探索は,クエリと最も距離が近い点を探索する最近傍探索の計算時間,メモリ使用量を大幅に削減する手法である.一般に精度,計算時間,メモリ使用量はトレードオフの関係にあり,その関係を解析することは,様々な場面に近似最近傍探索を適用する上で,重要な課題である.本稿では,ハッシュを利用した近似最近傍探索において,文献[1]〜[4]で行われている"隣接バケットを参照する"方策のモデル化を行い,精度とメモリ使用量に関して理論式を求める.そして,実験とシミュレーションにより理論式の妥当性を検証する.
著者
中居 友弘 黄瀬 浩一 岩村 雅一 松本 啓之亮
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.104, no.742, pp.103-108, 2005-03-11
被引用文献数
1

本稿では, デジタルカメラを用いた新しい文書画像検索手法を提案する.提案手法は, デジタルカメラで撮影した文書画像の一部あるいは全部を検索質問として, それを含む文書画像をデータベースから検索するものである.これを実現するためには, 撮影時に生じる射影変換歪みに対処しつつ, 部分的な手がかりでも柔軟に照合する必要がある.この問題に対して, 提案手法では, (1)射影変換の不変量である複比を用いたインデックス付け, (2)ハッシュを用いた投票処理の2特徴により対処する.高解像度デジタルカメラと携帯電話付属のデジタルカメラで撮影した画像を用いた実験により, 提案手法の有効性を検証する.
著者
中居 友弘 黄瀬 浩一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.432, pp.115-120, 2009-02-12
被引用文献数
2

本稿では,さまざまな言語で書かれた文書画像のリアルタイム検索法を提案する.これは,Webカメラで撮影された文書画像を検索質問とし,データベースから元となった文書画像をリアルタイムで検索して提示するものである.我々はすでに英語文書を対象とした文書画像検索法を提案しており,これは従来手法をさまざまな言語の文書に適用できるよう拡張したものである.従来手法である英語文書画像検索法では,画像処理によって得られる単語領域の重心を特徴点としていた.しかし,日本語や中国語を含むいくつかの言語では,言語の特性上識別性の高い特徴点を安定的に得ることが難しい.提案手法では,記述子の追加によってさまざまな言語の文書における高精度なリアルタイム文書画像検索を実現する.
著者
野口 和人 氏原 慎弥 黄瀬 浩一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.484, pp.205-210, 2009-03-06
被引用文献数
1

カメラ付き携帯電話を入力デバイスとした画像認識では,撮影した画像のぶれやぼけが認識精度低下の原因となる.そのため,ぶれやぼけに対処する手法が重要となる.本稿では,局所特徴量の近似最近傍探索による認識手法に対して,原画像に様々がぶれやぼけを与えた画像を生成し学習する生成型学習を導入することによって対処する.生成型学習を導入するにあたって問題となるのは,学習データの増加にともなって最近傍探索に必要なメモリ量と処理時間が増大することである.これは,特に大規模なデータベースを用いた場合に問題となる.提案手法では,多段階化とスカラー量子化によってこれを解決する.1万枚の画像データベースを用いた実験の結果,生成型学習を用いない手法と比べて認識率が12.3%向上することがわかった.
著者
野口 和人 黄瀬 浩一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.92, no.8, pp.1135-1143, 2009-08-01
被引用文献数
5

局所特徴量を用いた特定物体認識において,認識率,処理時間,メモリ量について良いバランスを実現することは重要な問題である.局所特徴量は高い識別性をもつことから,高い認識率を実現することは困難ではないものの,その前提として長い処理時間や大きなメモリ量が要求されるため,大規模化の障害となっている.本論文では,認識率にあまり影響を及ぼすことなく,処理時間やメモリ量を削減する手法について述べる.処理時間の削減については,近似最近傍探索が有効であることを述べるとともに,従来法であるANNと比べて,ハッシュを用いた,より認識に有効な手法を提案する.メモリ量については,局所特徴量を表す特徴ベクトルに対してスカラ量子化を適用することにより,簡単に削減可能であることを示す.10万画像を用いた認識実験の結果,各次元の表現に用いるビット数を16ビットから2ビットに減少させても認識率に影響をほとんど及ぼさないこと,提案手法によって,認識率98.1%,処理時間119.7msを実現可能であることが分かった.また,1万画像を用いたANNとの比較では,同程度の認識率を実現するための処理時間,メモリ量が,それぞれ1/4,1/3であることも確認した.
著者
井上 慶彦 岩村 雅一 黄瀬 浩一
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2018-CVIM-212, no.20, pp.1-6, 2018-05-03

視覚障害者は,晴眼者 (視覚に障害を持たない人) と比べて視覚から得られる情報が限られている.それを補うために,スマートフォンのカメラを用いて物体情報を取得できるような補助アプリもあるが,そもそも知りたい物体の位置を把握すること自体が困難である場合が少なくない.全方位カメラは一度に全方向の情報を取得できることから,対象物にカメラを向ける必要がなく,視覚障害者支援に適していると考えられる.全方位カメラにより周辺画像を取得し,得られた画像に対して物体検出及び認識を行い,音声情報などで視覚障害者にどこに何があるのかを伝えることができるようなシステムが実現できれば,汎用性の高い視覚障害者支援システムとなる.このようなシステムを実現するためには,まず全方位画像に対する正確な物体検出及び認識と,動画において前後フレームで物体情報を保持するためのトラッキングを行う必要がある.全方位カメラから得られる画像は,通常のカメラから得られる画像とは異なった投影方法なので,通常の画像を対象とした物体検出アルゴリズムやトラッキング手法をそのまま適用することは難しい.本稿では物体検出とトラッキングを別々の投影方法で行い,結果を統合することで,全方位画像に対して高精度な物体検出とトラッキングを実現する手法を提案する.
著者
志賀 優毅 内海 ゆづ子 岩村 雅一 カイ クンツェ 黄瀬 浩一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J97-D, no.12, pp.1733-1736, 2014-12-01

読書活動を把握することは,人の知識の質と量の把握につながるため,重要であると考えられている.とりわけ,多くの人の読書活動を長期間に渡って詳細に把握することができれば,これまでにない知見が得られる可能性がある.しかし,読書活動を記録する現在利用可能な方法は手動記録に限られ,現実的に掛けられる手間を考えると,詳細な読書活動の記録には適していない.そこで本論文では,読書活動を自動的に記録,分析するために,ユーザが読んでいる文書を推定する問題を考え,その意義と課題を議論する.
著者
黄瀬 浩一 岩田 基 岩村 雅一 内海 ゆづ子 クンツェ カイ デンゲル アンドレアス 外山 託海
出版者
大阪府立大学
雑誌
基盤研究(A)
巻号頁・発行日
2013-04-01

Knowledge Logとは,人が日々獲得している知識の記録である.従来から存在するライフログとの違いは,Knowledge Logが知識という高次記号情報をログの対象とするのに対して,ライフログは,信号情報あるいは記号であっても単純なもの(例えば人の座る,歩く,食べるなどの行動)を記述する点にある.人の知識の大半は,人の読むという行為によって獲得されていることに着目し,本研究では,読むことに関連した知識のログを中心に,その量や質について推定するための各種手法を構築した.また,その基礎となる特徴照合,文書画像検索,文字,顔,物体などの認識技術,大規模文字画像データベースについても開発した.
著者
近野 恵 岩田 和将 黄瀬 浩一 岩村 雅一 内田 誠一 大町 真一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. HIP, ヒューマン情報処理
巻号頁・発行日
vol.109, no.471, pp.507-512, 2010-03-08

本稿では,我々が開発中のカメラペンシステムで使用する,文書画像検索の精度向上法を提案する.カメラペンシステムとは,カメラを取り付けたペンで書いた印刷文書への筆跡を,デジタルデータとして復元するシステムである.文書画像検索はデータベースから撮影画像の対応範囲を検索することで,筆跡を求める役割を担っており,高精度での検索が必要不可欠である.しかし現状では,撮影画像に生じる射影歪みの影響で検索精度が低下している.そこで,この問題を解決するために,検索に用いる特徴量の改良,および射影歪みを発生させた画像を生成し,データベースを拡張する手法と,撮影画像を基にクエリを拡張して検索する手法の3つを提案する.有効性を検証するため,改良した特徴量と拡張手法をそれぞれ組み合わせ,改良前の従来手法と比較実験を行った.その結果,改良した特徴量を用い,クエリを拡張した手法を用いたときに,最も精度が向上した.
著者
大町 真一郎 岩村 雅一 内田 誠一 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. TL, 思考と言語 (ISSN:09135685)
巻号頁・発行日
vol.105, no.613, pp.67-72, 2006-02-17

環境中の文字をディジタルカメラを入力デバイスとして高精度に認識するために,文字画像と同時に認識補助のための付加情報を提示する方法が検討されている.付加情報は,幾何学的変換に対してロバストに抽出できることが要求される.本報告では,面積比を利用した付加情報提示手法を提案する.面積比はアフィン変換に不変であり,アフィン変換を受けた環境においても誤りなく抽出されることが期待される.実際に付加情報を埋め込んだ文字パターンを作成し,提案手法の有効性と可能性について議論する.
著者
内田 誠一 Liwicki Marcus 岩村 雅一 大町 真一郎 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EMM, マルチメディア情報ハイディング・エンリッチメント (ISSN:09135685)
巻号頁・発行日
vol.111, no.74, pp.17-22, 2011-05-23

手書きは,人類のコミュニケーション手段として古来から広く利用されている.そして現代,タブレットやアノトペンといった技術進歩により,計算機への入力手段としても手書きは普遍的なものとなった.しかし,日常的な「紙の上の手書き」は,依然「紙の上の手書き」のままであり,それ以上の価値を持つに至っていない.これに対し,筆者らによるユニバーサルパターンプロジェクトでは,「情報埋め込みペン」を開発した.これは,情報埋め込み技術により,手書きに新たな価値を付与しようという試みである.このペンでは,ペン先のインクジェットにより,筆記時にリアルタイムに筆記者情報や筆記日時などの任意情報を埋め込むことができる.埋め込んだ情報は画像処理により復元できる.すなわち,紙の上の手書きに,計算機可読な様々な情報を埋め込むことができる.実験により,5cmの筆記に32ビット程度の情報を誤りなく埋め込めることを確認している.
著者
野口 和人 氏原 慎弥 黄瀬 浩一 岩村 雅一
出版者
一般社団法人情報処理学会
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.29, pp.205-210, 2009-03-06

カメラ付き携帯電話を入力デバイスとした画像認識では,撮影した画像のぶれやぼけが認識精度低下の原因となる.そのため,ぶれやぼけに対処する手法が重要となる.本稿では,局所特徴量の近似最近傍探索による認識手法に対して,原画像に様々がぶれやぼけを与えた画像を生成し学習する生成型学習を導入することによって対処する.生成型学習を導入するにあたって問題となるのは,学習データの増加にともなって最近傍探索に必要なメモリ量と処理時間が増大することである.これは,特に大規模なデータベースを用いた場合に問題となる.提案手法では,多段階化とスカラー量子化によってこれを解決する. 1 万枚の画像データベースを用いた実験の結果,生成型学習を用いない手法と比べて認識率が 12.3% 向上することがわかった.For image recognition with a camera phone, defocus and motion-blur cause a serious decrease of the image recognition rate. In this report, we employ generative learning, i.e., generating blurred images and learning based on them, for a recognition method using approximate nearest neighbor search of local features. Major prob- lems of generative learning are long processing time and a large amount of memory required for nearest neighbor search. The problems become serious when we use a large-scale database. In the proposed method, they are sloved by cascading recognizers and scalar quantization. From experimental results with 10,000 images, we have confirmed that the proposed method improves the recogniton rate by 12.3% as compared to a method without generative learning.
著者
黄瀬 浩一 岩村 雅一 岩田 基 内海 ゆづ子
出版者
大阪府立大学
雑誌
基盤研究(B)
巻号頁・発行日
2010

実世界指向Web とは,我々の周囲にある物体が情報の出入り口になるWeb である.物体にカメラをかざすと関連情報を瞬時に取り出せる.また,物体の撮影を通してユーザ自らが情報を関連付けることもできる.扱う物体は,文字,文書から3次元物体,顔など様々である.本研究では,このような新しいWeb を実現する上で必須となる物体認識技術の大規模化(文書の場合,1 億ページの識別),高速化(文書の場合,27ms/query),高精度化(文書の場合,認識率99%),およびその理論的基盤の構築,さらには,実世界指向Web のプロトタイプの作成を行った.