著者
黄瀬浩一 岩村 雅一
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.49, no.9, pp.1082-1089, 2008-09-15
参考文献数
22
被引用文献数
8
著者
黄瀬 浩一 大町 真一郎 内田 誠一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.104, no.742, pp.85-90, 2005-03-11
参考文献数
49
被引用文献数
16

デジタルカメラの小型化, 高解像度化, 一般化に伴い, これを入力手段として用いた文字認識・文書画像解析への期待が高まりつつある.本稿では, デジタルカメラを用いた文字認識・文書画像解析について現在の代表的な技術を俯瞰するとともに, バーコードなどの関連技術との比較によって, 文字認識, 文書画像解析の立場や将来への課題を浮き彫りにする.また, 将来に向けた試みの一つとして, 著者らが「バーコードリーダ並みに手軽で高精度な文字認識」を目指して行っている研究「複比を用いた文字への情報埋め込み」の一端についても紹介する.
著者
井上 勝文 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.8, pp.1407-1416, 2010-08-01
被引用文献数
1

局所特徴量を表す特徴ベクトルを用いた特定物体認識において,メモリ使用量を削減することは,重要な課題の一つである.メモリ使用量を削減する一般的な手法として, "bag of features" モデルに基づくものがある.この手法では,クラスタリングにより複数の特徴ベクトルをある代表ベクトルにまとめることでメモリ使用量を削減している.しかし,得られる代表ベクトルの識別性が低下するため,高い認識率が得られないという問題がある.この問題を解決する一つの方法は,特徴ベクトルを代表ベクトルに置き換えずにそのまま保持して認識処理に用いることである.この際,異なるメモリ削減の方法が必須となる.本論文では,特徴ベクトルの照合に距離計算ではなく, Bloomier filterを用いることでメモリ使用量を削減する手法を提案する.55個の3次元特定物体を用いた実験より, "bag of features" モデルに基づく手法と比較し,同じ認識率を得るために必要なメモリ使用量を1/3に削減することができた.また,1万個の平面物体を用いた実験でも同様に,メモリ使用量を1/7に削減することができた.
著者
柏木 隆宏 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.111, no.193, pp.133-138, 2011-08-29
被引用文献数
1

莫大な数の部分空間を用いて3次元物体を高速に認識する手法を提案する.通常,データベース中の部分空間とクエリとなる特徴量の類似度は,その部分空間へ射影した際の射影長を計算することで求められる.そのため,データベース中の部分空間の数が莫大になると,全ての部分空間との類似度を計算し,物体を認識するために,莫大な処理時間が必要となる.そこで我々は,莫大な数の部分空間のデータベースに対して,近似的に探索を行い,高速に物体を認識する手法を提案する.また,近似探索を行った場合でも認識率を維持するため,近似を用いて高速に部分空間の絞り込みを行い,絞り込んだ部分空間において正確な類似度の比較を行う手法も提案する(2段階処理).更に,この手法を相互部分空間法にも適用し,3次元物体の高速で高精度な認識を実現する.実験を行った結果,近似を用いて類似度の高い部分空間を求めて物体を認識した場合,近似を用いない場合に比べて処理時間を300分の1にすることができた.また,近似を用いて相互部分空間法を行うことで,近似を用いた部分空間法と比べて,認識率が60%以上向上した.
著者
孫 維瀚 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.6, pp.909-919, 2010-06-01

図表や漫画などの線画は,直線または曲線で描く図形であり,画像出版物の中で重要なものの一つである.線画の著作権を保護するため,不正コピーを自動的に検出する手法が求められている.実際に,不正利用者は,線画をそのまま使うだけではなく,オリジナルの一部分,すなわち部分的複製を利用することが多い.その際には,部分的複製は他の素材の中に埋め込まれる形で使われる.加えて,部分的複製はそのままの形で埋め込まれるとは限らず,様々な処理によって改変されることも考えられる.その結果,不正利用の検出が困難となっている.更に,線画の場合,改変の手法として手書きの複製が考えられるが,これが問題をより困難なものとしている.これらの問題に対処するため,本論文では,局所特徴量の照合による画像検索技術を用いて,不正コピーを検索する手法を提案する.具体的には,局所特徴領域の抽出手法としてMSERを,特徴量の記述子としてHOGを用いる.そして,データベースの大きさと検出時間を削減するため,主成分分析で特徴ベクトルを圧縮するとともに近似最近傍探索を用いる.実験により,提案手法は,印刷線画の部分的複製ばかりでなく,複雑な背景に埋め込まれた手書き線画に対しても有効性があることを示す.
著者
中居 友弘 黄瀬 浩一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.89, no.9, pp.2045-2054, 2006-09-01
参考文献数
10
被引用文献数
14

本論文では,ディジタルカメラで撮影して得られた文書画像をもとに,データベースから対応する文書画像を見つける文書画像検索の手法を提案する.従来のスキャナを利用した文書画像検索と異なり,ディジタルカメラを利用する場合には射影ひずみなどのディジタルカメラ特有の問題に対処する必要がある.また,大規模データベースでの利用を可能にするため,検索の効率性も重要である.これらの問題に対処するため,本論文では特徴点の局所的配置を特徴量とし,ハッシュ表を用いた投票によって検索する手法を提案する.本手法では,射影ひずみを実用的な範囲に制限し,特徴点の組合せを局所領域に限定することで,計算量の削減を実現する.また,高精度な検索を実現するため,射影変換の不変量である複比で特徴点の配置を表現し,特徴量としている.実験により,10,000ページのデータベースから精度98%,平均処理時間約160ms(特徴点抽出の画像処理に要する約1sを除く)で検索できることが示された.
著者
糠谷 文孝 黄瀬 浩一 和泉 憲明
雑誌
全国大会講演論文集
巻号頁・発行日
vol.54, pp.333-334, 1997-03-12

実世界で自ら行動を決定し, 実行するエージェントには, 動的な環境下でプランニングを行う能力が必要である. 具体的には, 環境の変化に柔軟に対処するため, プランニングの途中でも必要に応じてプランを実行するという熟考の制御が不可欠である. 熟考の制御に関しては, 山田がプラン実行の成功確率に基づいてプランニングと実行をインタりーブする手法を提案している. この手法では, 一つのオペレータが一つの目標の処理に対応し前向きビーム探索で複数の目標の処理順序をプランニングする. ところが, 一つの目標を達成するために複数のオペレータを組み合せる従来のプランニング問題に対して, 熟考を制御する手法はあまり研究されていない. そこで本稿では, このような問題に対して熟考を制御するため, 階層的プランニングを用いる手法を提案する. 本手法の特微は, 階層的プランニングの詳細化の方法として熱考型と即応型の2つのモードを用意し, 環境の変化に応じて切替える点にある. 環境の変化が緩やかなときは, 従来の階層的プランニングを続けることによって合目的性を高める熟考型, 環境の変化が激しいときは, 実行に必要な部分だけを速やかに詳細化する即応型によりプランを生成する.
著者
黄瀬浩一 岩村 雅一
雑誌
情報処理
巻号頁・発行日
vol.49, no.9, pp.1082-1089, 2008-09-15
著者
中居 友弘 黄瀬 浩一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.432, pp.157-162, 2009-02-12
被引用文献数
1

本稿では,デジタルカメラで撮影された,撮影範囲の異なる複数の文書画像をつなぎ合わせるモザイキング法を提案する.デジタルカメラで撮影された文書画像は任意の射影歪みを受けているため,その位置合わせは従来手法では困難なものであった.提案手法では,特徴点に基づく文書画像検索法であるLLAHを利用することで,射影歪みを受けた文書画像の特徴点の対応関係を得て,それに基づいて画像間の変換パラメータを推定して位置合わせを行う.LLAHは射影歪みに対して不変であるため,射影歪みの補正なしに特徴点の対応付けが可能である.実験により,デジタルカメラで撮影された文書画像のつなぎ合わせが可能であることが示された.
著者
浅田 伸彦 岩村 雅一 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.110, no.467, pp.183-188, 2011-03-03

本稿では,環境中のあらゆる文字・単語を認識する「全方位認識」の実現のために,厳しい射影歪みに対応する手法について検討する.我々は実時間認識可能,レイアウトフリー,射影歪みに頑健といった3つの要件を満たすカメラベースの単語認識手法を提案している.この手法は斜め45度から撮影した文字を認識できる頑健さを持つが,前述の全方位認識に際しては,射影歪みに対する更なる頑健性が求められる.そこで本稿では,前述の単語認識手法の文字認識誤りをオープンソースのスペルチェッカであるGNU Aspellを利用して補正する.その際,Aspellが持つ音素の類似性に基づくMetaphoneという仕組みを文字誤認識傾向に基くMetashapeに置き換える.提案手法を用いて実験を行った結果,文字が書かれた紙面に対して撮影角度が20度のときに単語認識精度には最大で約24%から約74%の向上が見られた.
著者
武藤 大志 多田 匡志 岩村 雅一 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CQ, コミュニケーションクオリティ (ISSN:09135685)
巻号頁・発行日
vol.109, no.373, pp.109-114, 2010-01-14

近似最近傍探索は,クエリと最も距離が近い点を探索する最近傍探索の計算時間,メモリ使用量を大幅に削減する手法である.一般に精度,計算時間,メモリ使用量はトレードオフの関係にあり,その関係を解析することは,様々な場面に近似最近傍探索を適用する上で,重要な課題である.本稿では,ハッシュを利用した近似最近傍探索において,文献[1]〜[4]で行われている"隣接バケットを参照する"方策のモデル化を行い,精度とメモリ使用量に関して理論式を求める.そして,実験とシミュレーションにより理論式の妥当性を検証する.
著者
中居 友弘 黄瀬 浩一 岩村 雅一 松本 啓之亮
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.104, no.742, pp.103-108, 2005-03-11
被引用文献数
1

本稿では, デジタルカメラを用いた新しい文書画像検索手法を提案する.提案手法は, デジタルカメラで撮影した文書画像の一部あるいは全部を検索質問として, それを含む文書画像をデータベースから検索するものである.これを実現するためには, 撮影時に生じる射影変換歪みに対処しつつ, 部分的な手がかりでも柔軟に照合する必要がある.この問題に対して, 提案手法では, (1)射影変換の不変量である複比を用いたインデックス付け, (2)ハッシュを用いた投票処理の2特徴により対処する.高解像度デジタルカメラと携帯電話付属のデジタルカメラで撮影した画像を用いた実験により, 提案手法の有効性を検証する.
著者
中居 友弘 黄瀬 浩一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.432, pp.115-120, 2009-02-12
被引用文献数
2

本稿では,さまざまな言語で書かれた文書画像のリアルタイム検索法を提案する.これは,Webカメラで撮影された文書画像を検索質問とし,データベースから元となった文書画像をリアルタイムで検索して提示するものである.我々はすでに英語文書を対象とした文書画像検索法を提案しており,これは従来手法をさまざまな言語の文書に適用できるよう拡張したものである.従来手法である英語文書画像検索法では,画像処理によって得られる単語領域の重心を特徴点としていた.しかし,日本語や中国語を含むいくつかの言語では,言語の特性上識別性の高い特徴点を安定的に得ることが難しい.提案手法では,記述子の追加によってさまざまな言語の文書における高精度なリアルタイム文書画像検索を実現する.
著者
野口 和人 氏原 慎弥 黄瀬 浩一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.484, pp.205-210, 2009-03-06
被引用文献数
1

カメラ付き携帯電話を入力デバイスとした画像認識では,撮影した画像のぶれやぼけが認識精度低下の原因となる.そのため,ぶれやぼけに対処する手法が重要となる.本稿では,局所特徴量の近似最近傍探索による認識手法に対して,原画像に様々がぶれやぼけを与えた画像を生成し学習する生成型学習を導入することによって対処する.生成型学習を導入するにあたって問題となるのは,学習データの増加にともなって最近傍探索に必要なメモリ量と処理時間が増大することである.これは,特に大規模なデータベースを用いた場合に問題となる.提案手法では,多段階化とスカラー量子化によってこれを解決する.1万枚の画像データベースを用いた実験の結果,生成型学習を用いない手法と比べて認識率が12.3%向上することがわかった.
著者
柳田 修 黄瀬 浩一 高松 忍
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会総合大会講演論文集
巻号頁・発行日
vol.1996, no.2, 1996-03-11

文書画像の領域分割とは、文書画像からカラムや図表などの構成要素を分離・抽出する処理である。従来、領域分割の研究は、入力画像に傾きがないことや文書がマンハッタンレイアウトを持つ(構成要素を矩形で囲める)ことを前提として進められてきた。しかしながら、これらの前提は入力画像に対して厳しい制限を課すものであるため、近年、その緩和あるいは排除が求められており、すでにいくつかの手法が提案されている。本稿では、同様の観点から、上記の前提を必要としない領域分割法を提案する。本手法は、文献と同様、文書画像の背景領域(空白部分)の構造を解析するものである。本手法の特徴は、文献の手法ように背景領域を囲む矩形を処理対象とするのではなく、背景領域の細線化により得られる図形を処理対象とする点にある。
著者
野口 和人 黄瀬 浩一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.92, no.8, pp.1135-1143, 2009-08-01
被引用文献数
5

局所特徴量を用いた特定物体認識において,認識率,処理時間,メモリ量について良いバランスを実現することは重要な問題である.局所特徴量は高い識別性をもつことから,高い認識率を実現することは困難ではないものの,その前提として長い処理時間や大きなメモリ量が要求されるため,大規模化の障害となっている.本論文では,認識率にあまり影響を及ぼすことなく,処理時間やメモリ量を削減する手法について述べる.処理時間の削減については,近似最近傍探索が有効であることを述べるとともに,従来法であるANNと比べて,ハッシュを用いた,より認識に有効な手法を提案する.メモリ量については,局所特徴量を表す特徴ベクトルに対してスカラ量子化を適用することにより,簡単に削減可能であることを示す.10万画像を用いた認識実験の結果,各次元の表現に用いるビット数を16ビットから2ビットに減少させても認識率に影響をほとんど及ぼさないこと,提案手法によって,認識率98.1%,処理時間119.7msを実現可能であることが分かった.また,1万画像を用いたANNとの比較では,同程度の認識率を実現するための処理時間,メモリ量が,それぞれ1/4,1/3であることも確認した.
著者
井上 慶彦 岩村 雅一 黄瀬 浩一
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
巻号頁・発行日
vol.2018-CVIM-212, no.20, pp.1-6, 2018-05-03

視覚障害者は,晴眼者 (視覚に障害を持たない人) と比べて視覚から得られる情報が限られている.それを補うために,スマートフォンのカメラを用いて物体情報を取得できるような補助アプリもあるが,そもそも知りたい物体の位置を把握すること自体が困難である場合が少なくない.全方位カメラは一度に全方向の情報を取得できることから,対象物にカメラを向ける必要がなく,視覚障害者支援に適していると考えられる.全方位カメラにより周辺画像を取得し,得られた画像に対して物体検出及び認識を行い,音声情報などで視覚障害者にどこに何があるのかを伝えることができるようなシステムが実現できれば,汎用性の高い視覚障害者支援システムとなる.このようなシステムを実現するためには,まず全方位画像に対する正確な物体検出及び認識と,動画において前後フレームで物体情報を保持するためのトラッキングを行う必要がある.全方位カメラから得られる画像は,通常のカメラから得られる画像とは異なった投影方法なので,通常の画像を対象とした物体検出アルゴリズムやトラッキング手法をそのまま適用することは難しい.本稿では物体検出とトラッキングを別々の投影方法で行い,結果を統合することで,全方位画像に対して高精度な物体検出とトラッキングを実現する手法を提案する.
著者
黄瀬 浩一
出版者
一般社団法人 日本画像学会
雑誌
日本画像学会誌 (ISSN:13444425)
巻号頁・発行日
vol.55, no.3, pp.304-313, 2016-06-10 (Released:2016-06-13)
参考文献数
33

我々は毎日,文字·文書を読むことに長時間を割いている.これは,読むことが,我々にとって情報入力の最も重要な手段だからである.Reading-Life Logとは,読まれる文字·文書と読む行為をセットにして解析し,そこから我々の生活を豊かにする情報を取り出そうとする研究の総称である.文書を対象とした場合,アイトラッカで得られた視線などのデータを解析することで,どれだけ読んだのか (万語計,読む行動の検出),からどれほど理解しているのか (理解度や熟達度の推定) まで,さまざまな情報処理が可能となる.シーン中の文字についても,人が何をどう読んだのかによってその人の行動を推定できる.また,指先に取り付けたカメラで文字を認識することによって,人の作業をサポートできる.これらの情報処理の基礎となるのは,画像として取り込まれる外界を認識·検索する技術である.大規模な認識·検索対象を効率的に扱うため,我々は近似最近傍探索と呼ばれる技術を導入している.本稿では,これらの基盤技術ならびにそれを応用したReading-Life Logの成果について報告する.
著者
志賀 優毅 内海 ゆづ子 岩村 雅一 カイ クンツェ 黄瀬 浩一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J97-D, no.12, pp.1733-1736, 2014-12-01

読書活動を把握することは,人の知識の質と量の把握につながるため,重要であると考えられている.とりわけ,多くの人の読書活動を長期間に渡って詳細に把握することができれば,これまでにない知見が得られる可能性がある.しかし,読書活動を記録する現在利用可能な方法は手動記録に限られ,現実的に掛けられる手間を考えると,詳細な読書活動の記録には適していない.そこで本論文では,読書活動を自動的に記録,分析するために,ユーザが読んでいる文書を推定する問題を考え,その意義と課題を議論する.