著者
黄瀬 浩一 大町 真一郎 内田 誠一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.104, no.742, pp.85-90, 2005-03-11
参考文献数
49
被引用文献数
16

デジタルカメラの小型化, 高解像度化, 一般化に伴い, これを入力手段として用いた文字認識・文書画像解析への期待が高まりつつある.本稿では, デジタルカメラを用いた文字認識・文書画像解析について現在の代表的な技術を俯瞰するとともに, バーコードなどの関連技術との比較によって, 文字認識, 文書画像解析の立場や将来への課題を浮き彫りにする.また, 将来に向けた試みの一つとして, 著者らが「バーコードリーダ並みに手軽で高精度な文字認識」を目指して行っている研究「複比を用いた文字への情報埋め込み」の一端についても紹介する.
著者
松田 友輔 大町 真一郎 阿曽 弘具
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.3, pp.336-344, 2010-03-01
被引用文献数
3

本論文ではNAT(Noise Attribute Thresholding)法と色情報を用いた2値化及びエッジ情報を利用した情景画像からの高精度な文字列検出手法を提案する.NAT法はノイズの特性を利用した文書画像の2値化手法である.NAT法と色情報を用いて文字列検出を行う従来手法は照明変化等による色の変化に脆弱で誤検出が多いという問題があった.それに対して提案手法では,色コントラストを考慮した濃淡画像にNAT法を適用して2値化することにより従来手法よりも高い精度の2値化を実現し,高精度な文字列の検出を可能としている.また照明変化などにより文字の単色性が損なわれている場合を考慮して色情報を処理することにより照明変化に対応し,誤検出数を抑制している.更にエッジ情報を利用した手法を導入することにより,従来手法では不可能であった接触文字の検出を可能としている.実験により提案手法の有効性を示す.
著者
横山 弘子 大町 真一郎 阿曽 弘具
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号頁・発行日
vol.97, no.593, pp.1-8, 1998-03-12
被引用文献数
8

本報告では, シソーラスを自動的に構築するための手がかりとして, コーパス内の単語の共起情報をもとにクラスタリングにより多義動詞の意味分類を行なう手法を提案している.この手法について, 1つの多義動詞に対して意味に応じたクラスタを形成する実験を行った.コーパスとして1年分の朝日新聞社説を用い, まず着目した多義動詞を含む社説を複数収集しそこから得た名詞間共起情報によるクラスタリングの結果, いくつかの動詞で意味に応じたクラスタが形成されることが確認された.また, 多義動詞の類義語を含む社説も追加して同様のクラスタリングを行った.これにより着目した動詞を含む社説のみ用いた場合意味に応じたクラスタが形成されなかった動詞についても良好な結果が得られた.
著者
大町 方子 大町 真一郎
出版者
一般社団法人 画像電子学会
雑誌
画像電子学会誌 (ISSN:02859831)
巻号頁・発行日
vol.38, no.5, pp.673-679, 2009-09-25 (Released:2011-08-25)
参考文献数
11
被引用文献数
2

高度道路情報システムへの関心が高まり,安全走行のための様々な運転支援システムが開発されている.その中でも,最近画像を用いたシステムが注目され,道路環境の認識と理解に関する様々な研究が行われている.信号機の認識は安全運転支援には重要な技術である.車載カメラで撮影した画像から信号機を検出し,点灯している色を認識することが可能となれば,運転者に対して道路環境を理解するための有益な情報を与えることが可能となる.本稿では,車両用信号機を対象とし,デジタルカメラで撮影した情景画像から点灯している信号表示面を高速に検出し,その色を認識する手法を提案する.提案手法では,まず信号機の種類や照明条件による色の違いを吸収するために色空間をRGBから正規化RGBに変換する.次に,色情報に基づいて信号表示面の候補領域を抽出する.そして,エッジを用いたハフ変換を基本とし,色情報を相補的に利用することにより信号表示面の正確な領域を抽出する.実際にデジタルカメラで自動車のフロントガラスを通して撮影された情景画像を用いた実験を行い,提案手法の有効性を検証する.
著者
松澤 知己 武井 渉 大町 真一郎 加藤 毅
出版者
一般社団法人情報処理学会
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2015, no.13, pp.1-7, 2015-02-27

画像識別問題はコンピュータビジョン分野において中心的な課題の一つとして,多くの研究がなされてきた.画像識別においては SIFT などの局所記述子群から一つの特徴ベクトルをつくって統計的パターン認識の枠組みにあてはめる方法が定石となっている.中でも Bag-of-Visual-Words とフィッシャーベクトルが最も成功している.それらの符号化法に対し武井らは局所記述子の分布形状を考慮してマハラノビス計量を導入することが有効であることを示した.彼らの方法は記述子の空間全体で同一の計量を用いていたが,本発表では武井らの符号化を一般化して局所ごとに異なる非一様な計量を許すような符号化法を提案する.
著者
近野 恵 岩田 和将 黄瀬 浩一 岩村 雅一 内田 誠一 大町 真一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. HIP, ヒューマン情報処理
巻号頁・発行日
vol.109, no.471, pp.507-512, 2010-03-08

本稿では,我々が開発中のカメラペンシステムで使用する,文書画像検索の精度向上法を提案する.カメラペンシステムとは,カメラを取り付けたペンで書いた印刷文書への筆跡を,デジタルデータとして復元するシステムである.文書画像検索はデータベースから撮影画像の対応範囲を検索することで,筆跡を求める役割を担っており,高精度での検索が必要不可欠である.しかし現状では,撮影画像に生じる射影歪みの影響で検索精度が低下している.そこで,この問題を解決するために,検索に用いる特徴量の改良,および射影歪みを発生させた画像を生成し,データベースを拡張する手法と,撮影画像を基にクエリを拡張して検索する手法の3つを提案する.有効性を検証するため,改良した特徴量と拡張手法をそれぞれ組み合わせ,改良前の従来手法と比較実験を行った.その結果,改良した特徴量を用い,クエリを拡張した手法を用いたときに,最も精度が向上した.
著者
大町 真一郎 岩村 雅一 内田 誠一 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. TL, 思考と言語 (ISSN:09135685)
巻号頁・発行日
vol.105, no.613, pp.67-72, 2006-02-17

環境中の文字をディジタルカメラを入力デバイスとして高精度に認識するために,文字画像と同時に認識補助のための付加情報を提示する方法が検討されている.付加情報は,幾何学的変換に対してロバストに抽出できることが要求される.本報告では,面積比を利用した付加情報提示手法を提案する.面積比はアフィン変換に不変であり,アフィン変換を受けた環境においても誤りなく抽出されることが期待される.実際に付加情報を埋め込んだ文字パターンを作成し,提案手法の有効性と可能性について議論する.
著者
内田 誠一 Liwicki Marcus 岩村 雅一 大町 真一郎 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EMM, マルチメディア情報ハイディング・エンリッチメント (ISSN:09135685)
巻号頁・発行日
vol.111, no.74, pp.17-22, 2011-05-23

手書きは,人類のコミュニケーション手段として古来から広く利用されている.そして現代,タブレットやアノトペンといった技術進歩により,計算機への入力手段としても手書きは普遍的なものとなった.しかし,日常的な「紙の上の手書き」は,依然「紙の上の手書き」のままであり,それ以上の価値を持つに至っていない.これに対し,筆者らによるユニバーサルパターンプロジェクトでは,「情報埋め込みペン」を開発した.これは,情報埋め込み技術により,手書きに新たな価値を付与しようという試みである.このペンでは,ペン先のインクジェットにより,筆記時にリアルタイムに筆記者情報や筆記日時などの任意情報を埋め込むことができる.埋め込んだ情報は画像処理により復元できる.すなわち,紙の上の手書きに,計算機可読な様々な情報を埋め込むことができる.実験により,5cmの筆記に32ビット程度の情報を誤りなく埋め込めることを確認している.
著者
大塚 浩司 大町 真一郎 阿曽 弘具
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. DBS,データベースシステム研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.140, no.2, pp.415-420, 2006-07-14
参考文献数
6

共通のトピックに関するウェブページの集合であるウェブコミュニティを抽出する手法の1っとしてHITSアルゴリズムが知られている.HITSアルゴリズムは,ウェブコミュニティを"オーソリティ"と"ハブ"と呼ばれる2種類のウェブページからなる2階層の構造をしていると仮定し,これを2部グラフと見なして抽出することを目的としている.しかし,一般にウェブコミュニティはより複雑なリンク構造を持っている.本論文では,3階層以上の多階層のリンク構造を持つウェブコミュニティを抽出することを目的とし,オーソリティ・ハブに加えて中間ノードを導入したウェブコミュニティ抽出法を提案する.提案手法により,HITSアルゴリズムでは抽出しにくいページをウェブコミュニティのメンバとして抽出することが可能であることを実験により示す.
著者
岩村 雅一 古谷 嘉男 黄瀬 浩一 大町 真一郎 内田 誠一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.5, pp.579-587, 2010-05-01
被引用文献数
1

特徴量のみでは本質的に避けることができない誤認識を回避するために,付加情報を用いるパターン認識という枠組みが提案されている.この方式では,パターン認識を行う際に,付加情報と呼ばれるクラスの決定を補助する少量の情報を特徴量と同時に用いて認議性能の改善を目指す.付加情報は自由に設定でき,通常は誤認識率が最小になるように設定する.ここで問題となるのは,誤認識率が最小になる付加情報の設定方法である.常に正しい付加情報が得られるいう理想的な条件においては既に問題が定式化され,付加情報の割当方法が導かれている.しかし,実環境での使用を考えると,付加情報に生じる観測誤差を考慮した割当方法が求められる.そこで本論文では付加情報の観測誤差を考慮に入れて,問題を新たに定式化する.これは付加情報が誤らない場合にも有効な一般的なものである.本論文で導いた割当方法が有効に機能することをマハラノビス距離を用いた実験で例示する.
著者
黄瀬 浩一 岩村 雅一 大町 真一郎 内田 誠一
出版者
大阪府立大学
雑誌
挑戦的萌芽研究
巻号頁・発行日
2011

人間が外界とやりとりをする重要な情報の多くは,読む・書くという行為による.本研究では,このうち書く行為に焦点をあて,そのすべてをライティング・ライフ・ログとして記録することに挑戦する.記録は単なる画像データとしてではなく,どの文書のどの位置に何を書いているのかを認識する処理による.これにより,書く行為を元にした様々な処理,例えば,学習支援やユーザの興味推定が可能となる.この挑戦を可能とするため,本研究では,ペンに取り付けたカメラから得た時系列画像を用いて筆跡を復元する処理,それを文書の正しい位置に配置する処理の2つを考案,改善した.その結果,高い精度で筆跡が復元可能であることがわかった.
著者
酒井 恵 内田 誠一 岩村 雅一 大町 真一郎 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.107, no.491, pp.1-6, 2008-02-14

文書画像の回転(スキュー)を補正するため,事例ベース傾き補正法を提案している.事例を用いることにより,文書の直進性を仮定せずに回転角を推定できる.また,事例として回転変量と不変量を用いることにより効率的に回転角を推定できる.変量と不変量はどのようなものでも良いが,前回の報告で用いていた不変量はノイズに弱いという問題があった.そこで本報告では,回転角推定の精度向上を目的として,不変量の多次元化について述べる.計算機内実験において文書画像55サンプルを用いて,簡単な傾き推定実験を行ったところ,48サンプルにおいて誤差1度以下,全てのサンプルにおいて誤差2度以下という精度を得た.また,スキャナ取得画像に対しても評価実験を行った所,目視ではあるが入力10画像中9画像に対して正しく補正できた.
著者
大町 真一郎
出版者
東北大学
雑誌
基盤研究(C)
巻号頁・発行日
2008

テンプレートマッチング法による幾何学的変形を受けた画像の高速な探索を実現することを目的とし、画像を多項式で近似し、指定された位置とアスペクト比の部分画像のみを対象とすることで高速な探索を実現できる手法を開発した。また、本研究課題の応用として、実時間で画像を取得しながら物体を探索するシステムを構築した。具体的には高度道路交通システムへの応用を想定し、交通信号の自動検出および識別のためのシステムを構築した。
著者
大町 真一郎
出版者
東北大学
雑誌
基盤研究(C)
巻号頁・発行日
2006

自ら移動して環境の情報を積極的に取得して行動する知能ロボットへの応用を想定し、映像を用いた実環境中の物体の頑健でかつ高速な探索法を開発することを目的として研究を行った。高速化を実現するために、画像を多項式で表現する手法、および、多項式を用いて探索を高速に行う方法を開発した。まず、画像を関数で適切に表現する手法について検討した。様々な関数形を調査した結果、多項式により画像を十分な精度で表現できることが分かった。ただし、多項式で近似する際に最小二乗法等の良く知られた方法を用いたのでは計算誤差によって適切な近似画像が得られないことも確認された。そのため、直交多項式を用い、直交多項式の完全性を利用して画像の近似を内積計算で実現する手法を開発した。次に、画像を近似する多項式と入力画像との類似度計算を効率よく行う手法を検討した。その結果、多項式の係数ごとに類似度を計算し、それを足し合わせることで、高速に類似度計算を行う手法を開発した。実験を行い、従来の高速化法と比較して、提案手法がはるかに高速であることを確認した。ところで、一般に画像パターン認識では単一の画像を用いるよりも、複数の画像を用いて統計的に適切な認識結果を得る方が一般に性能が良い。これらを考慮し、提案手法を部分空間法に適用する手法を提案した。部分空間法では、複数の学習パターンからそのパターンを表わす基底を構築し、基底への射影成分を求めることで認識を行なう。これにより認識精度が向上するだけでなく、一般に基底は低周波成分の多いパターンとなるため、多項式による近似精度も向上させることを可能とした。さらに、本手法の考え方を、代表的な信号処理の手法である連続ウェーブレット変換の高速計算に応用した。多項式を用いた内積計算の高速化法を拡張し、連続ウェーブレット変換に必要な積分計算を高速化する手法を開発した。
著者
黄瀬 浩一 大町 真一郎 内田 誠一 岩村 雅一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. TL, 思考と言語 (ISSN:09135685)
巻号頁・発行日
vol.104, no.740, pp.85-90, 2005-03-11
被引用文献数
2

デジタルカメラの小型化, 高解像度化, 一般化に伴い, これを入力手段として用いた文字認識・文書画像解析への期待が高まりつつある.本稿では, デジタルカメラを用いた文字認識・文書画像解析について現在の代表的な技術を俯瞰するとともに, バーコードなどの関連技術との比較によって, 文字認識, 文書画像解析の立場や将来への課題を浮き彫りにする.また, 将来に向けた試みの一つとして, 著者らが「バーコードリーダ並みに手軽で高精度な文字認識」を目指して行っている研究「複比を用いた文字への情報埋め込み」の一端についても紹介する.
著者
大町 真一郎 大町 方子
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J91-D, no.6, pp.1561-1568, 2008-06-01

画像探索はパターン認識やコンピュータビジョンにおける重要な課題の一つである.画像の探索には,計算の高速性や頑健性から,画像そのものをテンプレートとして用いるよりも,色ヒストグラムや特徴点等の低次の特徴が用いられることが多い.しかし,低次の特徴では文字等の複雑な画像を探索することは困難である.本論文では,部分空間法に基づいた,テンプレートマッチングによる新しい画像探索の手法を提案する.提案手法は部分空間の基底を多項式で表すことで,この部分空間と入力画像中の部分領域との類似度を,部分領域の幅と高さを変えながら効率良く計算する手法である.手書き数字データベースMNISTを用いた実験を行い,提案手法の有効性を示す.