著者
黄瀬 浩一 岩田 基 岩村 雅一 内海 ゆづ子 クンツェ カイ デンゲル アンドレアス 外山 託海
出版者
大阪府立大学
雑誌
基盤研究(A)
巻号頁・発行日
2013-04-01

Knowledge Logとは,人が日々獲得している知識の記録である.従来から存在するライフログとの違いは,Knowledge Logが知識という高次記号情報をログの対象とするのに対して,ライフログは,信号情報あるいは記号であっても単純なもの(例えば人の座る,歩く,食べるなどの行動)を記述する点にある.人の知識の大半は,人の読むという行為によって獲得されていることに着目し,本研究では,読むことに関連した知識のログを中心に,その量や質について推定するための各種手法を構築した.また,その基礎となる特徴照合,文書画像検索,文字,顔,物体などの認識技術,大規模文字画像データベースについても開発した.
著者
勝手美紗 内海ゆづ子 黄瀬浩一
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2012, no.5, pp.1-7, 2012-11-26

本稿では,インターネット上の大規模な動画像を自動で分類することを目的とし,動画像中のイベントを検出する.インターネットで配信されているホームビデオなどの動画の多くは視点が固定されずに撮影されているため,動画像から人物や物体の動きの情報を取得することは困難であり,行動認識などの技術を用いてイベントを検出することは困難となる.また,イベントは行われる環境や環境を構成する物体に大きく依存する.そこで,動画像中の背景や動画像中に登場する物体に着目し,イベントの検出を行う.背景からは, Opponent SIFT 特徴量を Bag-of-Feature で表現したものを特徴量として抽出する.物体特徴量には,動画像から物体検出器により検出した物体の頻度と識別器の信頼度の値を用いる.それぞれ特徴量を用いて最近傍探索を行い,結果を統合することでイベントの認識を行った.評価は TRECVID2012 Multimedia Event Detection タスクのデータセットを用いて行った.その結果,特定の環境でのみ行われるイベントと動画中の物体を高い精度で検出できたイベントを検出できた.
著者
近野 恵 岩田 和将 黄瀬 浩一 岩村 雅一 内田 誠一 大町 真一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. HIP, ヒューマン情報処理
巻号頁・発行日
vol.109, no.471, pp.507-512, 2010-03-08

本稿では,我々が開発中のカメラペンシステムで使用する,文書画像検索の精度向上法を提案する.カメラペンシステムとは,カメラを取り付けたペンで書いた印刷文書への筆跡を,デジタルデータとして復元するシステムである.文書画像検索はデータベースから撮影画像の対応範囲を検索することで,筆跡を求める役割を担っており,高精度での検索が必要不可欠である.しかし現状では,撮影画像に生じる射影歪みの影響で検索精度が低下している.そこで,この問題を解決するために,検索に用いる特徴量の改良,および射影歪みを発生させた画像を生成し,データベースを拡張する手法と,撮影画像を基にクエリを拡張して検索する手法の3つを提案する.有効性を検証するため,改良した特徴量と拡張手法をそれぞれ組み合わせ,改良前の従来手法と比較実験を行った.その結果,改良した特徴量を用い,クエリを拡張した手法を用いたときに,最も精度が向上した.
著者
柏木隆宏 黄瀬浩一
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2011, no.20, pp.1-6, 2011-08-29

莫大な数の部分空間を用いて 3 次元物体を高速に認識する手法を提案する.通常,データベース中の部分空間とクエリとなる特徴量の類似度は,その部分空間へ射影した際の射影長を計算することで求められる.そのため,データベース中の部分空間の数が莫大になると,全ての部分空間との類似度を計算し,物体を認識するために,莫大な処理時間が必要となる.そこで我々は、莫大な数の部分空間のデータベースに対して,近似的に探索を行い,高速に物体を認識する手法を提案する.また,近似探索を行った場合でも認識率を維持するため,近似を用いて高速に部分空間の絞り込みを行い,絞り込んだ部分空間において正確な類似度の比較を行う手法も提案する (2 段階処理).更に,この手法を相互部分空間法にも適用し,3 次元物体の高速で高精度な認識を実現する.実験を行った結果,近似を用いて類似度の高い部分空間を求めて物体を認識した場合,近似を用いない場合に比べて処理時間を 300 分の 1 にすることができた.また,近似を用いて相互部分空間法を行うことで,近似を用いた部分空間法と比べて,認識率が 60% 以上向上した.
著者
野久 仁志 藤野 亮之 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会総合大会講演論文集
巻号頁・発行日
vol.1997, no.1, 1997-03-06

現在, 情報はさまざまなメディアによって表現され伝達されている. その中でも中心的な役割を担っているのが図どテキストであり, 各々を組み合わせて用いている文書は非常に多い. 図とテキストを用いている文書では, 各々に同じ情報が重複して記述されることはなく, 対応関係が補える範囲内で相互に情報の省略が行われている. したがってこのような文書を理解するためには, 個々のメディアの理解だけでなく, 相互の対応関係を考慮した統合理解が必要となる. こうした統合理解の第一歩として, 互いの対応関係の抽出が要求される. また, 対応関係を計算機によって自動抽出できれば, 図に関連したテキストを検索する際に, 情報フィルタとしても活用することができ有用である. 本稿では, 図とテキストを用いている文書のひとつとして, 概念図とその説明文を対象とし, 対応関係を抽出する方法を提案する. 本手法は, マーカパッシングを利用して対応関係の抽出を行うものである.
著者
大町 真一郎 岩村 雅一 内田 誠一 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. TL, 思考と言語 (ISSN:09135685)
巻号頁・発行日
vol.105, no.613, pp.67-72, 2006-02-17

環境中の文字をディジタルカメラを入力デバイスとして高精度に認識するために,文字画像と同時に認識補助のための付加情報を提示する方法が検討されている.付加情報は,幾何学的変換に対してロバストに抽出できることが要求される.本報告では,面積比を利用した付加情報提示手法を提案する.面積比はアフィン変換に不変であり,アフィン変換を受けた環境においても誤りなく抽出されることが期待される.実際に付加情報を埋め込んだ文字パターンを作成し,提案手法の有効性と可能性について議論する.
著者
内田 誠一 Liwicki Marcus 岩村 雅一 大町 真一郎 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EMM, マルチメディア情報ハイディング・エンリッチメント (ISSN:09135685)
巻号頁・発行日
vol.111, no.74, pp.17-22, 2011-05-23

手書きは,人類のコミュニケーション手段として古来から広く利用されている.そして現代,タブレットやアノトペンといった技術進歩により,計算機への入力手段としても手書きは普遍的なものとなった.しかし,日常的な「紙の上の手書き」は,依然「紙の上の手書き」のままであり,それ以上の価値を持つに至っていない.これに対し,筆者らによるユニバーサルパターンプロジェクトでは,「情報埋め込みペン」を開発した.これは,情報埋め込み技術により,手書きに新たな価値を付与しようという試みである.このペンでは,ペン先のインクジェットにより,筆記時にリアルタイムに筆記者情報や筆記日時などの任意情報を埋め込むことができる.埋め込んだ情報は画像処理により復元できる.すなわち,紙の上の手書きに,計算機可読な様々な情報を埋め込むことができる.実験により,5cmの筆記に32ビット程度の情報を誤りなく埋め込めることを確認している.
著者
村瀬 洋 増田 健 谷口 倫一郎 井宮 淳 岡田 稔 今井 正和 中島 昇 黄瀬 浩一 斎藤 英雄 坂野 鋭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.96, no.435, pp.57-66, 1996-12-19
被引用文献数
1

1996年8月, オーストリアのウィーンで開催された第13回パターン認識国際会議 (13th ICPR) に出席したので, その概要を報告する。
著者
柏木 隆宏 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.111, no.194, pp.133-138, 2011-08-29

莫大な数の部分空間を用いて3次元物体を高速に認識する手法を提案する.通常,データベース中の部分空間とクエリとなる特徴量の類似度は,その部分空間へ射影した際の射影長を計算することで求められる.そのため,データベース中の部分空間の数が莫大になると,全ての部分空間との類似度を計算し,物体を認識するために,莫大な処理時間が必要となる.そこで我々は,莫大な数の部分空間のデータベースに対して,近似的に探索を行い,高速に物体を認識する手法を提案する.また,近似探索を行った場合でも認識率を維持するため,近似を用いて高速に部分空間の絞り込みを行い,絞り込んだ部分空間において正確な類似度の比較を行う手法も提案する(2段階処理).更に,この手法を相互部分空間法にも適用し,3次元物体の高速で高精度な認識を実現する.実験を行った結果,近似を用いて類似度の高い部分空間を求めて物体を認識した場合,近似を用いない場合に比べて処理時間を300分の1にすることができた.また,近似を用いて相互部分空間法を行うことで,近似を用いた部分空間法と比べて,認識率が60%以上向上した.
著者
野口 和人 氏原 慎弥 黄瀬 浩一 岩村 雅一
出版者
一般社団法人情報処理学会
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.29, pp.205-210, 2009-03-06

カメラ付き携帯電話を入力デバイスとした画像認識では,撮影した画像のぶれやぼけが認識精度低下の原因となる.そのため,ぶれやぼけに対処する手法が重要となる.本稿では,局所特徴量の近似最近傍探索による認識手法に対して,原画像に様々がぶれやぼけを与えた画像を生成し学習する生成型学習を導入することによって対処する.生成型学習を導入するにあたって問題となるのは,学習データの増加にともなって最近傍探索に必要なメモリ量と処理時間が増大することである.これは,特に大規模なデータベースを用いた場合に問題となる.提案手法では,多段階化とスカラー量子化によってこれを解決する. 1 万枚の画像データベースを用いた実験の結果,生成型学習を用いない手法と比べて認識率が 12.3% 向上することがわかった.For image recognition with a camera phone, defocus and motion-blur cause a serious decrease of the image recognition rate. In this report, we employ generative learning, i.e., generating blurred images and learning based on them, for a recognition method using approximate nearest neighbor search of local features. Major prob- lems of generative learning are long processing time and a large amount of memory required for nearest neighbor search. The problems become serious when we use a large-scale database. In the proposed method, they are sloved by cascading recognizers and scalar quantization. From experimental results with 10,000 images, we have confirmed that the proposed method improves the recogniton rate by 12.3% as compared to a method without generative learning.
著者
矢島 尚子 坂東 博司 黄瀬 浩一 日下 浩次
雑誌
全国大会講演論文集
巻号頁・発行日
vol.45, pp.199-200, 1992-09-28

文書溝造解析とは,文書画像を領戟分割し,得られた部分領域に,題目,著者名などの論理オブジェクト名をラベル付けする処理である.現在,我身のシステムでは,様存な文書に対する適用性を保持するため対象文書に依存した部分を知識ベースに分離,蓄積する形式をとっている.ところが,現システムでは,知識ベースの生成を人手に頼っているため,かなりの労力がかってしまう,そこで,知識ベースの自動構築が必要となってくる.本報告では,与えられた文書例から知識ベースを自動構築する方法について述べる1k1本手法の特徴は知識ベースをインクリメンタルに更新する点にある.
著者
外山 託海 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IE, 画像工学 (ISSN:09135685)
巻号頁・発行日
vol.110, no.26, pp.145-150, 2010-05-06

一般にパターン認識において,学習データセットの内容は識別性能に大きく影響することが知られている.これまで一般物体認識の分野において用いられてきた多くのデータセットでは,1カテゴリあたりのサンプル数が幾分か少ない場合が多いため,データセットを拡張して内容を充実させることができれば認識性能をさらに上げることができると考えられる.これまでそのようなサンプル数を増やすための手法はいくつか提案されてはいるが,それらの手法で用いられるデータの数は数万程度であり,さらにデータを増やすことで認識性能はより向上すると考えられる.そこで我々はインターネットから数十万枚の画像を集め,それらの画像をフィルタリングしてデータセットに加え,データセットのサイズを大きくした場合とそのままの大きさの場合とで認識1生能を比べる.その際識別器を変えた上でも実験を行い,それぞれどのような影響を及ぼすかを解析する.
著者
黄瀬 浩一 岩村 雅一 岩田 基 内海 ゆづ子
出版者
大阪府立大学
雑誌
基盤研究(B)
巻号頁・発行日
2010

実世界指向Web とは,我々の周囲にある物体が情報の出入り口になるWeb である.物体にカメラをかざすと関連情報を瞬時に取り出せる.また,物体の撮影を通してユーザ自らが情報を関連付けることもできる.扱う物体は,文字,文書から3次元物体,顔など様々である.本研究では,このような新しいWeb を実現する上で必須となる物体認識技術の大規模化(文書の場合,1 億ページの識別),高速化(文書の場合,27ms/query),高精度化(文書の場合,認識率99%),およびその理論的基盤の構築,さらには,実世界指向Web のプロトタイプの作成を行った.
著者
岩村 雅一 古谷 嘉男 黄瀬 浩一 大町 真一郎 内田 誠一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.5, pp.579-587, 2010-05-01
被引用文献数
1

特徴量のみでは本質的に避けることができない誤認識を回避するために,付加情報を用いるパターン認識という枠組みが提案されている.この方式では,パターン認識を行う際に,付加情報と呼ばれるクラスの決定を補助する少量の情報を特徴量と同時に用いて認議性能の改善を目指す.付加情報は自由に設定でき,通常は誤認識率が最小になるように設定する.ここで問題となるのは,誤認識率が最小になる付加情報の設定方法である.常に正しい付加情報が得られるいう理想的な条件においては既に問題が定式化され,付加情報の割当方法が導かれている.しかし,実環境での使用を考えると,付加情報に生じる観測誤差を考慮した割当方法が求められる.そこで本論文では付加情報の観測誤差を考慮に入れて,問題を新たに定式化する.これは付加情報が誤らない場合にも有効な一般的なものである.本論文で導いた割当方法が有効に機能することをマハラノビス距離を用いた実験で例示する.
著者
黄瀬 浩一 岩村 雅一 大町 真一郎 内田 誠一
出版者
大阪府立大学
雑誌
挑戦的萌芽研究
巻号頁・発行日
2011

人間が外界とやりとりをする重要な情報の多くは,読む・書くという行為による.本研究では,このうち書く行為に焦点をあて,そのすべてをライティング・ライフ・ログとして記録することに挑戦する.記録は単なる画像データとしてではなく,どの文書のどの位置に何を書いているのかを認識する処理による.これにより,書く行為を元にした様々な処理,例えば,学習支援やユーザの興味推定が可能となる.この挑戦を可能とするため,本研究では,ペンに取り付けたカメラから得た時系列画像を用いて筆跡を復元する処理,それを文書の正しい位置に配置する処理の2つを考案,改善した.その結果,高い精度で筆跡が復元可能であることがわかった.
著者
酒井 恵 内田 誠一 岩村 雅一 大町 真一郎 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.107, no.491, pp.1-6, 2008-02-14

文書画像の回転(スキュー)を補正するため,事例ベース傾き補正法を提案している.事例を用いることにより,文書の直進性を仮定せずに回転角を推定できる.また,事例として回転変量と不変量を用いることにより効率的に回転角を推定できる.変量と不変量はどのようなものでも良いが,前回の報告で用いていた不変量はノイズに弱いという問題があった.そこで本報告では,回転角推定の精度向上を目的として,不変量の多次元化について述べる.計算機内実験において文書画像55サンプルを用いて,簡単な傾き推定実験を行ったところ,48サンプルにおいて誤差1度以下,全てのサンプルにおいて誤差2度以下という精度を得た.また,スキャナ取得画像に対しても評価実験を行った所,目視ではあるが入力10画像中9画像に対して正しく補正できた.