著者
仙田 修司 濱中 雅彦 山田 敬嗣
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.98, no.489, pp.17-24, 1998-12-17
被引用文献数
24

図形特徴から得られた切り出し確信度、個別文字認識から得られた文字認識確信度、2文字の連接から得られた文字bigram確率の3種類の情報を統合した枠なしオンライン文字列認識手法を提案する。切り出し率90.44%、個別文字認識率83.39%のデータに対して、3種類の確信度の統合により、切り出し率97.73%、枠なし認識率96.44%を達成した。また、複数の文字bigram辞書を自動的に選択する手法を提案し、住所、所属、氏名のデータに対して、標準辞書だけでは76.24%であった枠なし認識率が、住所辞書と氏名辞書を追加することで83.03%に向上した。
著者
三好 高史 柴田 直
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.344, pp.71-76, 2009-12-10

方向性エッジ情報という画像特徴量を用いた物体検出ハードウェアアルゴリズムの開発をし,そのハードウェア設計ついての検討を行った。方向性エッジ情報は人間の視覚システムでも認識の前処理として用いられていることが知られており,ロバストな物体検出が可能になることが期待される。本システムでは,AdaBoostを用いることで,エッジ画像内の重要な領域に於いてのみ,特徴ベクトルを生成することが可能となる。また,特徴ベクトル生成について三種類の方法を提案し,比較検討を行った。実際,本アルゴリズムを用いて,歩行者検出の実験を行ったところ,方向性エッジを用いた従来の手法に比べ高精度な検出結果を得ることができた。さらに,本システムが方向性エッジの単純性を用いることで,単純なハードウェアにより実現できることを証明した。
著者
山崎 俊太郎 持丸 正明 金出 武雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.110, no.27, pp.73-78, 2010-05-06
被引用文献数
3

一人称ビジョンシステムの一つである,頭部装着型の単眼カメラを用いて,画像から自己位置を推定する方法を提案する.本報告では,移動環境が既知であると仮定し,オフライン処理で環境地図を作成し,地図中での位置の推定をオンラインで行う,2ステップの手法について述べる.地図作成ステップでは,未校正の画像集合から,Structure-from-Motion法を用いてカメラ位置を復元する.続いて,多視点ステレオ法を用いて密な3次元点集合を生成する.復元した3次元点の座標,対応する画像特徴,その観測方向の3つ組からなる画像特徴データベースを作成し,画像特徴をキーとして検索可能な木構造に格納する.位置推定ステップでは,単眼カメラの計測画像から抽出した画像特徴を利用して木構造を探索し,環境中の3次元点との対応を取得する.得られた対応点を元に,ロバスト推定によってカメラの姿勢を復元する.実験では,500以上の画像から大規模な環境地図を生成さし,頭部に装着したカメラの位置をオンラインで,cm精度で求められることを示す.本手法を用いることにより,利用者に負担を与えない単純な計測装置で,人間の日常生活行動を長期間にわたり観測することが可能になる.
著者
中村 厚士 黒田 知宏 千原 國宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.99, no.574, pp.45-50, 2000-01-20

没入型仮想環境提示装置においては, 設置場所を要求するジョイスティックや操作時に視覚的な位置と遮蔽関係との不一致が起こるデータグローブなどは使用が困難である.また, 没入型仮想空間に多く見られるような遠方の仮想物体と, 点で表現されるポインタとの奥行き関係は把握が困難である.そこで本稿は, 複数の体験者が指示棒でその延長線上にある仮想空間内の物体を指し示すことで, 物体とインタラクションできる, レーザポインタ型インタフェースを提案する.
著者
尾久土 正己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.374, pp.207-211, 2010-01-14

皆既日食は古代の人々にとってはまさに天変地異であった.しかし,従来のTVやインターネットで放映されている日食の映像は太陽にフォーカスされており,その劇的な変化の一部しか表現出来ていない.そこで、我々は4Kの超高精細映像システムを使ってドームスクリーン上に日食を再現することに挑戦した.本報告では,我々のシステムとそれを使った実験の教育効果について紹介する.
著者
森 明慧 内田 誠一 倉爪 亮 谷口 倫一郎 長谷川 勉 迫江 博昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.606, pp.31-36, 2007-03-09

本報告では,統計的手法を導入した論理判定型DPマッチングによる類似区間検出手法を提案する.論理判定型DPマッチングとは,サポートと呼ばれる論理関数を基準として用いて2つのパターン問の非線形マッチングを行うアルゴリズムであり,パターン間に複数存在する類似区間を同時に検出できるという特長を持つ.この論理判定型DPマッチングに統計的手法を導入することで,パターンの変動のしやすさを考慮したより高精度な類似区間検出が可能になると考えられる.また実際の応用例として,本報告では本手法を用いたジェスチャの基本動作抽出についても検討する.実際に統計的手法の導入による効果を検証するための実験を行った結果,本手法の有効性を示すことができた.
著者
安藤 政志 堀田 政二 渋谷 久恵 前田 俊二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.110, no.467, pp.127-130, 2011-03-03
被引用文献数
1

本稿では,尤度ヒストゲラムと呼ばれる複数のセンサごとに求めた尤度を累積したヒストゲラムを特徴量とする記述子を提案し,これを用いてその日が正常に稼働した日(正常日)であるか,あるいは異常を起こした日(異常日)であるのかをSupport Vector Machine (SVM)でクラス分類する方法を提案する.このヒストグラムを求めるために,まずガウス関数を用いてセンサごと・時刻ごとのモデルを構築する.次に,各時刻でモデルごと(センサごと)に尤度を計算し,それらの累積値を投票数にもつヒストグラムを作成する.さらに,ヒストグラムを時間階層化(ピラミッド化)することで,異常検知の精度改善を試みる.これらの記述子を用いることで,one classの分類器以外の分類器による正常日,異常日の分類が可能となる.実際に稼働している精密機器のセンサデータを用いた実験により,提案手法の有効性を管理図と比較しながら検証する.
著者
前田 卓志 松下 雅仁 笹川 耕一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.99, no.118, pp.21-26, 1999-06-17
被引用文献数
5

インターネット閲覧や電子商取引に代表されるような,遠隔地から各種のサービスを提供する情報システムは,利便性などからその需要は急激に拡大している.サービスを権利のある人に正しく提供するには,個人を特定する個人識別技術が必要となる.本報告では,入退室管理等のセキュリティシステムや本人確認を必要とする情報システムを構築するための,汎用性に優れた個人識別用ミドルウエアについて述べる.
著者
金 壯一 新田 直子 馬場口 登
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.110, no.467, pp.335-340, 2011-03-03

映像編集において,映像ショット列に対する音楽のミキシングは,質の高い編集映像を生成する上で,重要な行程の一つである.映像ショット列に対する音楽ミキシングにおけるプロセスに,1)映像ショット列の動画の印象に適合する音楽の選択,2)映像ショット列中の各ショットに対する適切な音量調整,の2つが挙げられる.本稿では,事例映像における動画と音楽の特徴間の相関関係に基づいた音楽選択,音響の特徴パターンに基づいた音量調整による,映像ショット列に対する音楽ミキシング手法を提案し,事例として映画予告映像を用いた実験により各プロセスによる編集映像の質の向上を確認した.
著者
中村 文子 佐藤 弥 吉川 左紀子 松村 道一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.102, no.470, pp.7-12, 2002-11-14

近年、いくつかの研究から、視線方向の知覚によって喚起されるような自動的な注意シフトが、シンボルやジェスチャーによっても喚起されるという知見が報告されている。しかし、報告例は少なく実験手続きも統一されていないため、明確な結論は出されていない。今回我々は、視線・シンボル・ジェスチャーを手がかりとする3つの手がかりパラダイム実験を行い、この問題を検討した。手がかりは画面中央にランダムに呈示され、被験者はその後手がかりの左右いずれかに出現するターデットの位置をボタン押しで反応した。その結果、被験者は手がかりが確率的に有効でないことを認識していたにもかかわらず、それらが示す方向へターゲットが呈示された時、異なる方向に呈示された場合に比べ反応時間が有意に短縮された。実験1・2からは、いずれの手がかりによっても、課題遂行の促進が早い段階で起こり、復帰抑制は起こらないことが示された。また実験3からは、手がかり方向へ被験者の注意が移動していることが確かめられた。全ての実験において、質的交互作用は示されなかった。これより、視線・シンボル・ジェスチャー方向が、いずれも知覚者の注意を自動的にシフトさせると結論できる。
著者
熊木 慶介 南角 吉彦 徳田 恵一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.110, no.97, pp.45-50, 2010-06-17

画像認識システムでは,認識対象の位置,大きさ,回転等の幾何学的な変動に対応する必要がある.これまでに,このような画像の変動に対する正規化が組み込まれた確率モデルとして分離型格子HMMが提案されている.分離型格子HMMでは,横方向,縦方向の2本の状態系列を保持することにより,認識対象の位置や大きさの変動に対応することが可能である.しかし,このモデルでは回転や歪みには対応することができない.そこで本稿では,画像の各行,各列毎に個別の状態系列を保持するモデルとして拡張分離型格子HMMを提案する.状態系列を増やすことにより,複雑な状態アライメントが可能となるため認識対象の回転や歪みに対応できることが期待される.さらに,変分EMアルゴリズムに基づく学習アルゴリズムを導出し,顔画像認識実験により提案法の有効性を示す.
著者
鈴木 道孝 渡辺 秀人 伊藤 彰義
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.107, no.491, pp.117-120, 2008-02-14
被引用文献数
1

統計的文字認識において非線形形状正規化に使われるストローク密度は,文字の切出し枠の位置に依存する.通常は,外接長方形の切出し枠が使われるが,それが最高の認識性能をもたらすわけではない.長方形という制約を解いて,より良い切出し枠の設定のし方を提案する.提案の切出し枠を使って,ETL9Gの多値文字画像データを使った認識実験において実際に認識率が向上することを示す.不良サンプル708件を除いた認識率99.553%を得た.
著者
酒井 恵 内田 誠一 岩村 雅一 大町 真一郎 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.107, no.491, pp.1-6, 2008-02-14

文書画像の回転(スキュー)を補正するため,事例ベース傾き補正法を提案している.事例を用いることにより,文書の直進性を仮定せずに回転角を推定できる.また,事例として回転変量と不変量を用いることにより効率的に回転角を推定できる.変量と不変量はどのようなものでも良いが,前回の報告で用いていた不変量はノイズに弱いという問題があった.そこで本報告では,回転角推定の精度向上を目的として,不変量の多次元化について述べる.計算機内実験において文書画像55サンプルを用いて,簡単な傾き推定実験を行ったところ,48サンプルにおいて誤差1度以下,全てのサンプルにおいて誤差2度以下という精度を得た.また,スキャナ取得画像に対しても評価実験を行った所,目視ではあるが入力10画像中9画像に対して正しく補正できた.
著者
山澤 一誠 石田 皓之 岡本 崇弘 小田 昌宏 前橋 久美子 浅井 俊弘 牧田 孝嗣
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.102, no.532, pp.133-144, 2002-12-13

パターン認識・メディア理解(PRMU)研究専門委員会は,平成9年より研究活動の一環として,若手研究者の発掘・育成を目的としたアルゴリズムコンテストを実施している.第1回目のアルゴリズムコンテストではランダムドットステレオから視差画像を求めるコンテストを行った.第6回目の今年はその第1回目のテーマに立ち戻り,さらに多眼というアレンジを加え,多眼ランダムドットステレオをテーマとしてアルゴリズムを募集した.ステレオ画像の枚数に応じて3つのレベルを設定し,ひとつのアルゴリズムによる複数のレベルへの応募も可能とした.募集の結果,18アルゴリズム,のべ34件の募集があり,審査により6アルゴリズムを入賞とした.さらに情報科学技術フォーラム(FIT2002)において審査結果発表と表彰式,入賞者によるアルゴリズムの紹介,第1回アルゴリズムコンテスト最優秀賞受賞者による特別講演を行った.本報告ではそれらの実施報告と入賞者によるアルゴリズムの紹介をする.
著者
森東 淳 福元 伸也 大塚 作一 三部 靖夫 田中 宏征 武田 光平 野村 雄司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.470, pp.43-48, 2010-03-08

2次元コードが,広告におけるWebページとの連携を目的として広く利用されている.しかし,デザイン性を損なわないように,2次元コードを小さく表示するのが一般的である.このため情報取得が煩わしく,また取得時間がかかるという問題があった.また,デジタルサイネージにおいては,ディスプレイ解像度の問題も加わるため,デザイン性と機能性の両立がより困難になると予想される.そこで,動物体の接近を感知し,2次元コードを適応的に拡大表示する手法を提案する.また,提案手法の有効性を確認する実験を行なった.その結果,(1)提案手法では取得時間を5秒程度短縮できる可能性があること,(2)2次元コードの適切な拡大時間が250ms程度であること,が示唆された.
著者
吉田 友祐 天目 隆平 柴田 史久 木村 朝子 田村 秀行
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.470, pp.7-12, 2007-01-12
被引用文献数
7

複合現実感システムで現実・仮想両空間の幾何学的整合のために用いるマーカは,これまで検出・同定しやすい人工的なパターンが用いられてきた.こうしたマーカの利用が美観を損ねているとの苦情・批判も少なくない.本研究では「美観と頑健性を両立させた半人為的マーカ」の利用を推奨し,そのようなマーカ・セットを場合に応じて使い分けること提唱する.その第一歩として,対象領域と同系色のマーカ群を用いる「ツートンカラー方式」を考案したので,そのデザインと幾何位置合わせを試みた結果を報告する.
著者
有馬 拓也 福元 俊 鹿嶋 雅之 佐藤 公則 渡邊 睦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.470, pp.1-6, 2010-03-08
参考文献数
5
被引用文献数
2

現在の家電製品等のシステムは,利用者が意識的・意図的に動かすものである.その結果,一部の利用者の意思のみが反映される場合がある.複数の利用者の内部状態を推定し,これらの総意によってシステムを制御すれば最大多数の最大幸福が実現できると考えられる.そこで,非拘束状態で撮影した映像から明度ヒストグラムとオプティカルフローを抽出し,部分空間法を用いた各個人の挙動認識を行うことにより各々の内部状態を推定し,それらを統計処理することでシステムの制御を行う手法を考案した.今回は,内部状態が挙動として表出しやすくかつ動作の個人差が少ない「暑い」「寒い」という状態を推定対象とし,多数決により制御目標を決定する方式を採用した.屋内環境における複数人での評価実験を行い,有効性を確認した.
著者
森 稔 澤木 美奈子
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.101, no.713, pp.25-40, 2002-03-08
被引用文献数
4

本稿では,変形や画質劣化が生じた低品質な文字に対する認識手法及びその応用について紹介する.また,性能評価に用いられるデータベース及び評価手法についても述べる.
著者
テリヨン ジャン・クリストフ ピルプレ アルノ 丹羽 義典 山本 和彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.102, no.532, pp.97-102, 2002-12-13

肌色は,カラー画像における顔と手の検出の重要なアプリケーションおよびその最終目的の有意義なヒューマンマシンインターラクションのために,初期段階でよく使える強力かつ基本的なキューである.肌色に基づく画像セグメンテーションのために,有効な色空間の選択は重要な課題であり,顔と手の検出のパフォーマンスがそれに非常に依存する.本稿では,我々は25個の3次元色空間(41個の2次元色彩空間)の特性を分析し,SONY DXC-9000カメラで撮影したアジア人の顔画像の肌色の分布への影響を考察する.特に,色彩空間の幾何的な特性は肌色の分布,そしてセグメンテーションのパフォーマンスに著しい影響を及ぼすことがあることを示す.主に,(R+G+B)またはCIE-(X+Y+Z)で正規化された色彩空間が肌色に基づく画像セグメンテーションに最も有効であることが示された.シングルガウシアン色彩モデルを用いた画像セグメンテーションの例を示し、それについて考察した.