文献一覧: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (雑誌)

2 0 0 0 ビデオシースルー型拡張現実感のためのステレオ画像合成

著者: 神原誠之大隈隆史竹村治雄横矢直和
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日: vol.98, no.677, pp.33-40, 1999-03-18
参考文献数: 16
被引用文献数: 3

現実環境と仮想環境を融合する技術は拡張現実感と呼ばれ, 現実環境に情報を付加することが可能であることから新たな情報提示手法の1つとして注目されている. 拡張現実環境をユーザに提示するには, 現実環境と仮想環境の正確な位置合わせ, 画像合成, およびユーザへの提示を実時間で行なう必要がある. 本稿では, 現実環境と仮想環境の時間的な同期が取れることから, 両者の位置ずれが生じないという特徴を持つ, ビジョンセンサとビデオシースルーの組み合わせを用いる拡張現実感のための画像合成手法を提案する. 本手法では, 現実環境中に配置されたマーカをHMDに取り付けた2眼のステレオカメラで撮影し, この画像からカメラパラメータを推定する. 同時に, 現実物体と仮想物体の正確な前後関係を表現するために, 現実環境の奥行き情報を実時間で取得する. その際, 奥行き推定を拡張現実感に特化することで計算量を削減し, 実時間処理を可能にした.

https://ci.nii.ac.jp/naid/110003274887

2 0 0 0 文字認識分野における確率降下法の応用

著者: 黒沢由明
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.106, no.428, pp.49-54, 2006-12-07
参考文献数: 25
被引用文献数: 2

本稿は,文字認識技術におけるMCE/GPDの応用について述べたものである.まず,文字認識分野で従来から用いられて来たLVQと,部分空間法の辞書作成手段として提案されたLSM.ALSMを紹介し,それら従来技術とMCE/GPDの関係について述べる.さらに,OCRの特徴抽出機構にMCE/GPDを適用したDFEについて紹介し,最後に再び,LSM,ALSMをMCE/GPDの立場から見た時た時の解釈を検討する.その結果,LSMについてはノルムの割算部分を除いてMCE/GPDで説明できること,ALSMについてはMCE/GPDの立場での説明が難しいことが分かった.

https://ci.nii.ac.jp/naid/110006207329

2 0 0 0 割注を含む活字文書画像からの文字切り出し(テーマセッション,文字・文書の認識・理解)

著者: 島貴宏寺沢憲吾川嶋稔夫
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.109, no.418, pp.57-62, 2010-02-11
参考文献数: 7

割注の含まれた活字文書資料画像における文字切り出しの手法を提案する.市販OCRソフトウェアでは割注を検出することができないため,電子化の妨げとなっている.本研究では,割注の特性に注目して射影のモデルを立てることにより,割注を含んだ文書画像から文字の切り出しを行う.

2017-05-28 14:05:17
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110008002796

2 0 0 0 レンジデータの局所平面当てはめ手法の比較

著者: 王彩華棚橋英樹平湯秀和丹羽義典山本和彦
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.101, no.58, pp.77-83, 2001-05-11
参考文献数: 13

本研究では, ノイズのあるレンジデータから局所平面を安定的かつ, 効率的に当てはめるために, タイムフライレーザーレンジファインダーで得られたレンジデータのノイズモデルに基づいて, 局所平面の最適当てはめの幾つかの近似的な推定手法を導出する. また, シミュレーションレンジデータとGround Truthの分かる実測レンジデータを用いて, 提案手法に対して, 最小二乗法や固有値法, 最尤推定法など一般的な平面当てはめ手法, 及びノイズモデルに最適な当てはめ手法であるくりこみ法を比較し, これらの手法の性能と安定性を評価し, 提案手法の有効性を示す.

2017-05-18 00:18:10
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110003275326

2 0 0 0 IC旅券と, 顔認証技術導入へ向けての評価 : IC旅券調査委員会WG2(バイオメトリクス)(テーマセッション, 顔・ジェスチャーの認識・理解)

著者: 榊純一坂本静生矢野博司神田宰塩原守人助川寛磯部義明春山智村田伸一吉澤正浩平野誠治室田秀樹瀬戸哲司松中耕二山越学西尾太林義昭
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.105, no.374, pp.51-56, 2005-10-20
被引用文献数: 2

まもなく旅券(パスポート)にコンタクトレスICが搭載されようとしている.またこのICチップ上には, 本人認証を行うためのバイオメトリクスデータ, 顔画像が記録されることとなっている.本稿では, このIC旅券導入にあたっての経緯について簡単に照会すると共に, 日本において発給を開始するにあたって, IC旅券調査委員会が実施した調査検討の中から, 特に, (1)顔認証技術適用を前提とした旅券写真に関する技術的妥当性評価と, (2)IC旅券有効期間中の加齢に伴う顔認証精度評価の二点について述べる.

2017-01-31 10:33:11
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110003496734

2 0 0 0 カメラの動き補正に基づく時空間特徴量とGMM supervectorを用いた映像からのイベント検出(テーマセッション,大規模データベースとパターン認識)

著者: 上嶋勇祐井上中順篠田浩一
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.112, no.441, pp.185-190, 2013-02-14

この研究では、大量のインターネット映像の中から、対象のイベントを検出するイベント検出を目的とする。ここでの「イベント」は、「誕生日会」や「乗り物のタイヤ交換」など、いくつかの動作や物体の組み合わせで構成される事象を指す。イベント検出を対象とした多くの研究では、局所特徴抽出と特徴量のモデル化による手法が用いられている。特徴量の中でも、動作を表す時空間特徴量がイベント検出に効果的であることが示されているが、カメラの動きに対して頑健でないという問題がある。本論文では、この問題に対し、オプティカルフローによるカメラの動き推定とその補正を適用した時空間特徴量を提案する。この特徴量を含む、相補的な特徴量をそれぞれGMM supervectorによってモデル化し、SVMの入力として用いることでイベント検出を行う。TRECVID2012 Multimedia Event Detectionタスクで、Mean Normalized Detection Cost O.5296となり、参加17機関中3番目の精度であった。

2016-11-23 14:20:41
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110009728823

2 0 0 0 文化財情報発信における画像資料の活用について(パターン認識・メディア理解における組み合わせと統合,文化の振興と教育)

著者: 丸川雄三
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日: vol.113, no.493, 2014-03-06

発表者がこれまで手掛けてきた「文化遺産オンライン」,「想-IMAGINE国立美術館」,「実業史錦絵絵引」などのウェブサイトの紹介を通して,文化財情報発信において画像資料が必要とされている場面を示すとともに,画像資料の有効活用を促すための技術的課題について論じる.

https://ci.nii.ac.jp/naid/110009862547

2 0 0 0 グラフカットに基づく画像分割の四分木表現による改善(一般セッション1,三次元画像,多視点画像)

著者: 奥田透也末松伸朗林朗
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.107, no.539, pp.17-22, 2008-03-03

本稿では四分木表現を利用したグラフカットに基づく画像分割法を提案する.画像分割をグラフカット問題として表し,グラフカットの多項式時間アルゴリズムを利用して画像分割を行う方法が近年注目されている.しかし,その方法では画像の各画素をグラフの頂点とするため,高解像度の画像を分割するためには多くの計算コストがかかる.そこで本稿では四分木表現で表された各画像領域を頂点とすることでグラフの規模を縮小し,計算コストの低減を行う.また,提案手法はある程度広がりを持つ画像領域の情報に基づくグラフカットであるため,1画素を頂点とする手法よりも高い精度を達成できる.また本稿では,提案手法の精度および速度の面における有効性を実画像を用いた実験により示す.

2016-08-31 18:40:22
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110006937563

2 0 0 0 持ち主不在の静止物体とじっとして動かない人を識別するための埋め込み型背景モデリング(一般セッション,大規模データベースとパターン認識)

著者: ティンティティ濱裕光鳥生隆ティンパイ
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.112, no.441, pp.239-244, 2013-02-14

本論文では、公共空間において持ち主不在の不審物やじっとしていて全く動かない人を検知するための埋込み型背景モデリング技術を提案する。ここでは統計的背景を埋め込むことにより、2変量背景モデルを強化した多変量背景モデルをべースとした新しい背景差分アルゴリズムを導入する。さらに、論理的、統計的解析を行い、関西国際空港、学内キャンパスで撮影されたビデオやPETS 2006データセットを用いて実験を行い、提案手法の有効性を確認した。

2016-05-16 01:19:34
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110009728832

2 0 0 0 IR 画像情報統合に基づく超音波気管支鏡ナビゲーションシステム(テーマセッション,医用画像処理分野における計測・認識・理解)

著者: 久郷達也北坂孝幸羅雄彪 PHILIPP Dressel REICHL Tobias FEUERSTEIN Marco NAVAB Nassir 森健策
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.111, no.48, pp.7-12, 2011-05-12

本稿では,超音波気管支鏡のためのナビゲーションシステムに関して報告する.このシステムでは,先端のカメラにより撮影した実気管支鏡像上やCT像から作成した仮想化気管支鏡像上に超音波画像を合成表示することで,超音波気管支鏡が現在観察している位置やその周辺情報を提示する.まず,カメラ画像-超音波画像座標系間,CT像-超音波画像座標系間の座標変換を行う変換行列を求める.次に求めた変換行列を用いてカメラ画像,CT像座標系での超音波画像観察位置を推定し,超音波画像を合成表示する.最後にナビゲーションシステムにこの合成画像をリアルタイム表示する.推定した変換行列による座標変換精度はそれぞれ平均10.63 pixels,1.08 mmの誤差であった.これらの変換行列を用いて実気管支鏡像上,仮想気管支鏡像上に超音波画像を合成表示した結果,良好な位置に超音波画像を表示することができた.

2016-03-21 03:40:24
2 + 0 Twitter

https://ci.nii.ac.jp/naid/120005712401

2 0 0 0 日本語活字フォントの識別

著者: 阿部悌
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日: vol.96, no.599, pp.119-126, 1997-03-19
被引用文献数: 1

高度化する文書認識/再現技術において文字画像に対して文字コードのみならず、そのフォントやサイズを識別する技術が求められている。フォント識別技術は文書画像の忠実な再現やOCRの辞書の切り替え、キーワードの自動抽出といった応用に対して非常に有用である。本報告では識別対象のフォントを明朝体とゴシック体に限定し、文字種毎の辞書や文字コードの情報を使わずにこれらを識別する方式を提案する。ランレングスヒストグラムやストロークの幅とその変化率、セリフの抽出など様々な特徴量を用いたロバストな方式となっている。本方式を多くの文書画像データベースに対して実験を行ない、その有効性を検証した。

2015-09-14 00:26:17
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110003274499

2 0 0 0 顔画像からの性別と年齢の統合的推定方法の提案

著者: 本郷仁志石井洋平丹羽義典山本和彦
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.102, no.532, pp.1-6, 2002-12-13
被引用文献数: 9

顔画像から性別と年齢を統合的に推定する方法を提案する.本稿では,顔画像から抽出した四方向面特徴を線形判別分析で学習した識別器をベースとし,性別・年齢のクラス分類の方法の違いによる推定率を比較する.特徴量としては,肌色情報で抽出した顔外接領域と目と口を囲む顔部品領域とから抽出した特徴量を用いた.HOIP顔画像データベース300名の正面顔画像に対して実験を行ったところ,性別推定では,男女混在分類において92%の識別率を得た.年齢推定においては,男女と性別で分け,年齢を10歳区分で学習することで,学習人物に対しては約70%,未知人物に対しては,約40%が得られた.本提案手法による性別及び年齢の推定が可能である見込みが得られた.

2014-12-04 10:55:31
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110003273640

2 0 0 0 顔画像による人種推定技術(顔とジェスチャの認識)

著者: 瀧川えりな細井聖川出雅人
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.103, no.452, pp.19-24, 2003-11-13
被引用文献数: 3

我々は視覚による顔の理解技術の研究開発を進めている。性別、年代、人種、表情といった視覚から得られる情報は、人対人のコミュニケーションに大きな役割を果たしており、同様に機械が視覚によって人の顔をセンシング・理解できれば、従来の人が機械に合わせるインタフェースを革新し、機械が人に合わせるインタフェースの実現が可能であると考える。本稿では、顔画像にガボールウェーブレット変換+Retinaサンプリングによる特徴抽出と、サポートベクタマシンによる識別器を適用し、人種推定を試みた。また、顔を見せるだけで自動的に推定が可能なシステムも構築した。推定精度はAsian/European/Aficanの3分類において、約9割以上と高い推定精度を実現した。

https://ci.nii.ac.jp/naid/110003273853

2 0 0 0 癒し系ロボットPDDIN2005 : 状況と対話者感情を考慮した発話と行動(テーマセッション(4),文字認識・文書理解)

著者: 小澤朋之原田俊信山口和仁佐々木洋輔高井伸輔小幡琢磨亀田弘之
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.105, no.615, pp.171-176, 2006-02-17
被引用文献数: 4

近年、ロボットによる癒し(すなわち、ロボットセラピー)が注目されている。このような観点から、筆者らも癒し効果を持つロボット「PDDIN(プディン)」の研究・開発を行なっている。本稿では、PDDINの癒し効果の向上およびコミュニケーション能力の高度化を目的として新たに考案した機能について報告する。具体的には、「ごきげん」「あいじょう」の二つのパラメータによって感情を表出する手法を提案・実装した。また、外部状況取得機能と対話者感情推測機能を実装し、PDDINが状況と対話者感情をともに考慮して発話や行動を行えるようにした。さらにPDDINの外観を変更して、PDDIN2005と命名した。評価実験の結果、ロボット(PDDIN2005)がより豊かな感情表現を持ち、それを人が認知しやすいように表出することが可能であることが示された。

2014-05-23 10:58:03
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110004662996

2 0 0 0 映像と音声特徴に基づく映画のハイライトシーン抽出に関する研究

著者: 鶴田伸一押川修士鹿嶋雅之佐藤公則渡邊睦
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.109, no.470, pp.31-36, 2010-03-08
参考文献数: 18

動画コンテンツのハイライトシーン抽出に関する研究は数多く見られるが,その多くはスポーツ映像やニュース映像など,構図やシナリオ等が既知のものを対象としている.本研究において,我々は映画やテレビドラマなどの動画コンテンツに対し,見せ場シーンに着目したハイライトシーン抽出手法を提案する.提案手法では動画コンテンツを音声と映像の2つの視点から捉え,それぞれから個別に特徴抽出を行う.これらの特徴抽出は,ハイライトシーン抽出の対象となる映像コンテンツに関する事前知識を全く必要とすることなく行われる.また,各々の特徴に対し重み付けを行い評価することにより,会話・動き・効果音それぞれに着目した映像メディアの検索が容易に行える.パブリックドメインのカラー実写映画およびアニメーションに対し,提案手法を適用し,特徴シーンの抽出およびそれに基づいたシーンの分割図の作成を行った.

2013-12-04 10:30:04
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110008002817

2 0 0 0 基礎行列の高精度計算法とその性能比較(一般セッション(5),CVのためのパターン認識・学習理論の新展開)

著者: 菅谷保之金谷健一
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.105, no.674, pp.35-42, 2006-03-10
参考文献数: 18

本論文では2画像の特徴点対応から基礎行列を計算する最尤推定とそのKCR下界との関係を述べ,具体的な数値計算法としてFNS法,HEIV法,くりこみ法のアルゴリズムをまとめる.さらにガウス・ニュートン反復を用いる方法を追加し,シミュレーション画像を用いてこれらの反復解法の収束性を検討する.反復の初期値はランダムに,最小二乗法で,およびTaubin法で定める3通りで比較する.最後に実画像を用いた実験を示す.これらの実験によって各々の計算法の特質が明らかになり,結論としてFNS法が最も収束性に優れていることが示される.

2013-12-04 09:30:06
2 + 1 Twitter

https://ci.nii.ac.jp/naid/110004680452

2 0 0 0 PRMU2000-30 見たいシーンを見逃さないライブ中継LinveWatch

著者: 田中清阿久津明人外村佳伸秦泉寺浩史
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.100, no.134, pp.51-56, 2000-06-15
参考文献数: 7
被引用文献数: 11

次世代のディジタル放送やインターネット放送に向けて, 視聴者の要求に基づいた番組視聴方法の実現が求められている.本稿では, 映像配信に意味情報配信を加えることによって, イタラクティブなライブ中継を実現できるライブ中継システムLiveWatchを提案する.通常, ライブ中継では見たいシーンが来るまで映像を眺めていなければならないが, LiveWatchではシステムが意味情報を用いてシーンを判定しユーザに知らせるので, 見たいシーンを見逃さない.高校野球をターゲットとしたLiveWatchインターネットライブ中継実験を行い, LiveWatchの有効性を確認した.

https://ci.nii.ac.jp/naid/110003275069

2 0 0 0 母音音声の色彩表現を用いる構音訓練における視覚的音韻規準に関する検討(テーマセッション,光と色の解析・表現とその応用)

著者: 上田裕市富田翔坂田聡
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.109, no.249, pp.31-36, 2009-10-15
参考文献数: 15
被引用文献数: 3

音声可視化手法として,音声画像表現に基づくリアルタイムシステムを構築し,聴覚障害児の発声訓練における機能評価を行っている.母音フォルマント周波数のRGB変換による色彩パタン表現は,本可視化手法における主要機能であり,連続的な調音運動により生成される母音音声の音韻性(音色)を色の違いとしてリアルタイムに視知覚することができる.本報告では,多数の男女声母音の音韻正規化に関して,フォルマント空間に対するRGB空間の優位性を示すと共に,色彩表示ベースの母音構音訓練において,発声の目標となる視覚的音韻規準(色相環)の作成について報告する.

2013-07-04 01:35:04
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110007484280

2 0 0 0 パーセプトルーム構築のための多方向顔画像データベース開発

著者: 本郷仁志安本護渡辺博己ジャンクリストフテリヨン山本和彦
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.100, no.443, pp.7-12, 2000-11-10
被引用文献数: 16

多視点カメラ画像から人物の性別、年齢、顔向きなどの情報をセンシングすることで、その人物の意図を推察し活動を支援する空間(パーセプトルーム)の構築を目的として、幅広い年齢層から男女均等に顔画像を水平24方向・垂直7方向各15度間隔の168方向から収集した300名のデータベースを開発している。本稿では、パーセプトルームのプラットフォームとなる多視点画像収集システムとそれを用いて収集した多方向顔画像データベースについて述べる.本データベースを用いて顔部品抽出した結果について報告する。

https://ci.nii.ac.jp/naid/110003275197

2 0 0 0 画像検索アルゴリズムの自動生成に関する検討

著者: 趙剛小林亜樹酒井善則
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.100, no.311, pp.23-28, 2000-09-14
被引用文献数: 2

近年、画像内容検索技術が非常に注目されており、本研究室では、キーワードによる画像検索システムを提案してきた。従来システムの検索アルゴリズムでは、各量子化器の出力値が0か1の二値であり、最終出力に対して同等の影響を持つ。しかし、実際には量子化器の検索への重要性にばらつきがあるため、検索効率に悪影響を及ぼしていた。本稿では、量子化器の出力値の多値化による検索アルゴリズムを導入する。その実現手法として、実数値による重みの概念を導入して、量子化器単位における重み付け法やクラスタ単位における重み付け法を提案・実践し、対ユーザーインターフェースを作成し、実画像を用いた検索実験で提案アルゴリズムの有効性を確認した。

2012-06-25 18:21:49
2 はてなブックマーク

https://ci.nii.ac.jp/naid/110003275125