文献一覧: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (雑誌)

1 0 0 0 クラスに依存した特徴集合の有効性の検討

著者: 青木和昭工藤峰一
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.101, no.362, pp.17-24, 2001-10-11
参考文献数: 15

パターン認識においては、測定コストの削減、および識別子の性能向上を目的として、特徴選択を行う。特に、識別情報を持たない特徴の除去は、有限のサンプルから識別子のパラメータを推定する際にパラメータの推定精度を向上させ、結果的に識別子の性能向上につながる。通常、特徴選択は全クラスの識別に有効な特徴を選択する。しかし、一般には、特定のクラス集合を他から区別するのに有効な特徴集合は異なる。本研究では、クラスの部分集合に対して異なる特徴集合を選択し、それらを利用して決定木として識別子を構成する方法の有効性について検討を行う。

2013-06-20 22:01:22
1 はてなブックマーク

https://ci.nii.ac.jp/naid/110003275408

1 0 0 0 オンライン文字認識のためのキューブサーチにおける画間相互位置情報の利用

著者: 迫江博昭アリムハマドマスルール愼重弼
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日: vol.96, no.384, pp.23-28, 1996-11-21

キューブサーチ法は、迫江らによって提案された、筆順フリーなオンライン文字認識を実現するためのアルゴリズムである。本報告では、その高精度化を図るために画間相互位置情報を利用したキューブサーチ法を提案する。手書き漢字に対して認識実験を行なった結果、従来法に比して高い認識率を得ることができた。画間相互位置情報を利用することの効果が確認された。

2013-03-17 17:45:05
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110003274564

1 0 0 0 オンライン文字認識における画間相互情報の利用法と有効性に関する検討

著者: 慎重弼アリムハマドマスルール片山喜規迫江博昭
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日: vol.97, no.325, pp.1-8, 1997-10-17
被引用文献数: 1

キューブサーチは筆順自由なオンライン文字認識のために提案された, 画対応のサーチアルゴリズムである. 本論文では, キューブサーチを拡張し, オンライン文字認識における画間相互情報の利用法を提案する. キューブサーチで入力パターンと標準パターンの間で, 画間相互情報を検出し, それを利用することにより精度の高い認識が可能になることを示す. 画数固定で教育漢字882種18035文字をテストパターンとして用いて, 認識実験を行い, 現実的なリソースで実用的に計算できることと, 高い認識能力があることとを示す.

2013-03-17 17:30:03
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110003274235

1 0 0 0 シーンカット検出のためのMPEG Audioデータのクラスタリングに関する一考察

著者: 二反田直己長谷山美紀北島秀夫
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.102, no.217, pp.7-12, 2002-07-11

シーンの境界であるシーンカットの検出法として,オーディオ信号の変化部に着眼した手法が提案されている.しかし,オーディオ信号にはしばしば無音部が挿入されるため,オーディオ信号の変化部にはシーンカットのみならず,有音部と無音部の境界が含まれてしまい,全ての変化部がシーンカットとは限らない.従って,オーディオ信号の変化部のみからシーンカットを検出することは困難となる.そこで本文では,オーディオ信号の変化部を検出し,変化部を境界として得られたセグメントを有音部と無音部に分類することで,高精度にシーンカットを検出する手法を提案する.また,提案手法はMPEG Audioで符号化されたデータに対し,復号せずに直接処理を行なうことが可能であり,MPEGで符号化された動画像でのシーンカット検出への適応が期待できる.

2013-03-08 20:00:06
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110003275915

1 0 0 0 隠れマルコフモデルを用いた野球放送の自動的インデクシング(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)

著者: Huu Bach Nguyen 篠田浩一古井貞煕
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.104, no.448, pp.13-18, 2004-11-12
被引用文献数: 9

本論文では,野球放送からハイライトシーンを抽出することを目的として,ビデオデータをインデクシングするための統計的なフレームワークを提案する.マルチストリームの隠れマルコフモデルを用い,主成分分析による特徴量,フラクタル特徴量,差分特徴量の3つの特徴量間の重み最適化を行う.また,カメラショットの認識結果をシーン境界の検出に利用した.4.5時間の野球放送のダイジェストデータを用い,このフレームワークの有効性を確認した.8種類のシーンの認識率は76.8%となり,シーン境界検出のない単一ストリームHMMの場合に比べ,11.6ポイントの改善を得た.

2013-03-08 05:30:06
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110003275624

1 0 0 0 ニュース映像中のモノローグシーン検出による発言集の自動作成(一般セッション(6),CVのためのパターン認識・学習理論の新展開)

著者: 關岡直城高橋友和井手一郎村瀬洋
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.105, no.674, pp.277-282, 2006-03-10
被引用文献数: 8

大容量HDDの普及による映像の大量蓄積に伴い,ユーザの所望するシーンを自動検出し,提示する技術が求められている.これを受けて本報告では,ニュース映像における演説やインタビューなどのモノローグシーン検出手法の提案,及びそれらを用いたニュース発言集の自動作成を試みる.モノローグシーン検出では,画像・音声・テキスト情報を用いた統合メディア処理により既存の手法を効果的に組み合わせることで,入力映像のみを情報源とした自動検出手法を提案する.発言集の作成には,クローズドキャプション中の人名による,各モノローグシーンの名前の対応付けにより,登場人物の発言集の作成を試みた.実験の結果,モノローグ数の最も多い上位3名の登場人物に対して,平均再現率37%,平均適合率52%の発言集の正答率が得られた.

2013-02-26 01:45:06
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110004680489

1 0 0 0 文字列と数式が混在したオンライン手書きパターンの認識手法(文書・文字メディアの認識・理解, 一般)

著者: 持田桂介耒代誠仁朱碧蘭小沼元輝中川正樹
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.104, no.741, pp.43-48, 2005-03-10

本稿では, 数式の混在を許容したオンライン手書き文字列認識手法を提案する.文字列認識や数式認識は, それぞれが認識対象とするパターンだけしか入力されないことを前提としている.しかし, 手書きパターン認識の分野では, これらが混在して入力される場合を想定しなければならない.本手法では, すべての数式を一つの文字として日本語文脈構造に取り入れることで, 従来の文字列認識手法に基づいた処理を可能とした.このとき, 元々文字列認識手法に基づいているため, 数式が混在しない文字列に対しても問題なく処理可能である.また, 一文字でも文字列として扱うという考えを拡張し, 数式だけの入力に対しても「数式」という一文字で構成される文字列として扱うことが可能である.

2013-02-10 07:24:05
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110003275736

1 0 0 0 全方位画像からの視線追従型実時間画像生成によるテレプレゼンス

著者: 尾上良雄山澤一誠横矢直和竹村治雄
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日: vol.97, no.40, pp.151-157, 1997-05-15
被引用文献数: 7

移動ロボットの遠隔操作や多人数で行う遠隔通信会議などにおいて,遠隔地の情景を画像として提示するテレプレゼンス技術の必要性が高まっている.遠隔地の画像を観察することにより,前者においてはロボットの周囲の状況の理解が深まり,後者においては臨場感が増すという利点がある.従来は,視野の狭い固定されたカメラの利用や,見回しに時間遅れが生じる回転するカメラの利用が一般的であった.本稿では,全方位視覚センサを利用し,利用者の視線に追従しながらその方向の透視投影画像を生成・提示する実時間テレプレゼンスシステムについて報告する.

2013-01-29 01:30:04
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110003274141

1 0 0 0 アフィンモデルにおける因子分解法の数理とその検証

著者: 藤木淳蔵田武志
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日: vol.97, no.40, pp.167-174, 1997-05-15
被引用文献数: 4

因子分解法は形状とカメラの運動の復元方法として広く用いられているが,この方法の数理的意味についてはあまり議論がなされてこなかった。因子分解法は観測行列を特異値分解などを用いて2つの行列の積に分解することによって形状とカメラの運動の推定値を求めるステップとその推定値を修正するための正則行列を求める2つのステップに分けられる。本稿では,第1のステップで得られた推定値が単位行列でない計量をもつアフィン座標系により記述されていると解釈し,第2のステップが,この計量を決定することにより推定値を単位行列を計量とする座標系によって記述しなおすステップであることを明らかにした。この立場によってアフィン画像から得られる情報の全てを明らかにし,因子分解法の直感的な把握を可能とした。その例として,3枚の異なるアフィン画像から形状復元解が一意に定まる理由と2枚のアフィン画像から得られる形状復元に関する情報を明らかにした。

2013-01-17 16:37:01
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110003274143

1 0 0 0 スケールフリーアクティブ探索法 : 入力画像の解像度を適応的に変更するテンプレート照合の高速化手法

著者: 大盛善啓
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.109, no.182, pp.69-74, 2009-08-24
参考文献数: 10

大きさが未知の物体を探す照合(スケールフリーテンプレート照合と呼ぶ)を高速化する手法を提案する.入力画像の解像度を少しずつ変更しながら大きさが既知の物体を探すテンプレート照合を繰り返せば大きさが未知の物体を探索できる.膨大な回数の照合が必要なのでスケールフリーテンプレート照合は計算コストが非常に大きい.入力画像の解像度を粗く変更すれば高速化できるが探索漏れが発生する問題があった.そこで提案手法では,類似度が小さい場合は粗く,類似度が大きい場合は細かく入力画像の解像度を変更して高速化する.画像から抽出した正規化色ヒストグラムのヒストグラム重なり率で類似度を算出し,あらかじめ与えられたしきい値を類似度が超えない範囲で解像度を変更するため,提案手法では原理的に探索漏れが発生しない.本稿では,解像度の変化率の上限と下限を類似度から求める原理を導き,可変の変化率で照合するアルゴリズムを示す.同じ照合精度ならば提案手法は従来手法より1.5〜4.0倍高速で,同じ処理時間ならば照合誤差を1/3.0に低減できることを実験結果で示す.

2012-12-26 19:24:05
1 はてなブックマーク

https://ci.nii.ac.jp/naid/110007387913

1 0 0 0 実用化に向けた顔画像処理技術(特別講演,顔・人物・ジェスチャ・行動)

著者: 井尻善久勞世〓村瀬洋
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.109, no.470, pp.107-112, 2010-03-08
被引用文献数: 4

顔画像処理技術は,ここ10年間の間に最も発展し成功した画像処理技術の一つである.本発表においては,顔画像処理の動向・基本技術を振り返り,その実用化について解説する.

2012-12-19 13:51:43
1 はてなブックマーク

https://ci.nii.ac.jp/naid/110008002830

1 0 0 0 ボロノイ図を応用したスポーツチームワークの定量的評価

著者: 藤村光杉原厚吉
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.100, no.702, pp.145-152, 2001-03-16

本研究では、選手が特定のフィールド上を自由に動き回り、目標に対して競い合うチームスポーツを対象にして、チームワークの定量的評価を行う。この種のスポーツでは、各選手の支配領域を求めることがチームワーク評価への道となる。そのため、領域を支配関係によって分割するボロノイ図の概念を応用し、それによるチームワークの定量的評価手法を提案する。また本研究においてはこの優勢領域図の作成にあたって、実験に基づいたより現実的な運動モデルを採用している。これにより、より経験者の直感に合うチームワーク評価を実現できた。

2012-11-09 22:12:22
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110003275303

1 0 0 0 ラフ集合理論に基づく少数のサンプル映像からの多様性に対応可能な検索ルール抽出手法

著者: 白浜公章松岡悠太上原邦昭
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.110, no.414, pp.129-134, 2011-02-10

本論文では,ユーザから与えられたサンプルから,クエリーにマッチするショットを検索する映像例示型検索手法を提案する.特に,異なる撮影技法・状況で撮影された多様なショットを検索するために,'ラフ集合理論'を用いて,サンプルから複数の検索ルールを抽出する.また,少数のサンプルから検索可能なショットの範囲を拡張するために,"バギング"と"ランダムサブスペース法"を導入する.具体的には,サンプルと特徴量の次元をランダムに変更して構築した分類器によって,大きく異なるショットが特徴づけられるようになる.さらに,計算コストを削減するために,"MapReduce"という並列プログラミングモデルを用いて検索プロセスを並列化する.実験では,TRECVID 2009の映像データを対象として,本手法の有効性を示す.

2012-10-31 00:12:02
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110008690099

1 0 0 0 バイラテラルフィルタのエッジ強調性とスケールスペースの性質

著者: 浦浜喜一井上光平
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.102, no.217, pp.39-44, 2002-07-11

Tomasiらによって提案されたバイラテラル(bilateral)フィルタは高速性や性能面で興味を持たれ,多くの解析や応用が行なわれている.本論文では非線形回帰に基づくバイラテラルフィルタの解釈や既存フィルタとの関係について調べ,エッジ強調性や反復バイラテラルフィルタの性質を調べる.またバイラテラルフィルタのスケールスペースについて,画像のセグメンテーションへの応用例と簡単な計算高速化法を示す.

2012-10-24 23:17:56
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110003275921

1 0 0 0 第13回パターン認識国際会議 (13th ICPR) 報告

著者: 村瀬洋増田健谷口倫一郎井宮淳岡田稔今井正和中島昇黄瀬浩一斎藤英雄坂野鋭
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日: vol.96, no.435, pp.57-66, 1996-12-19
被引用文献数: 1

1996年8月, オーストリアのウィーンで開催された第13回パターン認識国際会議 (13th ICPR) に出席したので, その概要を報告する。

2012-10-08 16:45:05
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110003274592

1 0 0 0 多視点映像の融合によるスポーツシーンの自由視点映像生成 : 3次元形状表現用平面の適応的配置

著者: 北原格大田友一
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.100, no.633, pp.23-30, 2001-02-15
被引用文献数: 18

近年のコンピュータの処理能力やビデオ機器の発達にともない, 多視点カメラによって撮影された映像データを融合し, そのデータを元に自由視点からの見え方を提示する研究が盛んに行われている.本稿では, 「観察者への提示を前提とする」という最近のCV研究の流れに沿って3次元モデル生成手法を再考し, 自由視点に対して適応的に配置された平面上の2次元形状の集合によって3次元形状を表現する手法を提案する.向き, 分解能, 間隔を調整することで, 自由視点に対して適応的に平面を配置する手法と, 配置した平面に対する自由視点の移動許容範囲について述べる.提案する3次元モデルによる3次元形状復元、及び自由視点映像生成の手法について説明し, 最後にCGモデラーを用いた定量的な検証実験により, 平面を適応的に配置する手法の有効性を確認した.

2012-09-20 20:15:29
1 はてなブックマーク

https://ci.nii.ac.jp/naid/110003275211

1 0 0 0 事例映像への適合度と知覚品質に基づくホームビデオ編集支援(一般,顔・人物・ジェスチャ・行動)

著者: 吉田好新田直子馬場口登
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.109, no.470, pp.347-352, 2010-03-08

映像編集は一般に,素材映像から選択された部分映像の並び替えにより実現される.本研究は,専門家により制作された編集映像を事例映像として用いることにより,一般ユーザによるホームビデオを素材映像とする映像編集の支援を目指す.提案手法では,まず,事例映像の各ショットを,特徴量の量子化に基づきシンボル化する.次に,素材映像をカメラワークの切り替わりでセグメントに分割し,各シンボルへの適合度及び,ホームビデオ特有の手振れなどに関連する知覚品質の2つの尺度に基づき,セグメントを評価する.事例映像から得られたシンボル列及び,シンボルへの適合度・知覚品質・時系列に応じて配置されたセグメントをインタフェース上に提示し,映像編集におけるセグメントの選択・配置を支援する.

2012-09-05 16:53:24
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110008002871

1 0 0 0 コミュニケーションを円滑に進めるための表情変化検出方式の検討(テーマセッション,手,顔,身体表現の認識,理解)

著者: 森博章宮脇健三郎佐野睦夫西口敏司
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.108, no.198, pp.159-162, 2008-08-29

人とロボットの円滑なコミュニケーションの実現において,顔の表情は重要な役割を果しており,表情認識はコミュニケーションの状態理解において極めて重要である.本研究では,横顔や後顔も含めた微妙な表情変化を認識することを目標として,第1段階として,検討例がほとんどない横顔の表情認識を扱う.具体的には,Active Appearance Model (AAM)を用いて顔の時系列画像に対して顔モデルの追跡を行い,顔モデルを構成する特徴点から,FACSモデルに対応したAU (Action Unit)特徴を算出し,AU特徴の時系列データの変動パターンを詳細に分析することにより,微妙な表情の変化に着目した認識方式について検討を行った.

2012-08-24 17:43:04
1 はてなブックマーク

https://ci.nii.ac.jp/naid/110007087113

1 0 0 0 表情の動的多様性に基づく表情表出リズムの抽出(一般セッション4,移動カメラ画像処理におけるパターン認識とメディア理解)

著者: 佐藤和人間所洋和門脇さくら
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.108, no.363, pp.207-212, 2008-12-11

本論文では,心理的ストレスレベルに起因する表情の覚醒度合いとその時間的遷移が作り出す時系列パターンを表情表出リズムと定義し,顔の静的多様性と動的多様性に着目した個人固有な表情空間チャートを利用して,人間が創り出す表情表出リズムの可視化する手法を提案する.本手法は,SOM(Self-Organizing Maps)とFuzzy ART(Adaptive Resonance Theory)の2種類の教師なしニューラルネットワークをハイブリッド化して得られる表情の覚醒度から表情空間チャートを生成し,更にFuzzy ARTMAPで学習することにより表情空間をモデル化するためのコードブックを作成し,HMM(Hidden Markov Model)を用いて表情の時系列パターンの変化から表情表出リズムを抽出する.18歳から22歳までの男子学生5名と女子学生5名の計10名を対象とした評価実験では,HMMが推定した状態遷移系列は表情表出に伴う表情変化の範囲を適切に捉えており,表情表出プロセスにおける中間表情の覚醒パターンを抽出する際にHMMの状態数を用いて制御可能であることを確認した.

2012-08-24 17:34:16
1 はてなブックマーク

https://ci.nii.ac.jp/naid/110007123761

1 0 0 0 AAMを利用した表情成分抽出に基づく表情模倣システム

著者: 福井竜一桂田浩一入部百合絵新田恒雄
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.109, no.470, pp.513-518, 2010-03-08
参考文献数: 11
被引用文献数: 2

本報告では,Active Appearance Model (AAM)を利用した表情成分抽出と表情模倣を提案する.AAMは,顔の形状や輝度,照明状況などを複合的に表すパラメータ群からなる顔モデルである.パラメータを変動させることで様々な表情顔を合成できる.通常のAAMは複数人の顔画像から構築されるため,AAMパラメータには表情以外の顔成分も含まれるため,表情模倣には個人間で不変な表情モデルを取得する必要がある.そこで本報告では,まず特定の人物が様々な表情をみせたデータを収集し,これらを主成分分析することで表情成分を抽出する.次に,これを人共通の表情モデルとすることで表情模倣を実現し,試作システム構築とその評価結果を述べる.

2012-08-24 14:39:00
1 はてなブックマーク

https://ci.nii.ac.jp/naid/110008002899