著者
小田嶋 成幸 森 武俊 下坂 正倫 野口 博史 佐藤 知正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.88, pp.31-36, 2009-06-11

本論文では、室内環境での、物品検出システムを提案する。物品が置かれた時、取り除かれた時には入力画像の安定的変化が生じることが期待できるため、本研究では背景差分法を用いた物品検出システムの構築を行う。背景差分法の出力から物品の設置、除去を判別するため、本研究では複層型背景モデルを採用する。画像の安定変化は人領域のような一時静止領域によっても引き起こされるため、一時静止領域と物体領域の判別が必要になる。オクルージョンの多い室内環境において頑健な判別を実現するため、本研究では特徴点を用いたトラッキング手法と局所フレーム差分を用いる。実験により、提案手法を用いて十分な速度で頑健な検出が可能であることが明らかとなった。
著者
石井 大祐 河村 圭 渡辺 裕
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.64, pp.187-192, 2009-05-21

コミックのコマ分割では高速かつ高精度な処理が必要とされている.我々はこれまで高速性と正確性の両立を目的とした高速高精度コマ分割手法(FAFSM)の提案を行ってきた.コマ分割では,処理プロセスの低減だけでなく,画像解像度の縮小により処理の高速化を行うことが可能である.しかしながら,画像解像度の縮小率が高くなるにつれてコマの分割精度は低下する.本稿では,実際にコマ分割実験を行い,コマ分割における分割精度と処理時間との相対的な評価を行った.そして,FAFSMにおける画像解像度変換によるコマ分割への影響に関して検討を行った.
著者
武 小萌 張 文利 上條 俊介 坂内 正夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.103, no.207, pp.41-46, 2003-07-10

近年,映像情報システムの構築を目的とする研究が盛んに行われてきたのだが,このようなシステムに基づいて提案された実用的なアプリケーションはまだ少ないのが現状である.本稿では,映像内のオブジェクトに注目し,ドラマ登場人物人気投票システムと呼ばれるオブジェクト記述を利用した対話型映像情報利用システムを提案する.提案システムにより,ネットワーク上で複数のユーザが同じ放送映像を見ながら,登場人物に対して好感度に分けて投票する.投票情報がサーバ側で収集・蓄積・利用される一方,異なった登場人物の人気度,そして異なった映像時間帯の投票率等に関する統計量を提供することが可能である.
著者
小笠原 崇 高橋 友和 井手 一郎 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.606, pp.55-60, 2007-03-09

近年、大量に蓄積された映像データを効率的・効果的に利用するための技術が求められている。ニュース映像アーカイブにおいて、閲覧・検索のキーとなる重要な情報の一つとして映像中の登場人物がある。登場人物をキーとした映像の閲覧や検索を支援する技術は、従来から研究がなされているが、それらはもっぱら「名前」によってのみ人物を区別し、複数の呼称を持つ人物は、その呼称ごとに別々の人物として扱われてきた。本研究では、この問題に対処すべく、複数の呼称を持つ登場人物の同定(いわゆる"名寄せ")を行う手法の開発を行っている。名寄せは、言語処理や意味解析の高度化により、ある程度は実現できるが、「東国原知事」に対して「そのまんま東」のような通称を名寄せする場合など、言語処理での解決が困難な場面は多々ある。そこで、本手法では各呼称に対応付く人物の顔を利用することで、言語的な変化に影響されない枠組みでの名寄せを試みた。本報告では、5年半に渡り蓄積されたニュース映像アーカイブに対し本手法を適用した。結果から、本手法の名寄せ効果を確認した。
著者
荒木 祐一 島田 伸敬 白井 良明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.101, no.569, pp.87-94, 2002-01-11
被引用文献数
24

本論文では複雑背景下において大きさや位置, 方向が未知な顔を検出し, その顔の方向を推定する手法を提案する.まず, 目や口といった顔要素の候補を抽出し, 各顔要素らしさを計算する.次に, 顔としての幾何学的位置関係を満たしている顔要素の候補の組合せを顔として検出する.しかし, さまざま顔の大きさや方向を考慮する必要があるのでその組合せの数は膨大になる.そこで, その組合せの数を減らすために, 一般化ハフ変換により顔の候補領域の位置と大きさを限定する.その後, 確率の更新方法と効率的な顔検出を行なうために顔要素の候補間の影響の計算を修正した弛緩法を顔の各候補領域に適用する.顔を検出した後, 顔の輪郭に対する両目の位置によりその顔の方向を推定する.
著者
矢野 雅之 勝間 大輔 清水 大輔 渡邊 睦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.105, no.674, pp.149-154, 2006-03-10

画像認識を行う際、まず領域分割を行って認識対象の侯補となる領域を設定することが行われる。しかし、領域数は一般に未知であり、又、明度/色相値の類似性のみで領域を生成した場合には影や模様の影響により適切に設定できないという問題がある。そこで本稿では、明度による自動領域分割に対してDFT処理した領域をクラスタリングした分割結果を統合することにより、領域分割結果の精度向上を行う方式について提案する。屋内シーン、屋外シーンにおいて本手法の有効性を確認した。
著者
勝間 大輔 清水 大輔 渡邊 睦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.230, pp.107-114, 2006-09-02

室内に存在する物体の種別・位置姿勢を2次元画像認識により求める際,複数物体の重なり・遮蔽や影などの影響によるコントラスト低下が生じた部分の特徴抽出が失敗し,正しく認識が行われないという問題がある.本論文では,認識対象個々の形状・属性情報を記述した物体モデルに加え,物体相互の位置関係,および人間動作との干渉関係を記述した『関係モデル』を適用することにより,上記の問題に対処する手法を提案する.撮影したシーンからまずエッジを抽出・ラスタベクトル変換・補完した後,連結性解析により閉面領域抽出を行う.次に物体モデルと照合することによりまず閉面単位のスコアを計算した後,隣接する閉面単位スコアを統合した統合スコアを求め,認識対象物体の候補を抽出する.ここで関係モデルを適用することにより,認識対象候補完の位置関係の整合性を検証し,矛盾の無い閉面領域の組み合わせを認識対象物体領域として得る.最後に物体同士の位置関係や人間動作との干渉関係を用いることにより,未認識領域に対する解釈当て嵌めを行う.現在実装しているのは認識対象物体の候補抽出部分までであり,室内環境シーンを対象とした実験結果について述べる.
著者
村田 彰 羽飼 直記 本郷 仁志 加藤 邦人 山本 和彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.97, no.387, pp.55-60, 1997-11-21
被引用文献数
8

顔の表情や視線方向などを認識し、コンピュータとのインタラクションに応用することを目的とし、顔の向きや傾き、瞬きによる形状の変化や環境変化に強い目、口領域の抽出方法を提案する。本手法では、まず環境に応じて基準肌色色相値を決定し、肌色領域の抽出を行う。抽出された領域内にて、4方向面特徴と色情報によるテンプレートマッチングを行うことにより目、口を抽出する。このとき、テンプレートを自動更新することで形状の変化に対応する。
著者
佐藤 亮 小野 晋太郎 永塚 遼 川崎 洋 池内 克史
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.88, pp.1-6, 2009-06-11
被引用文献数
1

実写画像ベースのImage-Based Rendering(IBR)を用いて,広域な都市空間を再現するシステムについて提案する.これを実現するために,入力として大量の全方位画像データを固有空間法を用いて効率よく圧縮する手法と,より良いレンダリング結果を得るための障害物除去手法を併せて提案する.障害物の除去は,圧縮の際に障害物のあった箇所をサンプリングに含めないことにより圧縮率の向上にも寄与する.また,GPUを用いた実時間での自由視点レンダリング手法を実装し,その効果を描画時間の評価により確認した.さらに,これらの手法をドライビングシミュレータシステム上に実装した.
著者
冨岡 亮太 鈴木 大慈 杉山 将
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.182, pp.43-48, 2009-08-24
被引用文献数
2

スパース正則化は凸最適化を通して変数選択や多様な情報源の統合を実現するための系統的な枠組みとして近年注目されている。多くのスパース正則化法は滑らかでない最適化問題として定式化されるため、このような問題を効率的に解く方法が求められている。本論文では、一般の凸な損失関数と広いクラスの正則化関数に対する最適化手法をproximal minimizationの枠組みから導出し、理論的な性質を議論し、既存の手法との関係を解説する。講演では実際のパターン認識やCVの問題を題材として、非常に多くの素性やカーネルが与えられたもとでいかに効率よくこれらを選択し学習することができるかデモンストレーションを行う。
著者
鈴木 浩二 松川 徹 栗田 多喜夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.484, pp.7-12, 2009-03-06
被引用文献数
5

局所特徴をSVMにより背景領域からの特徴と対象領域からの特徴に分類し利用する手法(初期特徴選択)を提案する.初期特徴選択の有効性を検証するために,UIUC Image Databaseを用いてSIFT特徴を車領域からのSIFT特徴と背景領域からのSIFT特徴に分類するSVMを作成し,SIFT特徴を用いたBag-of-Featuresの特徴選択に適用する実験を行った.この実験の結果,Bag-of-Featuresにおいて背景領域からのSIFT特徴をSVMで選択的に取り除くことにより,クラスタ数が少ない場合において従来手法よりも識別率を向上させることできた.
著者
内山 英昭 斎藤 英雄 セルヴィエル ミリアム モロ ギヨム
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.88, pp.113-118, 2009-06-11
被引用文献数
1

本稿では,交差点マーク付き地図と交差点データベースを用いた地理データマッチングに基づくGISデータのAR提示システムを提案する.本システムでは,交差点マーク付き地図を撮影すると,その地図に関連するGISデータをディスプレイを通してAR提示する.地理データとして交差点を使用し,点検索手法のLLAHによって画像中とデータベース中の交差点の対応付けを行うことで地図の識別を行う.また,任意の方向から撮影した画像に対して交差点の対応付けを可能にするため,LLAHにトラッキングを導入する.実験では,LLAHによる交差点の対応付けによって実時間地理データマッチングが可能であることを示す.また,LLAHにトラッキングを導入することで自由なカメラの動きに応じたAR提示が可能になることを示す.
著者
石田 亨
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.363, pp.231-233, 2008-12-11

本論文では,言語サービスのアクセシビリティとユーザビリティを向上させるために,サービス指向の集合知形成を目指した「言語グリッド」を紹介する.言語グリッドはエンドユーザが,自らの異文化コラボレーション活動のために,新しい言語サービスを生成するためのインターネット上の基盤である.
著者
関口 俊一 栄藤 稔 江村 恒一 藤川 渡 益満 健 越後 富夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.101, no.302, pp.51-58, 2001-09-06
被引用文献数
1

XML-Schemaに基づくマルチメディア構造表現として2001年10月に標準化が予定されているMPEG-7の運用ポイントをダイジェスト視聴の視点で紹介する.ここでは, 膨大なMPEG-7の記述セットの中から, セグメント構造記述, 属性キーワード記述を選択した.実際の応用として, 映像の自動シーンカットを行い, それに属性キーワードを付随させるオーサリングシステムと, その結果得られるMPEG-7データとユーザ嗜好とのマッチングを端末側で行うことにより要約視聴を可能とするパケットストリーミングシステムを構築した.これにより, 長時間の映像コンテンツをユーザの視聴環境や嗜好に合わせてモバイル網で要約配信することが可能となる.
著者
小沼 元輝 朱碧 蘭 山田 奨治 柴山 守 中川 正樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.606, pp.91-96, 2007-03-09
被引用文献数
2

本稿では,電子くずし字辞典に用いるロバストな文字認識の開発について述べる.古文書の翻刻作業を特定の専門家以外でも可能にし,その効率を高めるために,古文書で標準的に用いられるくずし字の辞典を電子化し,翻刻の利便性を向上させることが有効である.我々は,67,739種のくずし字に対する認識システムを開発した.くずし字までいかない通常の字体に対しても現有の認識システムを利用できるようにした.採用手法は,現在の文字パターンに対して一定の認識率を保証しているので,実用に耐えることを期待しているが,現実課題のサンプルパターンが少ないために,定量的な評価は今後の課題とする.
著者
安田 久美子 村松 大吾 松井 淳 松本 隆
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.107, no.384, pp.53-58, 2007-12-06
参考文献数
3
被引用文献数
1

ユーザが筆記する動作をウェブカメラで撮影し,その映像からオンライン署名の特徴を抽出し,認証に用いる手法を提案する.本システムの特長の一つは,汎用のウェブカメラを入力デバイスとして用いることにより,タブレットのような特殊な装置を必要としない点である.Sequential Monte Carloを用いて動画像データにおけるペン先位置を追跡することで,ペン先の軌跡情報(x,y座標データ)を取得する.取得した各データ間の距離を計算することで認証に用いる.本稿では,7名の被験者から収集した画像データによりオンライン署名認証初期実験を行い,認証に用いる真筆と偽筆の判別が可能であることを確認した.
著者
鈴木 賢一郎 坂野 鋭 大塚 作一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.104, no.742, pp.7-10, 2005-03-11
参考文献数
10

本報告において, 我々は日本語テロップの縁取りに着目した文字認識手法を提案する.日本語テロップには可読性の向上のために黒い縁取りがなされている.この縁取りと文字領域の輝度勾配は比較的安定していると考えられることから, このエッジをSobelフィルタで検出し, 加重方向ヒストグラム特徴と同様の方法でヒストグラム化する特徴抽出系を設計した.認識実験の結果, 位置, サイズが完全に正規化された人工データでは100%, また, 評価用映像データベースに現れるテロップでは約70%の認識率が得られ, 提案手法の有効性を確認した.
著者
出口 大輔 村瀬 洋 梅田 一彰 斎藤 正孝 藤 賢一朗 山下 真吾 末次 祐樹 高井 翔太 佐藤 竜太 丸山 拓馬
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.110, no.467, pp.347-358, 2011-03-03
参考文献数
4

電子情報通信学会情報・システムソサイエティパターン認識・メディア理解(PRMU)研究専門委員会が今年度実施したアルゴリズムコンテスト「ターゲットをロックオンせよ!〜移動物体の追跡〜」の実施内容について報告すると共に,受賞者によるアルゴリズム紹介を掲載する.今回の課題は「動画中の物体追跡」をテーマとし,高速かつ精度良い物体追跡の実現を課題とした.また,応募総数は歴代2位の73件であり,そのうち7件が入賞した. This paper reports a summary of the 14th algorithm contest entitled "Lock on targets! - object tracking -". This contest is supported by PRMU (Pattern Recognition and Media Understanding) technical group of IEICE-ISS. In this paper, brief overviews of prize-winning algorithms are presented by the winners. The contest in this year asks fast and accurate algorithms to track objects from videos. 73 algorithms were submitted to this contest (2nd largest submissions among the past contests), and 7 algorithms had won the prizes.
著者
薄井 宏航 フランク イアン
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.111, no.499, pp.71-76, 2012-03-22
参考文献数
9

人は直感や理性を用い意思決定を行うと古くから考えられてきたが,近年の研究により,意思決定における体性感覚の影響の大きさが示唆されている.本研究では,理性や感情,そして身体感覚が意思決定に及ぼす影響を調査する.我々は,Wilsonらの実験に倣い,理性的な考え方と,直感的な考え方を比較する実験を行った.さらに,体感覚(味覚)が意思決定に及ぼす影響についてを調査する実験を行った.結果として,顔の魅力を評価する際は,Wilsonらの実験で見られた考えることを強制するような質問とのプライミングの効果が見られなかった.さらに,味覚と意思決定間のつながりを示した.
著者
望月 貴裕 蓼沼 眞 八木 伸行
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.105, no.118, pp.37-42, 2005-06-09
被引用文献数
2

本稿では, シーンのパターン化とHidden Markov Model (HMM)を用いた, 野球の各シーンのイベントを自動的に識別する手法を提案する.本手法では, 学習処理としてまず, シーンを構成する各ショットをパターン化し, 学習用映像の各シーンをパターンデータの系列で表現する.パターン化データは, 位置情報, 画像特徴および動きベクトルを情報として持つ複数の矩形から構成される.このパターン化処理は, 映像上に配置した点群のブロックマッチングによる移動情報およびそれらの点の近傍領域の画像特徴に基づき行われる.次に, 学習用映像の各シーンを, 各ショットのパターン化データに基づき数値列で表現し, ホームラン, シングルヒット, フォアボールなどの「イベント種」で振り分ける.そして, 各イベント種について数値列の長さで区別して数値列を学習し, HMMのパラメータを設定する.それらの学習済みHMMを用いて未知イベントシーンの識別を行う.識別処理も, 学習処理と同様にショットのパターン化処理に基づき行われる.本手法については, 7試合分の大リーグ野球中継映像を用いた識別実験により評価を行った.