著者
秋月 達人 新田 直子 馬場口 登
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.100, pp.31-36, 2006-06-09

近年,インターネット,テレビといった通信媒体の性能向上に伴い,大量の映像コンテンツの入手が可能となった.また,計算機上での映像編集ツールも多々開発されており,素材映像の編集による映像制作は身近なものとなりつつある.しかし実際に魅力的な編集映像を制作するには,いまだ高度な編集技術や知識,時間,費用を要する.そこで我々は,専門家により編集された事例映像から編集技術を学習することにより,一般ユーザの映像編集を支援するシステムを提案している.ここで編集技術の一つとして,映像全体に調和感を持たせるために,映像を構成する動画と音を同期させることが知られている,そこで本稿では,映像をショットの並びとみなした際の,ショットの切り替え時における音の低レベル特徴に基づいた変化を,動画と音の時系列変化の同期パターンとして学習する.
著者
山口 晃典 内田 誠一 植竹 朋文 松下 知紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.432, pp.1-6, 2009-02-12

中世代に作成された初期活字印刷本について,文字の形状解析および文字認識手法について検討する.初期活字印刷本中の文字形状には,様々な要因による字形変動が存在し,認識の妨げとなっている.また,既に2値化された画像しか存在しない,対象とする資料以外からは文字情報を得ることができない,などという状況も考えられる.そこで本研究では,2値化された文字画像の最外郭輪郭線の形状に着目し,形状解析および文字認識を行う.具体的には,資料の冒頭数ページから切り出してラベル付けした文字画像を辞書サンプルとして,同カテゴリ内文字の位相変化別変位の抽出,そしてそれらの情報を用いて資料の残りのページから切り出した文字画像に対して認識を行う.この方法により,掠れや途切れを起こしているパターンの情報も利用して文字形状解析・認識を行うことができる.本報告では,実際に実験を行った結果についても述べる.
著者
前 孝宏 宮本 敦 金子 俊一 五十嵐 悟
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.101, no.524, pp.139-146, 2001-12-13
被引用文献数
2

登録画像内の相関構造を予め解析し, 未知の対象画像の検索を厳密にしかも高速に行う検索法を提案する.任意に選択した解候補となるべきピボット画像と対象画像との相関係数値と, 予め算出されているピボット画像と登録画像との相関係数値とを用いることによって, 対象画像と任意の登録画像との未知の相関係数値を拘束する不等式条件を導出した.これにより導かれる2種類の判定条件を利用する高速内容検索アルゴリズムを提案する.特許庁の商標画像データベースから引用した1, 200枚の実画像を用いて, 検索実験を行い, 提案手法の有効性を確認した.
著者
田中 宏 中島 健次 石垣 一司 秋山 勝彦 中川 正樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.98, no.489, pp.31-38, 1998-12-17
被引用文献数
11

PDA、ペンPC等でキーボードに代わる文字入力手段として、高精度な手書き文字認識が求められている。今回、文字パターンを2次元イメージとして扱うオフライン認識と、座標点の時系列情報として扱うオンライン認識とを融合することにより、それぞれの欠点が補完された高精度な認識エンジンを実現した。オフライン認識はストロークの重ね書きや塗り潰しなどの影響を受けにくく、認識速度が速いという利点があるが、字形の大幅な変形にはあまり強くない。一方オンライン認識は続け字・崩し字には強いがちょっとしたノイズにも敏感である。これらの相補的な認識傾向を利用して性能を向上させた実用的な認識エンジンを実現した。本発表では、まずオンライン・オフライン認識の相補的な認識傾向について触れた後、タブレット等で入力された文字パターンについてオフライン認識を行う方法について述べる。次にオンライン認識とオフライン認識の認識結果を統合する方法をいくつか提案し、実験結果を含めて考察を行う。
著者
橋口 博樹 西村 拓一 赤坂 貴志 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.100, no.443, pp.79-86, 2000-11-10
被引用文献数
3

近年, 多量の音楽ディジタルデータを個人が所有するようになり, 楽曲の検索ニーズが高まっている.これに伴い, 著者らは鼻歌をクエリーとして, 主旋律に基づいて楽曲信号から直接検索するシステムを開発した.この検索は, mp-CDPと呼ばれるマッチング手法により実現されている.本稿では, 歌詞のある鼻歌を想定し, 音素認識に基づく歌詞検索機能も導入する.このとき, 通常行なわれている音声認識の技術では, 楽曲のように激しく音程が変化するという状況を想定していないため, 歌詞の検索は困難であると考えられる.そこで, mp-CDPがたどった主旋律情報を利用して, 歌詞検索に向いた音素認識法を考え, 両者の統合システムを提案する.
著者
小野 康弘 川嶋 稔夫 ピトヨ ハルトノ
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.198, pp.241-246, 2008-08-29
被引用文献数
2

摂食パターンはある程度個人の健康状態を反映すると考えられるため、摂食パターンを解析することで健康状態をある程度把握することができ,病気の早期発見につながる。本研究で我々は過去に開発したセンシングトレイとIDウェアを用いて個人の摂食パターンを自動的に記録できる手法とその記録パターンの視覚的及び定量的な提示方法の提案を行った。これらの提示方法では、食事に出る品を状態として扱い、摂食の様子を時系列的な状態遷移と見なすことにより,マルコフモデルを構築することができる。複数人の数回にわたる摂食実験から,健康に異常のない特定の個人は特有の摂食パターンを持ち、個人差も明確であることが分かった。この結果を用いて、今後摂食パターンを基に健康管理システムの提案を行う。
著者
ウ 小軍 圓藤 康平 和田 俊和 松山 隆司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.100, no.633, pp.9-16, 2001-02-15
被引用文献数
4

3次元ビデオとは、実世界のダイナミックな視覚的イベントをすべて撮影、記録する究極の映像メディアのことである。すなわち、視覚情報として、時系列に変化する対象の立体的な形と表面属性(色とテクスチャ)を獲得し、記録するメディアである。本論文では、まず実時間3次元形状復元手法として、視体積交差法に基づいた新しい並列アルゴリズムを提案する。この手法では、平面間透視投影を用いて、多視点同時撮影された映像から対象の立体的な形を復元する。われわれはこの手法を超高速ネットワーク(1.28Gbps)に接続された10台のPCからなるPCクラスタシステム上に実装した。このシステムは2cm×2cm×2cmの空間解像度において、約秒10フレームのスピードで身体動作の3次元形状復元に成功している。次に、パン・チルト・ズームカメラを制御し、対象を追跡しながら3次元形状復元を行う機能をシステムに追加した。カメラ制御の遅延によってシステムのスループットは秒1フレームに落ちたが、対象を追跡することで、空間解像度を落とすことなく、広い範囲を動く対象の3次元形状を復元できるようになった。最後に、われわれが開発した対話的編集・表示プログラムのデモを通して、3次元ビデオの魅力を示す。
著者
上野 智史 橋本 真幸 米山 暁夫 川田 亮一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.306, pp.127-132, 2009-11-19
被引用文献数
1

本論文では,ユーザの現在位置・方向情報の精度の改善を目的とした,ユーザ撮影画像と街並画像データベースの画像マッチング手法を提案する.GPSによる位置データを利用してユーザを道案内するナビゲーションサービスが普及しているが,高層ビル街などGPSによる位置精度が悪い場所においても精度の高い位置情報の提供が求められていた.これに対して,対象エリアの街並画像を事前に撮影しておき,ユーザの撮影画像とマッチングすることでユーザ位置・方向を推定する手法が考えられる.しかし,街並画像データベースの撮影間隔が離散的であることと高圧縮の画像であることにより画像マッチングの精度が低い場合があった.そこで本研究では,これらの街並画像データベースでも特徴点の対応関係を精度よく抽出する方式を提案する.本手法は,局所特徴量の対応点の検出時に複数の対応点候補を選択し,その後建物の幾何拘束を考慮して対応点を選択することで,従来の最近傍探索手法より精度よく正解対応領域を検出する.本手法により,従来のSIFTによる最近傍探索に比較して位置精度誤差が7%縮小し,方向推定精度が10%改善する.
著者
吉野 峰生
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.99, no.118, pp.67-74, 1999-06-17
被引用文献数
3

顔画像の個人識別の現状と将来の展望について法科学的観点から述べた。顔画像の識別は,一般に,顔の構成要素の形態学的分類基準に基づく比較,顔の人類学的計測並びに顔画像相互のスーパーインポーズ法の3手法によって行われている。顔画像相互のスーパーインポーズ法を実施するためには,犯行現場の犯人の顔画像と被疑者の顔画像を同じ撮影角度にする必要があり,被疑者の顔貌の3次元形状データを用いたビデオスーパーインポーズ法が開発されている。将来的には,顔画像上の解剖学的標記点間の距離や角度に基づいたマッチングにより,犯人の2次元顔画像から被疑者の3次元顔画像データベースに対して検索,照合が行えるようになるであろう。
著者
佐藤 真一 中村 裕一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.103, no.207, pp.77-80, 2003-07-10
被引用文献数
2

映像処理は,近年特にその発展や応用が期待されている情報処理分野であり,パターン認識・メディア理解にたずさわる多くの研究者が挑戦してきている研究テーマである.その10年あまりの歴史を振り返ってみると,多くの成果が得られたものの,社会的に求められている要請に対しこたえられるのか,映像処理の提示する将来展望は何なのか,などに対する回答を明確にしなければならない時期に来ていると考えられる.本パネルでは,映像処理に関係する気鋭のパネリストを迎え,映像処理の意義を明確にするべく討論を行う.
著者
伏尾 光平 守田 了
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.104, no.524, pp.107-112, 2004-12-10

スケート中継映像から競技者の動きを推定することを目的とする.一般に競技者は4.5分程度め規程演技とフリー演技を行い,選手の競技を評価する,その際テレビのスケート中継映像は人の動きをとらえ続ける.カメラは複数存在し,カメラを切替えながらテレビ映像を作成する.一般に1つのカメラはパンチルトズームを自由に可動することにより映像を作成する.このようにして作成された中継映像のみから競技者の動きを復元する.特に本研究ではカメラに複数の位置を与え,そのカメラ位置を切り替えた上で競技者の動きを復元し,復元された動きがなめらかになるカメラの位置とカメラの切替えを競合学習を用いて推定する.近年スボーツの分野で科学的分析に基づく競技のサポートが注目されている.本研究により競技者および監督者が復元された動きから.修正点を探るために使用したり,競技運営者が競技結果を保存するために使用できる.実際にシミュレーション用の中継画像から競技者の動きを推定し,提案手法の有効性を示す.
著者
有木 康雄 杉山 善明 石川 則之 寺西 俊裕 櫻井 光康
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.96, no.385, pp.31-38, 1996-11-22
被引用文献数
16

ニュース映像を対象とし, 記事単位に分割した後, 文字・音声・画像情報を基に索引付けして記事を分類する研究を行っている. 1つの記事は, スタジオシーンで始まり, スタジオシーンに終ることを利用し, カット検出されたフレーム集合において, ループを検出して記事を切り出している. 5分間のNHKニュース30日分をデータベースとし, 99.2%の記事切り出し率を得た. また, ニュース映像中のテロップを認識し, 索引付けして記事を政治・経済など10の分野に大分類した. 同じデータベースに対して, 78.1%の索引付与率と62.5%の記事分類率を得た. ニュース音声に対しても, キーワードスポッティングにより, キーワードを抽出して索引付けし, 記事を10の分野に大分類した. キーワード抽出率53.5%に対して, 50.7%の記事分類率を得た. 最後に, 画像中から顔領域を部分空間法により抽出し, 認識・追跡する実験を行い, 高い認識率を得た.
著者
篠崎 亮人 中島 真人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.96, no.598, pp.31-36, 1997-03-18
被引用文献数
1

情報社会の進展に伴い,セキュリティ向上の観点から個人の自動照合技術の重要性が高まっている.これまでに行われている個人照合の研究としては,顔や声など様々な特徴を用いた研究があるが,筆跡により個人の同定を行う筆者照合もその一つである.本論文では,枠内に一文字ずつ日本語で書かれた氏名を用いて,その筆者をオフライン照合する新たな手法について述べる.本手法では,個人性を表わす特徴量として,文字の概形を反映するPeripheral Histogramと文字の線成分の傾き及び長さを反映するSinogramを定義し,これを用いて筆者の照合を行う.本手法の有効性を検証するために被験者50人に対して照合実験を行ったところ,平均誤り率約4%という結果が得られた.
著者
磯野 勝宣 赤松 茂
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.98, no.528, pp.53-60, 1999-01-22
被引用文献数
1

任意方向・任意表情の顔画像を生成する技術は, テレビ会議システムなど, 様々なアプリケーションに応用できる.本論文では, 2枚の画像とサンプル画像から得られる表情変化に関する一般的な知識を用いて, 任意表情の3次元構造の復元を行う.入力として, 表情Aの2枚の画像が与えられ, それらより表情Aの3次元構造が復元され、その3次元構造を2枚の入力画像に投影する2つのカメラ射影行列が得られる.一方, 表情Aから表情Bへの表情変化は, 表情Aと表情Bの対応する特徴点の座標の差分として捉えることができる.差分を表情サンプルデータベースを用いて, 抽出する.表情差分ベクトルと顔の類似性, 顔の対称性, 画像間の幾何学的拘束条件を用いて, 2枚の入力画像に対応する, 表情B画像を生成する.2つのカメラ射影行列と2枚の表情B画像が得られれば, 表情B3次元構造を復元することができる.復元実験の結果, 自然な表情B3次元構造を得ることができた.
著者
釜口 久史 梶川 嘉延
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.484, pp.263-266, 2009-03-06

本稿では,フォトアルバムのための人物仕分けシステムを提案する.従来の画像管理ソフトでは,サムネイルを閲覧しながらユーザが仕分けを行う,時系列やファイル名順に並び替えるのみであったため,ユーザの負担が大きい,画像の内容が反映されないなどの問題があった.そこで,本システムでは画像の内容に基づき自動的に画像を仕分けするシステムの構築を行う.また,入力した画像に近いものは抽出を行うことができたが,データベース中に抽出できなかったものが残るという問題点に対して,フィードバックシステムによって,抽出困難であった画像と入力画像を強制的に関連付け抽出を行う.そしてシステムの有効性を検証するため主観評価実験を行った.
著者
岡田 昌也 鳥山 朋二 角 康之 間瀬 健二 小暮 潔 萩田 紀博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.105, no.534, pp.77-82, 2006-01-13

目に見えない発見にあふれる現実世界での体験学習は, 人々を社会的な不思議に気付かせるための重要な教育領域である.人間の注意は限られているが, 学習者が体験時に重要性を認識できずに見落とした体験の中にも, 気付きのきっかけになるものは潜在的に多くある.現実世界における知的活動を通した気付き, 特に, 無意識的な気付きは抽象度が高く計算機では扱いにくかった.本研究は, 実世界学習における無意識的な気付きの顕在化を目的として, 発見の土台となり得る体験をウェアラブル体験記録装置によって網羅的に記録し, その中から気付きの可能性のある体験を時空間的に可視化する手法を提案する.
著者
矢口 勇一 大島 万里恵 河合 天士 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.64, pp.59-64, 2009-05-21
被引用文献数
1

本論文では,Web中にあるからの感性情報の検索を行うために,Web動画中の音声検索システムを用いての類似性を基に感性検索をする方法を提案し,その予備実験を報告する.Web上のビデオデータは極めて多種多様であり,これらの感性的意味を単一の記号によって表現することか不可能に近いといえる.このような時系列データを対象にして,感性語に対応するビデオデータの区間を検索することは,かなり一般化された手法を用いる必要がある.本論文では,フレームワイズな音素識別に基づく音声検索手法をWeb上で実装したAiZoomというシステムを用い,検索したクエリと類似する音声区間を含むビデオデータの部分を抽出し,その類似区間の感性を分類した感性ヒストグラムを用いて,その動画の感性特徴を得る.また,この感性特徴を得た区間のオプティカルフローを調べて,個々の感性特徴に対応する画像特徴が得られるかを検証する.
著者
武藤 義彦 長瀬 裕和 浜本 義彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.98, no.528, pp.173-179, 1999-01-22
被引用文献数
1

Parzen識別器の設計において, 従来の研究では事前確率が等しい仮定がなされているが, 現実のパターン認識問題ではこの仮定が満たされない場合もある.この問題に対処するため, テプリッツ近似, ブートストラップサンプルを用いることを提案し, 訓練サンプル数が少ない状況下で計算機シミュレーションを通してその有効性を検討する.
著者
栗畑 博幸 高橋 友和 目加田 慶人 井手 一郎 村瀬 洋 玉津 幸政 宮原 孝行
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.105, no.674, pp.55-60, 2006-03-10

本報告では車載カメラ映像から雨天時に現れる画像特徴を抽出し,それを用いた状況別降雨認識手法を提案する.車載カメラを用いた運転支援技術の一環として,撮影時刻や降雨量の異なる様々な状況において天候,特に降雨の認識を試みる.具体的にはフロントガラスに付着した雨滴により変化する画像特徴を,昼夜の状況に適した方法を用いて検出することによって降雨の認識を行う.昼間の映像の場合には,様々な形状の雨滴画像から主成分分析を用いてテンプレートを作成し,テンプレートマッチングにより雨滴を検出する.我々はこれまで画像中の空領域からの雨滴検出手法を提案してきたが,本報告では入力画像を複数フレームにわたって平均化することで,画像全体からの安定した雨滴検出を行う手法を提案する.また雨滴検出結果をフレーム間で照合することで,より精度の高い雨滴検出が期待される.夜間の映像の場合には,雨滴による散乱光を定量化する.撮影時刻や降雨量の異なる実映像を用いて実験を行った結果,昼間の場合,画像全体から適合率0.97,再現率0.51と,従来と同程度の検出精度が得られた.また夜間の場合,83%の降雨判定成功率が得られた.これらのことから提案手法の有効性を確認した.
著者
井関 健太 矢口 勇一 大田 和寛 千葉 将人 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.363, pp.105-110, 2008-12-11

2次元連続DPアルゴリズムと因子分解法に基づく画像からの3次元形状を効率的に復元するシステムを実現した.2次元連続DPでは画像間の全ピクセルに対する非線形対応のマッチングが可能である.そのため,因子分解法において使用される計測行列を,画像集合の1枚と任意の他の画像とのすべてのピクセル対応から生成する事で,特別な計測機器やカメラパラメータを必要とせず,少数枚数の画像のみから3次元モデルを生成する事が可能である.一方,2DCDPによる計算コストがO(N^4)となり,計算速度とメモリサイズに関する問題がある.本報告ではこれらの問題に対処するために,2DCDP計算の並列化に基づく計算機環境を構築した.また,野外の大きな建築物である城郭を対象にし,効率的に形状復元を行うシステム実装した.大規模画像への3次元形状復元には,部分3次元形状のモザイキングにより実現する.今回構築したシステムが良好に動作する事を実験により示した.