著者
松本 吉央 小笠原 司 Zelinsky Alexander
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.99, no.450, pp.9-14, 1999-11-20
参考文献数
11
被引用文献数
9

高度なヒューマンインターフェースを構築するには,システムが人間を観察し,その意図や注意を認識することが必要となる.人間の目や顔の動きは,意図や注意と関係が深いため,この動きを計測することができれば,高度なインターフェースの構築へつながる.本稿ではこのような目的で開発した,人間の顔と目の動きを検出するシステムについて述べる.本システムでは,通常のカメラ(2台)と画像処理ボードを利用しており,(1)完全に非装着型である,(2)完全に受動型である,(3)リアルタイムで計測が行える,(4)顔の位置・姿勢と視線の方向が同時に計測できる,という特徴がある.
著者
森 幹男 槇本 由希 荻原 慎洋 谷口 秀次 高橋 謙三
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.104, no.448, pp.71-75, 2004-11-12
参考文献数
11
被引用文献数
2

骨導音声を電気信号に変換する骨伝導マイクロホンはハンズフリーで,ヘッドセット型マイクロホンと比較して周囲騒音の影響も受けにくい.このため,ウェアラブルコンピュータの入力装置としての利用が期待できる.本研究では,日本語5母音発声時の気導音声と骨導音声の対数パワースペクトルの差を特徴量として用いて話者識別実験を行い,雑音耐性を含めた詳細な検討を行った.その結果,気導音声のみを用いた場合と比べ雑音耐性が高いことが明らかとなった.また,骨導音声の歪み率を特徴量として用い,歌声に対して裏声判別を行った結果,表声-裏声換声点の検出が可能であり,この歪み率を話者識別の特徴量として用いることによって話者識別率の向上が期待できることが明らかとなった.
著者
佐藤 隆夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.102, no.470, pp.13-18, 2002-11-14
参考文献数
5
被引用文献数
2

視線の知覚,とりわけ「目が合う」という感覚は,我々の社会生活にとって重要な役割を果たしている.ここでは,我々の一連の研究から,視線知覚の水平方向での精度,それに対する距離の効果.眼球運動の検出の精度,視線知覚の奥行き方向での精度,視線知覚における目の形の効果,頭部回転効果と呼ばれる現象に関する実験的な検討を報告する.そのうち,もっとも興味深いものは,視線知覚の精度が観察距離に依存せず,視線供給者側の視線変移角としてほぼ一定になると言うことである.この結果は,視線知覚が,黒目のエッジなどの詳細な情報に依存せず,顔や目の幅などによって正規化された相対的な低解像度の要因に依存することを示している.
著者
石谷 康人 鈴木 優 布目 光生
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.605, pp.7-12, 2007-03-08
参考文献数
10
被引用文献数
2

本論文では、Webブラウザ上で閲覧している文書を起点として関連文書を次々とたどる連鎖検索(Chaining search)のための新しいインターフェース技術を提案する。本インターフェース技術では、ユーザがペンやマウスなどのポインティングデバイスにより閲覧文書中の語句を選択すると、意味クラス解析技術により語句の意味を決定し、意図推定技術により語句の意味から検索方法を列挙およびメニュー化してユーザに提示するようになっている。ユーザは提示された検索方法のメニューにおいて適切なものを選択するだけで、選択した語句に関連する情報を的確に検索できるようになっている。このとき本インターフェースでは、検索方法に応じて、ユーザが選択した語句に補助キーワードを追加して絞り込み検索を実施する。15人の被験者を対象とした実験で本インターフェースの検索性能とユーザ満足度を評価したところ、ユーザビリティの高さと絞り込み検索の有効性を確認することができた。
著者
小澤 孝夫 吉川 昌孝 田辺 浩行 水谷 誠彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.99, no.709, pp.63-68, 2000-03-16
参考文献数
12

手話辞典には, 日本語の単語ごとに対応する手話動作(手の動き、指の形等)を説明する文章およびイラスト図(人物線画像)が掲載されている.この研究では、このイラスト付き説明文から, 仮想3次元空間においてバァーチュアル・パペットが行う手話アニメーションを自動的に作成するシステムを試作している.説明文に対しては手の動作と指の形等を求める言語解析, イラスト図に対しては手の領域と指の形等を求める画像解析を行い, これら2つの解析結果を総合して手話動作を構成するというマルチモーダル情報処理により手話アニメーションを構成する.説明文の言語解析あるいはイラスト図の画像解析には、手話動作の説明あるいはイラストであるという特殊性を考慮し、能率よい手法を用いている。
著者
西 奈津子 渡邊 睦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.104, no.447, pp.43-48, 2004-11-11
参考文献数
13

会話や細かい文字の判別が困難,また,手指によるキー操作が困難な障害者・高齢者との自由自在なコミュニケーションを支援するために,利用者の顔表情や動作を認識することによる意思伝達システムの研究開発を行っている.本報告では,利用者の前に設置したカメラ画像から4種類の口部形状を認識することにより,階層化された日常会話を順次選択し,相当する会話文を合成音声により出力するシステムのプロトタイプ開発の結果について報告する.利用者による口部パターンの認識は画像の明度分布を相互部分空間法を用いて解析することにより行い,選択結果の確認は口部の開閉動作を明度分布の時間変化として検出することにより行う.20人による口部パターンの認識実験により,この方式の有効性を確認した.
著者
多田 昌裕 瀬川 誠 岡田 昌也 蓮花 一己 小暮 潔
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.263, pp.1-6, 2008-10-16
被引用文献数
4

本稿では事故多発地点など,通行の際に十分な注意を要する場所(要注意地点)における運転者の行動を自動評価するシステムを提案する.提案システムは,無線ジャイロセンサ情報とGPS情報とを併用することで,運転者が要注意地点において十分な事故予防動作をしているかを自動的に判定する.もし運転者の行動に予防安全の観点からみて改善すべき点がある場合には,その旨を走行後に提示し,運転の改善を促す.筆者らは,タクシー運転手を対象とした公道上での実車実験を実施し,提案システムによる運転技能の自動評価結果が,指導員による評価結果と80%以上の精度で一致することを確認した.筆者らは,さらに次のステップとして,提案システムをタクシー運転手再教育講習の現場に導入する実証実験を,2008年4月から実施している.この実証実験からは,受講者が自らの運転を客観的に把握するためのツールとしても,提案システムが有効であることを示唆する結果が得られている.
著者
金子 昂夢 柳井 啓司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.113, no.230, pp.53-58, 2013-09-26

近年,スマートフォンのような位置情報を扱えるデバイスの普及に伴い,撮影した画像に位置情報を付加することが容易となった.また,ツイートと呼ばれる短文を投稿できるサービス,Twitterの普及により,自分が今何をしているのか,どこにいるのかといったことを投稿する人が増加してきた.ツイートには本文の他に画像や位置情報を添付でき,外出先で撮影した位置情報付き画像を即座に投稿することができる.本研究では,これらのTwitterに投稿された位置情報付き画像ツイートから視覚的なイベントの検出を試みる.まず,対象をより小さな地域に分割し,各地域において前日の状態と比較して得られるスコアが一定以上となるキーワードを検出した.そして,検出されたキーワードを含むツイートの各画像から画像特徴量を抽出し,クラスタリングを行った.クラスタリング結果からイベントの代表的な画像を選出し,中心座標を計算して地図上に表示させた.実験では,日本とアメリカで投稿されたツイートを用いて,それぞれのデータセットを作成した.検出の結果,台風や虹,花火大会,スポーツの試合といったイベントが検出され,画像からその様子を視覚的に捉えることができた.
著者
熊野 雅仁 天野 美紀 有木 康雄 上原 邦昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.104, no.369, pp.1-6, 2004-10-14
被引用文献数
5

本論文では,編集を意識した映像撮影を支援,教示することを目的として,映像文法を背景とするリアルタイムカメラワーク判定に基づいた撮影ナビゲーションシステムを提案する.カメラワークの解析法についてはいくつかの研究が行われているが,本システムでは,カメラワーク解析のリアルタイム性が要求されるため,処理速度が速く,また,手ぶれやカメラワークの安定性を十分に検証できる方法として投影法を用いた手法を採用した.カメラワーク解析により出力された結果からショット検出を行い,ショットを14通りの状態に分類し,編集には使用できない使用不能区間の表示,また,映像文法に従って編集に最も適した映像区間の表示を行う.これにより,撮影者は効率的に取り直しの作業を行うことができ,また,撮影した映像で編集に適した部分を瞬時に把握することが可能となる.
著者
王 彩華 棚橋 英樹 佐藤 雄隆 平湯 秀和 丹羽 義典 山本 和彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.101, no.421, pp.155-160, 2001-11-08
参考文献数
13

本研究では, K2Tで得られた高解像度パノラマレンジデータと全方向ステレオシステム(SOS)で得られた高解像度全方向画像の位置合わせとセンサの相対的な姿勢の推定について考える.本手法はまずそれぞれのパノラマ画像の縦方向のエッジヒストグラムをマッチングし, 2つのセンサーの方位角を合わせる.次に, 各方位角において, それを中心とした90°の視野角を用いて透視射影のエッジ画像を生成し, 横方向のエッジヒストグラムを生成する.これらの横方向のエッジヒストグラムをマッチングすることによってセンサの縦方向の位置と軸の傾きを推定する.実験では, シーンの状況が多少違う画像を用いて, 提案手法の有効性とロバスト性について検証した.
著者
丸尾 広行 東 友紀 渡邊 睦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.101, no.524, pp.131-138, 2001-12-13
被引用文献数
2

明度ヒストグラムを基に求めたカメラ視野内関心領域の明度確率分布を, シーン中に存在する各物体の挙動に起因する確率分布の重ね合わせと捉え, 混合分布モデルにより定式化することにより, 画像の初期領域分割を行う手法を開発した.本手法では, 最尤推定手法であるEM(Expectation-Maximization)アルゴリズムを用いて, シーンに存在する背景や移動物体に対応した各分布のパラメータを逐次的に推定する.次に, この推定した各分布パラメータを用いて, 対応する領域の明度範囲を決定し, この範囲に対応した領域分割を実施する.本手法をPC上のソフトウェアとして実装し, 実画像を用いた実験により妥当性を確認した.
著者
河合 吉彦 馬場口 登 北橋 忠宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.100, no.566, pp.83-90, 2001-01-12
被引用文献数
8

要約映像とは, 元の映像における重要な部分を短く編集した映像と定義される.本稿では, スポーツTV映像を対象とし, 個人適応を指向した要約映像の生成法を提案する.提案手法ではまず, スポーツのハイライト部が記述されたゲームスタッツと映像ストリームとの対応付けによって重要イベントを抽出する.この対応付けは, 映像中に出現するオーバーレイに含まれるテキスト情報を認識することにより実現する.続いて, 抽出されたイベントの中から個人の嗜好や興味を考慮して要約映像に含めるべきショットを選択, 連結し要約映像を生成する.実際の包装映像に対する実験では, 約2.5時間の映像が個人適応されつつ数分に要約された.
著者
森 靖英 高橋 裕信 新田 義貴 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.98, no.274, pp.9-15, 1998-09-17
被引用文献数
1

互いにリンク付けられた画像・文章データベースをコアデータとして用いた画像理解方式を提案する.本方式では, 文書データは, 単語の共起関係に基づく非線形クラスタリングによって空間配置される.画像データも, その特徴量ベクトル抽出後, 同じく非線形クラスタリングによって, より低次元の特徴量空間に写像される.この際, 対応する文章の距離関係が埋め込まれる.両クラスタリングデータを用いて, 入力された未知画像は, クラスタリング空間において類似画像検索され, 検索された既知画像とリンクを持つ文章を用いて, その関連文が出力される.本報告では, 約8, 000対の画像・文書データを用いて, 未知画像からどの程度関連した文が出力されるか調べた.
著者
鍋藤 悠 鹿嶋 雅之 佐藤 公則 渡邊 睦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.374, pp.43-48, 2009-01-05

動画共有サイトが活発化しており,大量の動画をクラスタリングする技術が求められている.我々は複数の画像特徴を統合的に解析することによりカット点検出を行い,その後の時区間の画像を対応付け、比較することにより動画の一致性判定を行う手法に関する研究を行っている.本稿では,複数の特徴を用いたカット点検出とカット点の対応付けについて述べる.SIFT特徴,明度ヒストグラム,エッジ量を用いてカット点検出を行い,DPマッチングを用いてカット点の対応付けを行う.スポーツ,アニメ,音楽のライブ映像を用いた評価により,手法の有効性が示された.
著者
大槻 麻衣 大下 勉 木村 朝子 柴田 史久 田村 秀行
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.110, no.381, pp.75-80, 2011-01-13
参考文献数
9

本研究では,立体視可能な複合現実空間において,多数のパーツから構成される仮想の3Dオブジェクトを分解し,その内部や個々のパーツ同士の接続関係,位置関係を至近距離で観察できるシステムを構築する.こうした分解・観察というタスクにおいて誤操作を回避し,操作の快適性,応答の心地よさを向上させるために,実世界で互いに接合・接着された物体の挙動や応答を模倣する3種類のメタファを導入する.本論文では,提案手法の基本概念,それを具現化するメタファとその物理計算モデル,ユーザ・インタフェースとしての実現に関して述ペ,実運用から得た知見や今後の発展させるペき方向性に関して論じる.
著者
草地 良規 伊藤 直己 鈴木 章 荒川 賢一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.104, no.369, pp.37-42, 2004-10-14
被引用文献数
7

我々は,画像検索のための景観画像へのインデクス付与を目的として,視点/背景テクスチャ/コントラストの制約を設けずに撮影された景観画像中の文字認識法を提案している.提案法では,文字領域を切り出す必要がなく,シェーディングを伴う文字,立体文字,複雑背景上の文字,切り出しに失敗した傾斜文字,を識別する能力があるが,識別に多大な時間がかかるという課題があった.本稿では,カテゴリを特徴の類似性に基づいて階層的に分類し,各分類パターン(クラス)に対して階層的な辞書を構成することで,提案法の処理量削減を実現する.識別率の測定実験を行い,84%の識別率で処理量を1/20程度に削減できることを確認した.また,日本語キーワード(ひらがな,カタカナを含む)による画像検索精度の測定実験を行い,平均適合率76.8‰平均再現率70.4%を確認した.
著者
東浦 圭佑 Prasad Mukherjee Dipti 岡田 俊之 横田 太 堀 雅敏 高尾 正樹 菅野 伸彦 陳 延偉 富山 憲幸 佐藤 嘉伸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.112, no.37, pp.51-56, 2012-05-10

本研究は,臓器形状の正常と疾患を統計形状解析による自動識別を目的としている.疾患になると形状が変形しやすい肝臓,大腿骨の学習データをを用いる.従来,正常と疾患を組み合わせた統計形状モデルによるSVM識別が行われている.本実験では,正常症例群から構築される正常統計形状モデルと疾患症例群から構築される疾患統計形状モデルを求め,正常統計形状モデルに直交する疾患統計形状の疾患部分空間を導き,未知データの変形成分を疾患部分空間に射影することにより,疾患に起因する変形成分を求める.疾患部分空間における変形成分のSVM識別により,識別精度の向上が確認できた.
著者
永田 亮一 川口 剛
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.99, no.448, pp.77-82, 1999-11-18
被引用文献数
11

画像中の位置や大きさが未知の顔を、計算機によって自動的に認識するためには、顔認識処理の前に、顔領域を切り出す処理が必要である。この処理は、顔検出と呼ばれる。本論文では、複雑な背景をもつカラー画像から人物顔を検出するための新たな手法を提案する。提案手法は、人物の頭を直立しただ円で近似し、だ円内部に膚領域と頭髪領域を定義する。そして、画像中でだ円を生成しながら、だ円の適合度を計算する。だ円の適合度は、頭髪領域の境界線のエッジ画像とのマッチ度、膚領域内の膚色ピクセルの密度、および、頭髪領域内の輝度値がしきい値以下のピクセルの密度の和によって与えられる。そして、提案手法は、適合度の大きい順に、画像中の顔の数だけだ円を出力し、これらを顔と判定する。
著者
吉田 龍生 フォン ヤオカイ 内田 誠一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.112, no.357, pp.55-60, 2012-12-06

本研究の目的は,プロジェクタから投影されたスクリーン上でタッチスクリーン操作を実現することである.その一つの手段として,スクリーンのタッチパネル化が考えられる.しかし,タッチパネルの大型化にはコスト面での課題が残る.そこで,カメラ・プロジェクタシステムを用いることを考える.カメラ・プロジェクタシステムとは,既存のプロジェクタシステムにカメラを備えつけ,そのカメラから得られる情報とプロジェクタの特性を活かし,構築するシステムである.本研究において,構築するシステムに用いるカメラは,web カメラ1 台と限定する.そうすることで,タッチパネルの大型化に残るコスト面での課題を克服することが可能である.カメラ・プロジェクタシステムによるタッチスクリーン操作の実現には,指領域の検出,スクリーンへの接触検知,トラッキングが必要となる.本稿では,まず指領域の検出及びスクリーンへの接触検知の方法について述べる.そして,トラッキングの手法を提示し,その手法による実験を行ない,タッチスクリーン実現への検証を行なう.