著者
尾崎 真 降旗 建治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EA, 応用音響 (ISSN:09135685)
巻号頁・発行日
vol.106, no.313, pp.49-54, 2006-10-20

前報では,音圧マイクロホン対による音源方向分離に関する検討[1]を行い,音源探査のための3次元音響インテンシティマイクロホンプローブに適用し[2],音響インテンシティ計測に有用であることを明らかにした.本報告では,このマイクロホンシステムを音声と騒音の音源方向分離に適用できるかどうかを検討している.ここでは,指向性が双指向性あるいはカージオイド特性のマイクロホンシステムを採用し,その指向性のデップ特性を利用して,その出力のFFT結果と全指向性マイクロホン出力のFFT結果のレベル差に着目して,両者振幅スペクトルの差成分に関する逆フーリエ変換を行って音声信号だけを抽出することが可能かどうかを検討している.実験結果から,本システムの有効性が検証できたので報告する.
著者
高橋 勝彦 関 進 小島 浩 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1552-1561, 1994-08-25
被引用文献数
110

CCDカメラ等によって得られる動画像から人間の身振り手振りを認識する手法を提案する.入力画像系列から,垂直・水平・時間方向のエッジ特徴を抽出し,これらを時空間的にリダクションすることによって得られる時空間ベクトル場を用いて各ジェスチャーの標準パターンを表現する.認識対象画像系列と標準パターンとのマッチングにはスポッティング認識手法を用いる.スポッティング認識は,(1)ジェスチャーの時間区間のセグメンテーションが不要,(2)フレームワイズ,すなわち入力画像フレームに同期して認識結果を生成する,といった特長をもつ.7種類のジェスチャーを認識対象として実験を行った結果,本手法によってほぼ正しくジェスチャーを認識できることがわかった.特に時間方向のエッジ特徴を用いた場合は,標準パターン作成時の認識時での被験者の衣服・背景の変化に対し,ロバストであることが確認された.また,本手法を画像処理ボードとワークステーションを組み合わせたシステムにインプリメントし,4種類のジェスチャーをリアルタイムに認識するシステムを構築した.
著者
嶋 陽一 大本 英徹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学
巻号頁・発行日
vol.96, no.176, pp.165-170, 1996-07-25

インターネットやイントラネットの普及により,WWWを用いて大量の文書データベースをハイバーメディア構造によって提供する事例が増えてきている.しかし,大規模になると一貫性を保ちつつこれを人手によって管理することは非常に困維となる.本論文では,オブジェクト指向データベースにおける経路存在従属性(PED: Path Existence Dependency)をリンクの一貫性に応用して,ある制約を与えてそれを満たすかどうかの検査を行ない,文書データベースにおけるリンクの参照一貫性を保つことに関して議論し.リンクの一貫性管理を考感したハイパーメデイアデータベースモデルについて述べる.
著者
小杉 信
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.6, pp.1132-1139, 1993-06-25
参考文献数
11
被引用文献数
69

顔画像のモザイクパターンとニューラルネットを組み合わせた顔の認識法を提案する.顔画像の場合,顔の輪郭や目・鼻・口などの形状,ならびにこれらの位置関係が顔の重要な特徴であるが,顔は陰影が柔らかで正確な形状抽出が困難であり,更に,互いによく似ているため,従来,多人数の顔の認識はほぼ不可能であった.そこで,線分形状ではなく顔の濃淡情報に注目し,顔画像の中心部を12×12に粗くモザイク化し,これをニューラルネット(3層BPN)に入力して多人数の識別を試みた.この結果,学習後の中間層の各ユニットは,モザイク画像の各所から濃淡情報をきめ細かく集めることにより,互いに共通の特徴をもつ顔画像,例えば男女,を自動的に分類した.また,100人の上半身動画像から得た各人一つの正面向き平常顔を学習後,同じ録画像から任意にサンプルした平常顔ならびに微笑顔をテストし100%の認識率を得た.更に,学習の対象外,すなわち,見知らぬ顔に対しては,「その他検出」専用の出力ユニットを設けることにより,見知らぬ顔に対するエラー率を約1/2に低減することができた.
著者
小堀 大智 丸山 勉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. AI, 人工知能と知識処理
巻号頁・発行日
vol.112, no.70, pp.1-6, 2012-05-22

画像セグメンテーションは画像処理において重要なステップの1つであり,グラフカットはその効果的な手法である.グラフカットを行うために,最大流計算が広く使われているが,リアルタイムで行うには計算量が非常に多い.そのため,リアルタイムでグラフカットを行うためには,ハードウェアによる最大流計算の高速化が必要である.本報告では,FPGAでの画像セグメンテーションのための最大流計算の実装手法を提案する.本システムでは,FPGA上で高性能を達成するためにpush-relabel法とgap relabelingを用いた.ベンチマークにおいて,20〜30fpsの性能を達成した.
著者
岩成 英一 有木 康雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRU, パターン認識・理解
巻号頁・発行日
vol.93, no.431, pp.23-30, 1994-01-21
被引用文献数
24

DCT成分を用いて動画からシーン変わり目の(カット)を検出する方法を研究している。動画中の各フレームをブロックに分割し、DCT成分を求めると、同一シーン中の隣接するフレーム間では類似しているという特徴がある。このことに注目し本研究では、隣接するフレーム間で変化を求めてカットを検出するのではなく、連続するフレームによってクラスタを形成する方法を提案している。カットの検出は、形成された二つのクラスタを分割するフレームとして結果的に求めることが出来る。これにより、従来法で問題となっていた明るさの変化に敏感に反応するという点を改善することが出来るようになった。今回は、クラスタを形成する際のブロックサイズ、フレーム幅、使用するDCT周波数成分について最適なパラメータを求める実験を行なった。また、従来法との比較実験を行ない、本手法が、従来法で困難とされたいた、明るさが変化する場合、フラッシュがたかれた場合、暗い動画に対しても有効であることを示した。
著者
佐藤 奨 坂野 秀樹 板倉 文忠
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.111, no.97, pp.41-46, 2011-06-16

本研究は,楽曲推薦の特徴量に利用出来るような音響特徴量,特にラウドロック系の楽曲を特徴付ける音響特徴量の提案をする.ラウドロック系の楽曲は,歪んだ音を出すエレキギター及びベース,激しく叩くドラムの音が特徴的であり,上記の楽曲と,それ以外の楽曲とを混在させた曲順で聴くことはほとんどない.よって,両者を分類できる特徴量は,有用な特徴量となることが期待できる.本稿では,提案した音響特徴量を用いて,ラウドロック系,J-pop,ニューエイジ系の自動ジャンル分類実験により客観評価を行った.最も良い条件の場合,ラウドロック系の楽曲とそれ以外の楽曲とを区別する2ジャンルの識別率が97%,3ジャンルの識別率が87%となった.さらに,この音響特徴量が楽曲の印象とどのような対応があるのか,印象尺度を用いた主観評価実験を行った.その結果,音響特徴量と「激しい」「騒々しい」「優しい」といった印象との間に,強い相関があることが確認され,提案する音響特徴量が,主観的尺度と対応することが明らかになった.
著者
藤村 恒太 横矢 直和 山本 和彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.2, pp.382-390, 1993-02-25
被引用文献数
25

本論文では,医用画像処理における今後の重要な課題の一つである動画像処理のアプローチとして,医用分野で大半を占める形状およびその動き・変形が滑らかな非剛体物体の動画像を対象とした物体の追跡と動きの解析について述べる.物体の輪郭形状に対するフレーム内とフレーム間での制約をエネルギー関数として定義した動的輪郭モデルを用い,多重スケールでの動的計画法を用いたエネルギー最小化により対象物体の輪郭を抽出・追跡し,その動きを解析する.ここで提案する多重スケールでの動的計画法は,スケールに応じて動的計画法の探索近傍を変化させるもので,粗いスケールでは粗い近傍を,細かいスケールでは細かい近傍を定義し,粗いスケールから細かいスケールへとエネルギーの最小化を行う.これによって物体の大きな動き・変形に対処することができる.本手法を「条件付け学習の神経機構の解明を目的とするナメクジの行動解析」の動画像と超音波心臓動画像に適用し,非剛体物体追跡の有効性を確認した.なお,前者の適用例では,動きの解析として,輪郭に沿った曲率の正の極大点を物体の変形に不変な特徴として抽出し.その移動量を計測した.これによって,物体の大まかな動きの測定が可能となった.
著者
新見 道治 野田 秀樹 河口 英二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.6, pp.1132-1140, 1998-06-25
参考文献数
8
被引用文献数
40

本論文は新たな画像深層暗号化法を提案するものである.これまでに, 離散コサイン変換を用いた画像深層暗号化法が提案されている.この方法によると, 埋め込めるデータ量は, 濃淡画像をダミー画像とした場合, たかだかダミー画像の13%程度である.一方, 本手法は2値画像のノイズ状の領域に秘密データを埋め込もうとするものである.ノイズ状の領域であるか否かは, "複雑さ"なる尺度を利用することにより判定する.本手法では視覚的に簡単な複雑な領域に変換できる"コンジュゲート"演算を利用して秘密データを加工することにより, どんなデータでも埋込みが可能となる.実験では8ビットのダミー濃淡画像に対して, 原画像の約36%のデータ量のJPEGファイルを, 35dB程度の視覚的に見劣りがしない状態で, 埋め込むことができた.
著者
赤松 茂
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.8, pp.2031-2046, 1997-08-25
被引用文献数
175

コンピュータによって顔画像の個人認識を行う技術の最近の研究動向について述べる. まず, これまでに多くの研究が行われてきた正面顔画像による個人識別を目的とした顔パターンの表現法について紹介すると共に, 更にこれらを顔の姿勢変化による見え方の変化を許容する方向に拡張しようとする研究の動向について述べる. また米国においてそのようなロバストな顔認識技術の確立を目指した研究の推進の原動力の一つとなっている顔認識技術開発計画FERETの動向についてもあわせて解説する. 更に, コンピュータによる顔の認識をコンテンツによる映像データベースの検索や編集というメディア処理の要素技術の一つとしてとらえ, 顔が伝える感性的な情報に対する人間の認知特性をコンピュータによる顔の認識に反映させることを狙いとして, 人間による顔認識過程をモデル化しようとしている試みについても紹介する. 最後に, 個人識別やデータベース検索など, 顔に対するさまざまな高次視覚情報処理を実現する前提として重要な, シーン画像から顔パターンを抽出する機能の実現についての研究の現状を述べる.
著者
中井 宏章 渡邉 睦 三宅 啓夫 高田 敬輔 山下 馨 新盛 英世 石原 謙
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.1, pp.280-288, 2000-01-25
被引用文献数
36

我々は, ビデオカメラで撮影した被験者の就寝時映像から, 動画像処理により呼吸を自動計測するシステムを試作している.本システムは, 完全に無拘束でリアルタイムに呼吸状態をモニタリングでき, 高齢者や乳児の睡眠中の突然死や無呼吸症候群の早期発見・診療補助に用いることができる.呼吸計測は被験者胸部の画像変化をフレーム間差分で検出することにより行い, 同時に統計的判別による就寝状態判定も行う.また, 呼吸計測に最適な関心領域(ROI)を自動設定することにより, オペレータの操作なしに長時間の呼吸計測が可能となった.本論文では, 本システムの詳細について述べるとともに, 特別養護老人ホームにおいてフィールドテストを行った結果について報告する.
著者
高橋 英之 西村 望 大森 隆司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.109, no.461, pp.437-442, 2010-03-02
被引用文献数
1

自分の心を言葉だけで正確に語れるとは限らない.特に芸術などに対する嗜好性は,言葉で正確に表現することが困難である.本研究では,絵画鑑賞者の嗜好が鑑賞中の視線の動き(絵画上のオブジェクトに対する注意配分)に反映されるという仮説を立て,絵画鑑賞者の嗜好を視線の動きだけから推定することを試みた.我々の実験の結果,まず絵画に対する嗜好性と絵画鑑賞時の視線の動きの間には定量的な関係性があること,そしてこれらの関係性を利用することで視線の動きから絵画鑑賞者の嗜好をある程度即時的に推定可能であることが示唆された.
著者
牛山 聡 東山 三樹夫 飯塚 昌弘 平田 能睦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EA, 応用音響
巻号頁・発行日
vol.93, no.527, pp.39-44, 1994-03-22
被引用文献数
49

Fourier解析による波形分析では信号の周期性を仮定するため、波形が単一正弦波であっても観測区間の位置や長さによって分析結果が異なると言う問題がある。本稿は、時間窓の影響を受けない概周期関数を用いた一般調和解析によって、定常的とは限らないPiano音や音声信号の分析を試みる。その結果、(1)過渡的な信号が短時間に切り出した区間ごとの分析合成によって概周期関数のモデルで表現できる、(2)短時間内に生じるわずかな周波数変動を概周期関数に基づく一般調和解析によって分析できる、ことを実証する。
著者
福田 拓章 寺田 隆彦 平田 能睦 東山 三樹夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会ソサイエティ大会講演論文集
巻号頁・発行日
vol.1995, 1995-09-05

筆者等は、先に一般調和解析(GHA)による非定常信号の周波数解析法を提案した。本報告では、GHA手法を歌声のピッチ抽出に応用する可能性を検討する。
著者
谷口 行信 南 憲一 佐藤 隆 桑野 秀豪 児島 治彦 外村 佳伸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.6, pp.1112-1121, 2001-06-01
被引用文献数
28

映像の効率的なブラウジングのためには, 映像にインデックスを付与する作業が必要である.本論文は5種類の映像解析技術-ショット切換検出, カメラワーク検出, テロップ検出, 音楽検出, 音声(人の声)検出-を統合した映像インデクシングシステムSceneCabinetについて述べる.映像解析技術に基づく自動インデクシングアプローチは従来から提案されているが, 自動付与できるインデックスは限られる上, その精度は100%でない.このような映像解析の不完全性を補うために, 本システムは自動付与されたインデックスを効率的に修正したり, 関連情報を人手で簡単に付与するためのユーザインタフェースを提供する.具体的には, タイムラインと代表画像一覧を組み合わせることで, 効率的にインデックスの修正や付与ができるようにする.本システムを用いると, 手作業の場合に比べて約半分の作業時間でインデックス付与できることを評価実験により示す.更に, 映像ストリーミング技術を統合したWebページ作成ツールについて述べ, その応用事例を挙げることで本システムの有効性を示す.
著者
長谷部 聡
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会ソサイエティ大会講演論文集
巻号頁・発行日
vol.2010, no.2, pp."SS-112"-"SS-115", 2010-08-31
被引用文献数
1

本稿ではオープンソースのLinux無線LANドライバであるath9kのカスタマイズについて述べる。具体的にはアドホックモードにおけるIEEE802.11n動作の他,レイヤ3メッシュネットワーク技術を中核とするオープンメッシュネットワークにおいて,有用と考えられる下位層アクセス機能を実現する。1節では無線LANインターフェースの制御について述べる。2節ではアドホックモードにおけるIEEE802.11nサポートについて述べる。3節ではリンクごとのレート設定機能実現について述べる。4節ではリンク層通知機能実現について述べる。5節ではユーザースペースプログラムiwの機能拡張について述べる。6節では以上をまとめる。
著者
本郷 仁志 石井 洋平 丹羽 義典 山本 和彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.102, no.532, pp.1-6, 2002-12-13
被引用文献数
9

顔画像から性別と年齢を統合的に推定する方法を提案する.本稿では,顔画像から抽出した四方向面特徴を線形判別分析で学習した識別器をベースとし,性別・年齢のクラス分類の方法の違いによる推定率を比較する.特徴量としては,肌色情報で抽出した顔外接領域と目と口を囲む顔部品領域とから抽出した特徴量を用いた.HOIP顔画像データベース300名の正面顔画像に対して実験を行ったところ,性別推定では,男女混在分類において92%の識別率を得た.年齢推定においては,男女と性別で分け,年齢を10歳区分で学習することで,学習人物に対しては約70%,未知人物に対しては,約40%が得られた.本提案手法による性別及び年齢の推定が可能である見込みが得られた.
著者
長谷川 修 森島 繁生 金子 正秀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.8, pp.2047-2065, 1997-08-25
被引用文献数
68

「顔」は人間にとって非常に身近な存在であると共に, 顔の持ち主である一人一人の人間における個人的な情報, コミュニケーションに係わる情報を始めとした, 言語的手段では表現しにくいようなさまざまな情報を担っている. 近年, 工学分野では主としてコミュニケーションメディアやヒューマンインタフェースへの応用の観点から,「顔」の工学的取扱いに対する研究が活発に行われている. 具体的には, ユーザである人間を対象とした視覚機能をコンピュータにもたせるための顔の認識技術と, コンピュータあるいはコミュニケーションメディアに表現力豊かな顔をもたせるための顔の合成技術である. これらの研究成果は, 従来個別に検討が行われていた顔関連の心理学, 人類学, 美容, 歯科等さまざまな分野においても活用されつつある. 本論文では, このような観点からコンピュータによる顔情報処理に焦点を当て, まず要素技術としての顔画像合成と表情認識について最近の技術動向を概観する. 次に,「顔」の諸特性について考察した後に, 人と人との対面コミュニケーションの支援, 人と機械との間の顔情報を介したコミュニケーションという二つの立場から「顔」の工学的応用について述べる. また,「顔」情報処理の研究のためのツールやデータベース等についても紹介する.
著者
吉岡 勇太 和田 俊和
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. HIP, ヒューマン情報処理 (ISSN:09135685)
巻号頁・発行日
vol.109, no.471, pp.241-246, 2010-03-08

画像を用いたトラッキングや物体認識,複数画像の張り合わせなどに,SIFT(Scale-Invariant Feature Transform)などの局所特徴量がよく用いられる.これは,SIFTが照明の変化や回転,拡大・伸縮などに対して比較的安定な特徴を生成するためである.しかし,SIFTの計算量は多いため,現在の汎用CPUではビデオレートで計算をすることはできない.このことは,より高速な計算が可能な局所特徴量SURF(Speed Up Robust Features)でも同様である.本報告では,SURFアルゴリズムを,ソフトウエア的な論理回路合成が可能なFPGA(Filed Programmable Gate Array)上で実装し,データ並列とタスク並列によって,ビデオレートで計算する方法を示す.
著者
森江 隆 岩田 穆
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CAS, 回路とシステム (ISSN:09135685)
巻号頁・発行日
vol.102, no.162, pp.67-78, 2002-06-21
被引用文献数
2

脳の初期視覚系での特徴抽出モデルとして知られるガボールウェーブレット変換を画素並列動作で実現するLSIを核とする自然画像認識システム構築の試みについて述べる。まず,自然画像の特定領域を注視する処理として抵抗ヒューズを用いた大局的領域分割を行う。分割された各領域を個別に抽出し,ガボールウェーブレット変換を行う。得られたガボール特徴量を用いて,ダイナミックリンクアーキテクチャに基づく柔軟なマッチングにより認識を行う。特徴抽出までの処理をハードウェアで実行するために,画素並列で動作するLSIをパルス変調信号を用いたアナログ・デジタル(AD)融合回路アーキテクチャに基づいて設計した。本稿では特に,(1)パルス変調方式ピクセル回路を用いた大局的領域分割用抵抗ヒューズネットワークおよび抵抗ネットワーク型ガボールフィルタ回路とそのLSI設計例,(2)セルオートマトン型画像領域抽出アルゴリズムとそのFPGAへの実装例,(3)システム化の基盤となるLSI制御用FPGA搭載PCIボードの仕様について詳述する。