著者
堀田 一弘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.8, pp.1624-1633, 2005-08-01
被引用文献数
4

本論文では, 局所カーネルの和に基づくSupport Vector Machine(SVM)を用いた部分的な隠れに頑健な顔検出法を提案する. 近年, SVMを用いた顔検出法の有効性が報告されているが, 従来手法では画像から抽出した大局的な特徴に対して一つのカーネルを適用していた. 大局的な特徴は部分的な隠れの影響を受けやすいので, 従来手法は隠れに頑健でないと考えられる. SVMに基づく顔検出法に部分的な隠れに対する頑健性を付与するためには, 局所特徴をうまく扱う必要がある. ここでは, 局所特徴をうまく扱うために局所カーネルを導入し, その統合法として和を用いた. 実験では, 人工的な隠れを含む顔画像や光源方向の変化により生じた影を含む顔画像を用いて従来の大局カーネルに基づくSVMとの比較を行い, 提案手法の隠れに対する頑健性を示した. また, サングラスやマフラー等の実際的な隠れを含む顔画像から顔を検出できることも確認した.
著者
三須 俊彦 高橋 正樹 合志 清一 蓼沼 眞 藤田 欣裕 八木 伸行
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.8, pp.1681-1692, 2005-08-01
参考文献数
13
被引用文献数
12

実時間画像処理に基づくサッカー中継映像用のオフサイドライン可視化システムを開発した. 本システムは, 固定カメラ画像中の人物を抽出し, そのワールド座標を求める. 更に色情報に基づいてユニフォームを分類することでフォーメーション解析を行ってオフサイドライン位置を特定する. 中継用カメラのパン・ズーム操作をロータリエンコーダによって計測することで, ワールド座標を実写ハイビジョン映像上に変換し, パン・ズーム操作に連動したオフサイドラインを仮想表示することができる. 本論文では, システムのブロック構成を追いつつ画像処理手順について定式化を行う. また, 実際のJリーグ公式戦において実施したフィールド実験の結果を示す.
著者
安藤 彰男 今井 亨 小林 彰夫 本間 真一 後藤 淳 清山 信正 三島 剛 小早川 健 佐藤 庄衛 尾上 和穂 世木 寛之 今井 篤 松井 淳 中村 章 田中 英輝 都木 徹 宮坂 栄一 磯野 春雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.6, pp.877-887, 2001-06-01
被引用文献数
57

テレビニュース番組に対する字幕放送を実現するためには, リアルタイムで字幕原稿を作成する必要がある.欧米では特殊なキーボード入力により, ニュースの字幕原稿が作成されているが, 日本語の場合には, 仮名漢字変換などに時間がかかるため, アナウンサーの声に追従して字幕原稿を入力することは難しい.そこで, 音声認識を利用した, 放送ニュース番組用の字幕制作システムを開発した.このシステムは, アナウンサーの音声をリアルタイムで認識し, 認識結果中の認識誤りを即座に人手で修正して, 字幕原稿を作成するシステムである.NHKでは, 本システムを利用して, 平成12年3月27日から, ニュース番組「ニュース7」の字幕放送を開始した.
著者
水野 勇 岩崎 洋平 金子 豊久 栗山 繁
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.6, pp.1319-1328, 2004-06-01
参考文献数
19
被引用文献数
4

本研究は変形を伴う柔らかい3次元物体をモデル化し,様々な外力による変形操作を容易に行う手法を提案する.対象物として球・立方体などの仮想物体のほか,人間の顔頭部を取り上げる.柔らかい物体の表現法として,ばねネットワーク(ばねモデル)を用いる.CT画像をもとに,最密構造を初期配置としバブルメッシュ法を利用し頭部領域を四面体メッシュに分割し,均一なばね長をもつばねモデルを構築する.変形シミュレーションにおいては,ばね力と体積保持力を考慮した柔らかい物体の変形を表現する.手と顔表面などの柔らかい物体相互の接触による反力,または垂直抗力を算出し,それぞれの物理現象を表現する.球と立方体の接触による変形を確認した後,人間頭部モデルに対し,手モデルによる外力を加えるシミュレーションを行い,頭部モデルと手モデル両者ともに体積を保存しつつ変形を表現することができた.更に摩擦力を導入して,唇を押し上げる,引っ張るといった様々な変形操作の物理シミュレーションを行い,提案手法が有効であることを確認した.
著者
野中 亮助 佐藤 誠 小池 康晴
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.4, pp.1008-1019, 2004-04-01
参考文献数
17
被引用文献数
3

本論文では,Speed-Accuracy Trade-offの問題に関して,水平面内における2点間到達運動において,運動距離,運動精度を変化させ,そのときの運動軌道及び,筋の活性度を示す終電信号を計測した.また,比較実験として運動精度を要求しない課題を行った.その結果,Fitts's lawに準じた2点間到達運動において,運動の筋端点近傍で運動トルク生成のためには不必要な筋の活性が行われていることを示した.また,その筋の活性度は,要求された運動精度が高くなり,運動速度が遅くなっても,小さくはならないこと,更に,精度を要求されない同じ運動速度の運動に対して,精度を要求された精度の高い運動においては,その筋の活性度が大きくなることを示した.この結果は人がFitts's lawに準じた2点間到達運動を行っている際,腕の粘性や剛性といったインピーダンスを積極的に調節することによって,試行ごとに生ずる誤差を小さくするというメカニズムが存在していることを示す.
著者
真鍋 宏幸 平岩 明 杉村 利明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.9, pp.1909-1917, 2005-09-01
参考文献数
19
被引用文献数
12

本論文では, 声を出すことなく口パク動作を行うだけで発話内容を認識する無発声音声認識を提案し, その基礎実験の結果について報告する. 無発声音声認識により, 発声行為が周囲の人々に迷惑となるマナー的問題や, 雑音環境下において音声認識の認識率が低下する問題を解決することが可能となり, 携帯電話への応用が期待できる. 無発声音声認識の実現へ向け, 筋電信号を用いる方法について検討を行った. まず, 日本語5母音の無発声発話動作時の筋電信号を測定した. 指輪型電極を用いることで簡便な測定が可能である. 次に測定した筋電信号を, ニューラルネットワークを用いて認識し, 通常発声時における母音の持続時間よりも十分に短いフレーム長を用いた場合でも, 90%以上の精度で認識できることを明らかとし, 筋電信号には母音の特徴が見られることを示した.
著者
清木 康 金子 昌史 北川 高嗣
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.4, pp.509-519, 1996-04-25
被引用文献数
100

画像データを対象としたデータベースシステムにおいては, 検索者の印象や画像の内容による検索を実現する方法が重要である. 我々は, 文脈あるいは状況に応じて動的に変化するデータ間の意味的な関係を計算するモデルである意味の数学モデルを提案している. 本論文では, 意味の数学モデルを用いた意味的画像探索方式を提案し, また, その学習機構を示す. 本方式では, メタデータ空間と呼ぶ正規直交空間を形成し, その空間上に画像データ群, および, 検索に用いるキーワード群を配置する. そして, その空間上での距離計算により, 検索者の印象, および, 画像の内容の指定に応じた画像探索を実現する. 検索対象の各画像は, 画像の特徴(印象あるいは内容)を表す言葉(単語群)によって表現されることを前提とする. 本方式は, 検索者が発行する検索語, および, 画像データの特徴を表現する単語間の相関関係の分析により, 画像を検索する方式として位置づけられる. 本方式では, 検索者が指定する印象あるいは画像の内容を文脈として言葉により与えると, その文脈に対応する画像をメタデータ空間より動的に抽出する. 本学習機構では, その文脈から得られた画像が, 本来, 抽出されるべき画像と異なる場合, 抽出されるべき画像を指定することにより, 文脈を構成している言葉についての学習を行う. 本学習機構を適用することにより, 画像の印象表現における個人差に対応することが可能となる.
著者
松井 淳 本間 真一 小早川 健 尾上 和穂 佐藤 庄衛 今井 亨 安藤 彰男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.2, pp.427-435, 2004-02-01
参考文献数
11
被引用文献数
22

スポーツ中継番組の字幕放送を,音声認識によって拡充するため,放送音声を積極的に言い換えるリスピーク方式を提案する.ソルトレークシティオリンピック中継のスキージャンプ団体の放送音声と,本方式により言い換えを行った字幕用音声をそれぞれ音声認識した結果,単語正解精度が45.6%から96.8%に改善した.また,リスピークにおいて積極的に言い換える効果を調べるため,実際の字幕放送と同様の条件下で採取した発話内容について言い換えのパターンを五つに分類し,それぞれのパープレキシティ削減率を比較した結果,語の補完による言い換えが7.3%と最も効果が高かった.字幕放送の実質的な性能を左右する文正解率については,言い換えがおうむ返しによるリスピークに比べて,スピードスケートで8.8%,スキージャンプで6.6%向上した.NHKでは,本方式を利用することにより,口語的な発話スタイルを多く含んだソルトレークシティオリンピック中継(2002年3月),及び,第52目NHK紅白歌合戦(2001年12月)の字幕放送を実現させた.
著者
近藤 和弘 チャールズ ヘンプヒル
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.2, pp.257-267, 1998-02-25
参考文献数
16
被引用文献数
13

不特定話者連続音性認識を用いて, 音声でWorld Wide Web(WWW)ブラウザが制御可能なシステムを試作した.このシステムでは現在ブラウズしているページ中のアンカー名を読むことにより, そのリンク先のページに進むことができる.また, 音声を用いて, ブラウザを制御することも可能である.新しいWWWページに移行するたびにブラウズ中のページからアンカー名を抽出し, これを音素列に変換し, 文法を作成し, 音声認識システムに与えて語いをダイナミックに切り換える.このとき, 日付, 年齢などの例外的な読み方に対応する必要がある.簡単な音素列変換テストの結果, 最も正答に近い候補中に97%の正しい音素列が含まれていることが確認された.更に, 日本語ページには英文アンカー名も多く含まれるため, 限定語いの英語も認識できるようにした.簡単なユーザテストの結果, 91.5%のタスク達成率を得た.エラーの原因は音声認識精度によるものよりむしろユーザの誤読, 音声検出ミスなどの方が多いことがわかった.不慣れなために起こるユーザ誤操作を除いたタスク達成率は94.1%である.
著者
吉村 貴克 徳田 恵一 益子 貴史 小林 隆夫 北村 正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.8, pp.1565-1571, 2004-08-01
被引用文献数
4

本論文は,HMMに基づいた音声合成システムに混合励振源モデルを導入することにより,合成音声の品質向上を図ることを目的とする.我々はこれまでに,メルケプストラム,基本周波数,継続長をHMMの枠組みでモデル化し,HMMからこれらの音声パラメータを出力することによって音声を合成するテキスト音声合成システムを提案した.このシステムでは,合成フィルタ(MLSAフィルタ)を励振する際の励振源モデルとして,有声区間,無声区間でそれぞれパルス列と白色雑音を切り換える単純なモデルを用いている.このような励振源を用いる場合,有声摩擦音のように周期成分と非周期成分をともにもつ音声を合成することができず,合成音声の品質を劣化させる原因となる.そこで本論文では,パルス列と白色雑音を混合する混合励振源モデルを用いることにより高品質な音声を実現している狭帯域音声符号化手法MELPの混合励振源モデルを導入する.この混合励振源モデルは,狭帯域音声符号化だけでなく,広帯域音声符号化へも応用されていることから,音声合成においても有効性が期待される.更に,多くの音声符号化手法で用いられているポストフィルタを導入し,合成音声の品質を向上を図る.また主観評価実験により,本システムにおける混合励振源モデルとポストフィルタの有効性を示す.
著者
村瀬 洋 Vinod V.V.
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-2, 情報・システム 2-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.9, pp.2035-2042, 1998-09
被引用文献数
116

本論文では, 画像中に興味ある物体が含まれているかどうか, その位置はどこかを高速に探索するアクティブ探索法について述べる.位置と大きさが不明な物体を画像中から精度良く検出するには, 従来は, 入力画像中の局所領域に着目し, その位置と大きさを変化させながら, 局所領域と参照画像との膨大な回数の照合を行う必要があり, 高速な物体検出は困難であった.本手法では, 物体の形状変形などに安定な色ヒストグラムを特徴として利用し, ヒストグラムの代数的な性質を利用することにより, 特徴照合の際に, 入力画像中のある位置の類似値からその近傍の類似値の上限値を計算する.上限値が探索値より小さければ, その領域での探索が省略できるため, 照合回数を極端に低減できる.本手法により, 総当り法に比較して, 近似を使うことなく, 計算時間を10倍から1000倍程度向上できることを実証した.物体の追跡, 検索, 計数などへの応用例についても述べる.
著者
坂口 嘉之 美濃 導彦 池田 克夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.3, pp.483-491, 1995-03-25
参考文献数
20
被引用文献数
14

衣服の数値計算において,動的に変形する衣服と人体との衝突を,摩擦と跳ね返りの影響をも含んだ制約条件とみなした制約充足型アプローチによる衝突の影響の計算方法とその応用について述べる.衣服の変形過程は,衣服の自己衝突と人体形状に影響されるため,衣服形状を計算するには,これらとの衝突を計算する必要がある.また,衣服を着た人間の動きを表現する場合には,衣服の動きと人体の動きの両方を考慮した衝突計算を行わなければならなず,複雑で時間のかかる処理となる.しかし,人体の動きと衣服の動きの相対速度が十分小さい場合には,衣服から人体への衝突だけに注目すればよく,計算速度を向上させることができる.計算実験として,実際の婦人用ワンピースの型紙と,実測の布特性を用いて,距離画像から作成した人体モデルに着せつけた.その結果,布が人体表面を滑らかにすべるような状況が計算でき,計算結果は実物の形状に近いものになった.
著者
若林 哲史 鶴岡 信治 木村 文隆 三宅 康二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.1, pp.73-80, 1997-01-25
参考文献数
19
被引用文献数
6

正準判別分析は分散比 (F比) を最大化する最も代表的な特徴選択手法であるが, クラス数以上の特徴が選択できないため,少クラスの分類問題に対する有効性に限界がある. この問題を解決するために, 新しい特徴選択手法 (FKL法) を提案し, 手書き数字認識実験によりその有効性を評価する. FKL法は, F比を最大化する正準判別分析と, 次元減少による平均2乗誤差を最小化する主成分分析 (K-L展開) を特殊な場合として含む, より一般的な特徴選択手法である. 正準判別分析, 主成分分析, 正規直交判別ベクトル法 (ODV法) などとの比較実験の結果, 少クラスの分類問題ではFKL法により選択された特徴量の識別力が最も高いことを示す.
著者
柏野 邦夫 スミス ガビン 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.9, pp.1365-1373, 1999-09-25
参考文献数
12
被引用文献数
70

放送など長時間の音響信号中から,特定のテーマ曲やCMなど,目的音響信号の有無及び時刻を高速に探索する方法を提案する.従来の,スペクトルや波形のずらし照合に基づく探索では,長時間の音響信号を探索対象とした場合,計算量が膨大となるという問題があった.これに対し本論文で提案する方法では,スペクトル特徴のヒストグラムに基づいて探索を行うことにより,大幅に計算時間を短縮することができる.例えば,ワークステーションを用いた実験では,音響信号からあらかじめスペクトル特徴を抽出しておいた場合,6時間の音響信号から目的音響信号(15秒間)を所要約2.3秒で正しく探索できることがわかった.また,白色ガウス雑音の重畳に対しては,SN比20dBまで頑健であることがわかった.
著者
新田 克己 長谷川 修 秋葉 友良 神嶌 敏弘 栗田 多喜夫 速水 悟 伊藤 克亘 石塚 満 土肥 浩 奥村 学
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.8, pp.2081-2087, 1997-08-25
被引用文献数
17

論争支援マルチモーダル実験システムMrBengoは, 法廷における論争をシミュレートする知識ペースシステムに, 顔認識, 表情合成, 音声認識, 音声合成, WWWブラウザなどのモジュールを結合したマルチモーダル実験システムである. このシステムは, 原告(検察官), 被告側弁護士, 裁判官という仮想的な三つのエージェントからなっている. ユーザは被告側弁護士に音声で指示を出して, 検察官と法廷論争を行い, 論争が終了すると裁判官が判決を下す. 論争の状況に応じて, エージェントの表情が変化するので, ユーザはそれを見ながら論争の戦略をたてることができる.
著者
上田 修功 斉藤 和巳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.3, pp.872-883, 2004-03-01
被引用文献数
8

テキストは,一般に,多重トピックからなる.それゆえ,テキストからの自動トピック抽出は,伝統的なパターン認識で行われている排他的なクラス分類とは異なり,多重を許容するという意味でより困難な分類問題といえる.従来法では,多重トピックテキストの生成モデルが全く考慮されていないため,必然的な性能限界があると考えられる.本論文では多重トピックを有するテキストの新たな確率モデル,パラメトリック混合モデル(PMM1,PMM2)を提案し,次いで,PMMに基づいて,テキストから多重トピックを同時に抽出する手法を論じる.PMMは,単一トピックに対応する基底パラメータで可能なすべての多重トピッククラスを表現でき,PMM1ではパラメータ推定アルゴリズムの大域的最適性が保証され,更に,PMMのパラメータ推定及びトピック予測アルゴリズムは高速,という優れた特長を有する."Yahoo"ドメインの実際のwebページ分類実験により,提案手法の従来手法に対する顕著な優位性を示す.
著者
野口 将人 志村 哲 坪井 邦明 松島 俊明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.5, pp.954-962, 2005-05-01
被引用文献数
1

音楽情報処理システムは, 対象を西洋音楽に限れば, 五線譜に基づく自動読取りやその他の入力方式・装置が数多く開発・製品化されており, 特にデスクトップミュージックと呼ばれるソフトウェアの普及により, 作曲・演奏, 楽譜の作成・印刷などが効率的に行えるようになった.しかし, 日本の伝統音楽をはじめ諸民族の音楽の多くは, 五線譜とは表現方法の異なる各楽器特有の記譜法が用いられており, それらに対応できるシステムが必要である.ところが, これまでこの研究・開発例は少ない.このような状況を改善するために, 尺八楽譜の情報処理システムに関する研究を行った.本システムは, 手書きによる入力編集機能, 伝統音楽に特有な様々な流派の異なる楽譜間の相互変換機能, 演奏方法の表示を伴った発音機能等, 尺八楽譜情報の処理に有用な様々な機能を備えたマルチメディアシステムとなっている.また, 本研究においては, 計算機処理を可能とするために, 尺八楽譜のデータ表現方式を新たに考案した.本システムにより尺八楽譜作成の効率が向上するばかりでなく, 西洋楽器との合奏用楽譜作成支援ツールや, 初心者の尺八の独習用ツールとしての有効性も期待できる.
著者
庄野 逸 福島 邦彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.5, pp.940-950, 1994-05-25
被引用文献数
6

手書き英字筆記体連結文字列認識を行うシステムの一つとして選択的注意機構を用いたシステムが今川らによって提唱された.しかしながら今川らのシステムは,それほど高い認識能力をもっていたわけではなく,認識する文字カテゴリーも5文字と比較的小規模なシステムであった.本研究では今川らの認識システムを拡張し,更に高い認識能力をもつシステムを作成した.我々は"選択的注意のモデル"の一部分がパターン認識システム"ネオコグニトロン"に類似していることに着目した.ネオコグニトロンにおいて,折れ点検出回路を導入すると認識能力の向上が認められることが報告されているので,我々は今川らのシステムに折れ点処理回路を導入したシステムを作成した.更に本システムに対して種々のテストパターンを与え,コンピュータシミュレーションを行い,筆記体連結文字列の認識に対して有効であることを確認した.
著者
中川 聖一 山本 誠治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.12, pp.2139-2145, 1996-12-25
被引用文献数
9

本論文では,対話方法と被験者の違いによる振舞いや主観の違いの検討を行うために,"Wizard of Oz法"でインプリメントしたシステムを用いて評価実験を行った."Wizard of Oz法"とは,システムに精通した人(ウィザード)がシステムの代わりに処理を行うことによって,あたかもシステムが存在しているかのように見せかける実験方法である.評価実験で用いたタスクは,"富士五湖周辺の宿泊施設案内"で,対話方法としてはシステム主導型とユーザ主導型の二つを用意した.また,被験者として情報工学系の学生と工学系でない一般の女性を選び,合計16人で実験を行った.評価実験で得られた対話データをもとにユーザの平均発話数,1発話当りのユーザのシステム占有時間,聞き直し,間投詞,言い直し,単語カバー率について詳しく検討した.その結果,ユーザの平均発話数はシステム主導型の方が多くなるが,ユーザのシステム占有時間はユーザ主導型の方が長くなることわかった.また,間投詞,言い直しはユーザ主導型の方が多く出現することわかった.更に,システム主導による入力の方がユーザ主導に比べて使用される単語にかなりの制限が加えられることが確認できた.
著者
松山 隆司 和田 俊和 波部 斉 棚橋 和也
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.10, pp.2201-2211, 2001-10-01
被引用文献数
81

背景差分は, 画像中の移動対象を検出する有効な手法として広く利用されている.しかし, 背景差分を行うには, 背景部分での画像の変化が観測されないという前提条件が必要であるため, その適用範囲は限られている.本論文では, 照明変化による背景部分の画像の変化が起きた場合にも適用可能な背景差分による移動対象検出法を提案する.本手法は, 異なった考え方に基づく二つの対象検出法に基づいている.一方は, 照明に不変な特徴を用いて背景画像と観測画像の比較を行う手法である.他方は, 背景差分を行う前に観測画像の照明条件を推定し, 輝度の正規化を行う手法である.これら二つの手法は互いに相補的であり, 最終的に双方の検出結果を統合することで精度の高い検出結果を得ることができる.実験の結果, 実画像に対する本手法の有効性が示された.