著者
坂口 嘉之 美濃 導彦 池田 克夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.11, pp.2210-2219, 1994-11-25
被引用文献数
12

人間が衣服を着て着飾って動く状況を作り出す仮想服飾環境(PARTY)における,衣服形状を計算するときに用いる,型紙と人体モデルとに適用する格子形成法について述べる.衣服の形状は,衣服を構成する布の物理特性と型紙形状,衣服をまとう人体形状とその動き,衣服の着方等さまざまな要因によって決まる.このために,解析的に衣服形状を算出することは困難であり,数値計算を行うことになる.衣服形状を数値計算するためには,まず,型紙と人体形状を格子に離散化した表現にする必要がある.更に,型紙は人体の展開図的な性質をもつために,この格子形成法は,基本的には型紙と人体とに共通して適用可能でなければならない.本論文では,滑らかさ,せん断変形,格子間距離からなる幾何学的制約を充足することによる格子形成法を提案する.計算実験により,型紙のダーツやプリーツ,縫合に対応できる本手法の柔軟性を示し,人体形状の格子形成では,あらかじめ設定した格子点数で人体形状を表現する.その結果,ほぼ満足できる格子が型紙と人体形状とに対して得られた.
著者
西本 卓也 志田 修利 小林 哲則 白井 克彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.12, pp.2176-2183, 1996-12-25
被引用文献数
32

マルチモーダルインタフェースの枠組みの中で音声入力がどのようにインタフェースの改善に貢献し得るかを検討し,そこで得た知見を生かしたマルチモーダル作図システムS-tgifを作成・評価した.システムの作成にあたっては,インタフェースの原則論に従って音声の特長である操作性および手順連想容易性を生かし,欠点である状態理解容易性,頑健性を他で補うよう努めた.評価実験の結果,システムの利用を開始してまもない時期あるいは一時利用を中断した後などにおいては特に音声の利用効果が高く,課題の完了までに要する時間を約80%に減少できた.ユーザがシステムに熟練すると音声の利用の客観的効果は薄れるが,特定のコマンドでは音声の利用率が90%を超え,また主観評価の結果でも高い評価を得るなど,音声入力はユーザから支持された.このように,インタフェースの原則論に従って音声の効果的利用を考慮することにより,有用なインタフェースを構築できることが示された.
著者
村本 健一郎 松浦 弘毅 椎名 徹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.5, pp.949-958, 1993-05-25
被引用文献数
24

落下中の降雪雪片の形状を解析することは,雪片の生成メカニズムを解明する上で重要である.降雪雪片の形状を定量的に解析するためには,多くの雪片像より特徴量を抽出し,それらの相関を明らかにすることが必要である.本研究では,テレビカメラを使って,落下中の降雪雪片を連続的に撮影し,この2次元映像を画像処理して雪片の輪郭線を記録した.記録された輪郭データを用いて,落下中の雪片の運動に関与する雪片の領域の特徴解析と,雪片同士の併合に関与する輪郭線の複雑さとの2通りの解析を行った.領域の特徴解析では,面積,重心,落下姿勢および正規化モーメント特徴量を求めた.一方,輪郭線の複雑さとして,円形度,凹率およびフラクタル次元を計算し,これらの関係を調べた.モーメント特徴量,円形度,凹率は,面積や撮影方向により,影響を受けるが,フラクタル次元は,ほとんど一定値をとることがわかった.
著者
大倉 計美 杉山 雅英 嵯峨山 茂樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.12, pp.2469-2476, 1993-12-25
参考文献数
17
被引用文献数
34

混合ガウス分布型HMMにおける話者適応方式である「移動ベクトル場平滑化話者適応方式」を提案する.本手法は,話者適応の問題を少量学習音声資料を用いたHMMの再学習による分布の移動問題としてとらえ,学習前後のHMMのガウス分布の平均ベクトルの差分(移動ベクトル)が構成する一つの場(移動ベクトル場)の連続性の拘束条件に基づく移動ベクトルの補間と平滑化により,不十分な学習資料しか得られない場合に生じる(1)未学習モデルの問題と,(2)モデルの推定誤差の問題,に対処するものである.本論文では評価話者に男女各1名を用いた23音素認識実験により,平滑化はモデルの推定誤差を吸収するために有効な手法であることを示した.また,文節音声認識において,本手法の発話様式適応への応用と不特定話者モデルに基づく話者適応への応用を検討し,本手法の有効性を示した.
著者
北本 朝展 高木 幹雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.11, pp.2582-2597, 1998-11-25
被引用文献数
15

一般に「画素」は画像処理の最小単位とみなされているが, 実際は「ミラクル」と呼ばれる画素, すなわち1画素の内部に複数の分類クラスを含むような画素の内部構造に関する考察が必要となる場合がある.本論文は, このような画素の内部構造を表現する指標として, ミクセルの内部で各クラスが占める面積の比率を表す「面積占有率」に着目し, 画像中に出現するミクセルの集合を母集団として考えた場合の面積占有率の分布である面積占有率密度」という確率モデルの特徴・性質に関する研究を目的とする.このモデルは従来は暗黙的に一様分布と仮定されることが多かったが, 本論文では簡単な図形モデルを用いた解析的な計算や, フラクタル合成画像に基づくシミュレーションなどから実験的な面積占有率密度を求め, 続いてこれらの結果を一般化した面積占有率密度のモデルとして「ベータ分布」の適用を提案する.この確率モデルを筆者らが提案した方法である「ミクセル密度を含む混合密度推定を用いた画像分類法」に応用した結果, 衛星画像の分類実験では提案モデルが画像ヒストグラムに優れた適合を示すことを情報量規準によって確かめた.
著者
赤松 茂 佐々木 努 深町 映夫 末永 康仁
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.7, pp.1363-1373, 1993-07-25
被引用文献数
48

本論文では,濃淡画像のマッチングによる画面顔画像の識別に関して,顔の造作を基準点として切り出された照合パターンを識別に有効な低次元の特徴ベクトルとして表現する方法について考察する.代表的な従来手法として,濃淡パターンのモザイク化と顔パターン集合のKL展開による次元圧縮の二つを取り上げ,各々の問題点を考察した.その結果を踏まえて,照合パターン抽出に不可避な位置ずれ変動に対してよりロバストな識別用特徴を得るために,幾何学的な不変変換の一つであるフーリエスペクトルへの変換の後にKL展開によって次元圧縮を行う方法を提案した.この3種類の特徴の識別における耐性を比較するために,種々の幾何学的変動を与えた照合パターンのテストサンプルに対して最小距離法による識別を行った.また多様な照明条件下で得られる多数の顔画像パターンを,3次元計測した頭部モデルからCGを用いて生成し,それらのパターンから得られる各特徴データのクラス間分離度によって特徴の識別能力を比較評価した.以上の結果から,新たに提案した特徴は従来法と比べて,顔の姿勢や照明条件の変動に対して安定した識別能力をもつことが確かめられた.
著者
上山 英三 湯浅 秀男 細江 繁幸 伊東 正美
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.12, pp.2767-2778, 1998-12-15
被引用文献数
7

ランダムテクスチャを背景とし, その上を背景と異なる動きベクトルをもつランダムテクスチャの領域が移動する動画を作成して再生すると, その領域が背景から浮かび上がって分離されて見える.動きを止めるとその領域は背景と見分けがつかなくなり分離が不可能になる.この現象を動きによる図地分離と呼ぶ.ここで, 移動領域の形を正方形にして, 動画の再生速度を変えて観察すると, 再生速度が十分に速い場合は正方形の領域がはっきりと分離されて見えるが, 再生速度を遅くしていくにつれて正方形の角が丸くなって認識されるようになる.一方, ある種の反応拡張方程式で形成されるパターンを真上から観察すると, そのエッジは方程式の時間発展につれて平滑化によって円形に近づいていく.これが, 上記の人間によって認識される正方形領域の変形を説明するモデルになるのではないかと考える.そこで, 反応拡張方程式を用いて, ランダムテクスチャの動画から図地分離のパターンを形成し, その界面が人間によって認識される輪郭, すなわち主観的輪郭と定性的に合致することを確認し, このモデルの有用性を主張する.
著者
荒川 賢一 エリック クロトコフ
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.12, pp.2564-2577, 1993-12-25
被引用文献数
11

屋外での自律移動を目的としたロボットの経路プランニングなどに適用可能な自然地形のモデリングについて,フラクタル幾何を適用した手法を提案する.具体的には,走査型レーザレンジファインダなどを用いて観測された距離データより変換された不規則に配置される地形の高さデータから,任意解像度の3次元地形情報をその不確定性と共に再構成することを問題としている.本論文では,地形がフラクタル形状であるとの仮定のもとで,その地形モデリングの問題を以下の三つの部分問題とみなしてそれぞれについて解法を提示し,シミュレーションおよび実観測データを用いた実験によりその有効性を示している.(a)フラクタルブラウン関数を仮定したフラクタル次元推定法を用いた地形の粗さの推定.(b)地形の粗さ,すなわちフラクタル性の保存した写実的な地形形状の再構成.これには,事後確率最大化による離散的な高さデータの補間を適用している.(c)モンテカルロ法による再構成した地形地図の不確定性分布の推定.
著者
和田 俊和 浮田 宗伯 松山 隆司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.6, pp.1182-1193, 1998-06-25
被引用文献数
62

視点, 視線方向などのカメラパラメータの制御を行う能動視覚システムでは, 静止3次元シーンを対象にした場合でも, マ カメラパラメータの変更によって観測画像にさまざまな変化が現れる.この変化は, カメラパラメータだけでなくシーンの幾何学的・光学的特性にも依存するため, 能動視覚システムにおいて, テンプレートマッチングや背景差分, フレーム間差分といったシーンの見え方に基づく処理を正確に行うことは困難であると考えられてきた.本論文では, 見え方に基づく処理を正確に行うために, カメラパラメータを変更しても見え方が変化しない能動的画像観測法を提案する.この方法を用いれば, カメラパラメータを変更して撮影した画像を2次元的に変換することにより, 静止シーンの見え方を一定に保つことが可能であり, 固定カメラを用いた場合と同様に, 能動視覚においても見え方に基づく処理を正確に行うことができる.本論文では, 提案手法の原理と, その実現法, および視線制御システムへの応用について述べる.
著者
仲林 清 小池 義昌 丸山 美奈 東平 洋史 福原 美三 中村 行宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.4, pp.906-914, 1997-04-25
被引用文献数
50

インターネット上の情報提供システムWWW (World-Wide Web) を利用した個人適応型CAIシステムCALATについて述べる. CALATはWWWのサーバ/クライアント構成を拡張したシステムであり, サーバ側で個々の学習者毎のCAIプロセスが稼動し, 学習者はWWWクライアントを用いてネットワーク経由で学習を行う. サーバ側にCAIプロセスと個々の学習者の対応関係を保持する学習者識別機構を設け, WWWのステートレスプロトコルを変更せずに, 演習問題の解答内容などに応じて学習の流れを変更する個人適応型学習機能を実現した. また, サーバから転送した制御スクリプトをクライアントで解釈実行する表示制御方式を開発し, (1) 表示応答速度の向上, (2) サーバからの教材画面制御, (3) 対話型シミュレーション教材の利用, などを可能とした. 実装したシステムの評価を行い, 学習者識別機構, データ転送表示機能の有効性を確認した. なお, 本システムはインターネット上で実際に試行運用を行っている.
著者
石井 浩史 望月 研二 岸野 文郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.8, pp.1805-1812, 1993-08-25
参考文献数
12
被引用文献数
57

臨場感通信会議等の仮想環境システムへの応用を目的として,ステレオ画像の解析によって,人物の全身動作画像を仮想空間内に合成する方式について検討した.仮想環境システム等の応用を考えるとき,要求されるのが実時間性であるが,その点で,画像から人体の動きの十分な3次元情報をボトムアップ的に抽出するアプローチは現実的ではない.そこでここでは,実時間で抽出できる限られた情報から,いかに自然な人物動作を仮想空間に再現できるかという観点から,方式の提案・検討を行う.本方式では,ステレオ画像から差分情報と色情報を用いて頭部,顔,手の3次元位置を検討し,それらの位置情報から得られるパラメータの時系列から,連想記憶を用いたマッチングによって,データベースに蓄えた人物動作のモデル動作の時系列を推定する.モデル動作での頭部の移動方向および人体スティックモデルの各関節角度のデータをもとに,画像から得られた特徴点の動きに一致する人物の位置,方向,各関節角度を求め,人物動作の再構成を行う.数種類の動作の時系列によって構成される実画像を用いたシミュレーションにおいて,ほぼ自然な人物動作画像の合成結果が得られた.
著者
伊藤 彰則 好田 正紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.12, pp.2062-2069, 1996-12-25
被引用文献数
18

日本語連続音声認識のための新しい言語モデル作成法について述べる.英語のコーパスは単語ごとに分かち書きされているために,単語単位のN-gramが容易に作成できる.これに対して,日本語のコーパスは漢字かな混じり文で記述されているために,事前に形態素解析を行って形態素単位のN-gramを作成するか,あるいは文字単位のN-gramを使う方法が提案されていた.本論文では,これらの手法に対して「かな・漢字文字列によるN-gram」を提案する.この手法は,学習テキストから統計的に決めた単位でテキストを分割し,そのN-gramを求めるという手法である.この手法を用いれば,事前に形態素解析を行うことなくN-gramを作成することができる.テキスト分割の手法についてさまざまな方法を比較した結果,学習テキスト中の出現頻度によって文字列を選択する方法が最も良い性能を与えた.また,学習テキストと評価テキストを変えた実験を行った結果,いずれの条件でも従来法を超える性能を得ることができた.
著者
王 彩華 坂上 勝彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.8, pp.1885-1894, 1998-08-25
被引用文献数
10

ステレオマッチングの信頼性と精度を向上するために, モーションステレオによって3次元物体形状を獲得する手法を提案する.本手法では, 2枚のステレオ画像のほかに, 物体を少しだけ動かして撮影したもう2枚のステレオの画像(合計4枚)を使う.まず, 4枚の画像から求められるステレオマッチングとオプティカルフローを, 背景が静止で物体が剛体である条件のもとで統合し4枚の画像間の対応を求める.ステレオ情報とモーション情報を同時に使うことによって, 従来のステレオ手法より信頼性の高いマッチングが得られる.更に, 4枚の画像の間の対応をアクティブネットで表し, 各ネットの内部ひずみ, 画像間の適合性, 視差と動きの整合性, 局所剛体性によって定義されているネットのエネルギー汎関数を最小化することによって, 4枚の画像の間の最適マッチングを求める.また, 剛体性のある動き領域(物体)を抽出し, 3次元物体形状を獲得することができる.いくつかの画像での実験結果はこの手法の有効性を示している.
著者
大西 淳児 松井 甲子雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.11, pp.3020-3028, 1997-11-25
被引用文献数
36

画像データの著作権保護のために, 権利者の署名を埋め込む電子透かしの研究が進められている. しかし, 画像データの高能率・高圧縮符号化のもとで署名が消失若しくは削除されない秘匿度の高い方法は少ない. そこで, この論文では, ウェーブレット変換の階層性とスペクトル拡散の高秘匿性を利用した簡便な一方法を提案する. まず, 対象画像を3〜4段の階層にウェーブレット分解し, スペクトル拡散により, 各段の直流成分に周波数領域で署名を埋め込む. この合成データを逆変換すれば, 署名情報を画像領域全体に秘匿拡散することができる. 拡散信号は非常に弱く, 画像信号に対して大きなノイズとならない. 従って, 署名を含んだ画像は見かけ上原画像とほぼ同一である. また, 署名情報は画像に加わるノイズに対しても強いという特徴をもつ. 一方, 拡散符号は暗号の乱数鍵と同様の働きをするため, 署名の改ざん等の攻撃にも強く, マルチメディアにおける画像の著作権保護のための強固な署名を隠し込むことが可能となる.
著者
片山 昭宏 田中 宏一良 押野 隆弘 田村 秀行
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.5, pp.803-811, 1996-05-25
被引用文献数
19

本論文では, 実写画像の立体表示システムにおいて, 観察者の視点移動に伴って, 表示される画像が滑らかに変化する視点追従型立体画像表示方式を提案する. この方式は, 想定できる視点位置の画像をすべて用意し, これを観察者の視点位置に応じて切換表示するという考えに基づいている. しかし, 想定される視点位置すべての画像を得ることは, あらゆる位置にカメラを配置し撮影することとなり困難である. そこで, 本手法ではこの問題を限られた視点位置の実写画像に対して補間・再構成処理し, 任意視点位置の画像を生成することにより解決した. この方式は, 表示デバイスに依存しないので, メガネ式, レンチキュラ式, ホログラフィックステレオグラム式などの多様な3次元画像ディスプレイ方式に適用可能である.
著者
松井 利一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.5, pp.889-898, 1996-05-25
被引用文献数
24 5

視覚系の基本現象(ボケと視野の相互依存作用)に着目して定式化した視覚モデルは, 提示画像の性質や提示条件に依存して変化する視覚系の視知覚応答特性を正確かつ定量的に再現する能力をもっている. しかし, 今の視覚モデルそのままでは画面サイズに依存してコントラスト感度特性が変形する視覚現象の理論的再現は困難であり, 視覚系の他の基本的特性を導入し, より汎用的なモデルに拡張する必要がある. 本論文では, 視覚系の一つの基本的特性として, 空間周波数弁別能力の限界(空間周波数弁別不可能領域の存在)という画面サイズ依存特性とは一見何の関係もなさそうに見える特性に着目し, この特性を視覚モデルに導入すれば画面サイズ依存特性に関しても理論的に再現可能な視覚モデルに拡張でき, 実測結果ともよく一致するようになることを示す. また, シミュレーションから得られた空間周波数弁別不可能領域の理論幅と実測で得られている値とが同程度であることからも, 画面サイズ依存特性が空間周波数弁別能力の限界により生じている可能性が強いと判断できる.
著者
川崎 順治 飯島 泰蔵
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.6, pp.1333-1342, 1997-06-25
被引用文献数
24 4

私たちがものを見るとき, 特に細かい部分に注目しない限り, まず対象全体を大まかにとらえている. 例えば, 1画素ごとには白黒の2値画像を見ても距離をおいて全体を眺めると, もとの鮮明な画像に近い擬似濃淡画像を認識できる経験をしている. 本論文の目的は, このように情報処理が自然に行われ, 画像を強調してより鮮明に見える視覚モデルを構築することである. 我々は今までに, 外界・網膜・脳を通じて階層的に行われる視覚モデルを定式化した. 本論文では外界からの入力画像のパルス密度変調されたディジタル画像が, 方形画像と余弦画像と三角画像の精度の良いアナログ画像に復元できたシミュレーションの結果を示す. 次に, 任意の画像の復元を求めるために, パルス間隔が最も疎となる間隔で等間隔に並べた方形画像の最良近似項Moを用いる等価近似法を提案する. この方法によって良好な復元画像が求まり, 等価近似法の有効性が明らかになった. 以上のことにより, 1次元視覚モデルが構築できたと考えている.
著者
近藤 拓也 山際 貴志 山中 光司 山本 正信
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.1, pp.247-255, 1997-01-25
被引用文献数
27

これまでの動画像の解析では, 連続する画像間の対応付けに始まり, もっぱら対象の運動パラメータや3次元情報といった物理的・幾何学的情報の抽出が中心課題であった. これに対して, 我々は人間の動作について「上手である」とか「美しい」とかの印象を定量的に把握することを目指している. 本論文ではスキーにおける滑りを取り上げ, 滑りの動画像を解析することにより, 滑りの上手さを判定することを試みた. 実際, 動画像から得られた動作の運動パラメータから, 動作の対称性や滑らかさなど動作の特徴を抽出した. これらの特徴を用いて滑りの上手さを判定することができた. この判定結果は, 同じ動作を観察したときの人間の受ける印象と一致している.
著者
杉本 和英 富田 文明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.3, pp.524-533, 1993-03-25
被引用文献数
11 3

ステレオは,テクスチャのある面やシェージングのある曲面を復元することはできるが,多くの人工物がそうであるように,一様な平面で構成された物体に対しては,その境界線を検出できても特徴のない面の内部を直接対応によって復元することはできない問題がある.従って,境界線の復元の後,面を復元する処理が必要となる.しかし,物体の輪郭線と稜線を区別しない単純な面内挿アルゴリズムでは,偽の面を生成してしまう.そこで,本論文では,この面の復元問題を解決するために,ステレオ画像の境界表現の対応から得られる物体の3次元境界線の構造から,一意的に存在可能な面を決定する方法について述べる.本方法は,平面で構成された物体すべてに対して有効であり,面上に模様や影があっても構わない.また,欠損があるために面を一意的に決定できない境界線を局所的に区別することができ,それを補償するように後の観測にゆだねることが可能となる.そして,結果として,物体/環境の幾何モデル(境界表現)が得られる.
著者
呉 海元 陳 謙 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.7, pp.1774-1785, 1997-07-25
被引用文献数
35 8

本論文は, ファジイパターン照合による色彩画像から個数, サイズ, 位置, 姿勢が未知である顔の検出法を提案する. 本手法では, まず色情報をFarnsworthが提案した均等知覚色空間で表現し, 多種多様な環境で撮影された多数の顔画像より, その色空間における肌の色の分布と髪の色の分布を調べて, 肌の色および髪の色を表現できるモデルを構築する. 次にそれらを用いて, 入力画像から肌色らしい領域と髪色らしい領域を抽出し, 前もって用意された5種類の頭部形状モデルの大きさを変化させながら, 我々が提案したファジイパターン照合の手法により, 顔候補を検出する. 実験から, 複雑な背景をもつ室内および屋外シーンの場合でも, 複数の人が存在する場合でも顔が正確に抽出できることが確認でき, 本手法の有効性が示された.