著者
大澤 幸生 ベンソン ネルス E 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-I, 情報・システム, I-コンピュータ (ISSN:09151915)
巻号頁・発行日
vol.82, no.2, pp.391-400, 1999-02-25
被引用文献数
108

文書検索において, 検索対象となる各文書からキーワードを抽出しておくことは, 検索時間の短縮と検索結果の質の向上の両面において重要である. 本論文では, 文書の主張の内容を表すキーワードの抽出を目指す. そのようなキーワードは文書の要約をしたり, ユーザの検索語に近い主張をもつ文書を検索したりするのに役立つであろう. このような目的にとっては, ユーザの興味に関連する既存分野を代表する文献を選ぶ場合とは違い, 検索対象文書の著者独特の考えを把握する新たな技術が必要となる. そこで本論文では, 文書は著者独自の考えを主張するために書かれており, その考えを表すために内容が構成されるという仮定に基づき, 共起グラフの分割・統合操作によってキーワードを抽出する新しい手法KeyGraphを提案し評価する.
著者
山澤 一誠 八木 康史 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.5, pp.698-707, 1996-05-25
被引用文献数
200

ロボットをナビゲーションするには, ロボットの周囲の環境がどのような状況にあるかをセンサ情報から知る必要がある. 本論文では, 双曲面ミラーを用いた全方位視覚系(HyperOmni Vision)を提案し, その特徴と, HyperOmni Visionを用いた視覚誘導方法について述べる. 従来の全方位視覚系では, 光学系の特性が中心射影でなかったため独自の視覚情報の獲得方法が必要だった. しかし双曲面ミラーを用いた全方位視覚系は, 全方位の視野をもち, かつ中心射影の光学的特性ももつため, 一般のカメラで直接とった画像などに変換できる. そのため処理に応じた画像に変換でき, 独自の手法だけでなく従来の画像処理技術も利用できる利点がある. ここではHyperOmni Visionの構成, 特徴と光学系の特性, またHyperOmni Visionを用いた移動ロボットシステムとそのロボットのテンプレートマッチングによる移動量推定, 障害物検出について報告する.
著者
大澤幸生 NelsEricBenson 谷内田 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.1996, no.88, pp.57-64, 1996-09-12
被引用文献数
1

学術論文のキーワード,特に,既存のどの分野に属するかではなく,著者が新しく主張したい内容を捕えたキーワードの抽出を行うための手法を提案する.本手法のポイントは,論文を意味の構造物と見なし,もしなければ論文が支離滅裂になってしまう,いわば柱に当たる単語を見つけることである.ある単語が,文書中の単語間の共起関係を描いたグラフを繋ぎ止める役割を果たし,文書全体を一つの流れとするような力の強さをその単語の文書全体にとっての重要度とみなし,重要度の高い一定個数の単語を求める.この手法を英語論文に対して適用し,その性能を評価する.The goal of this paper is to catch the newly invented concept in a technical paper. Such content can not be always featured by index terms which appear frequently in the text, because terms on which the author of a document assign strong importance do not always appear many times. Also, the main idea in a technical paper does not appear at a fixed position in the text which is structured as chaters or sections. In order to extract keywords which might appear less frequently but are more important for the author, we use KeyGraph, a graph representing the co-occurence among terms in the text. Keywords, or index terms are detedted as such that connect the overall KeyGraph of the overall document. We show some experimental results which show the performance of KeyGraph.
著者
平山 高嗣 岩井 儀雄 谷内田 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.44, no.6, pp.1625-1634, 2003-06-15
被引用文献数
5

顔画像を利用したヒューマンインタフェースを構成する場合,システムがユーザに拘束条件を与えないことが理想の形態となる.顔はその姿勢や表情により,その見え方が様々に変化するため,この変化にロバストな認識技術が必要になる.本研究では,入力画像中の顔領域と照合に用いるモデルの大きさが異なる場合でも,顔認識が可能となる照合手法を提案する.これはフレキシブル特徴照合法を拡張した手法で,照合に用いる特徴量が顔の大きさの変化に対して正規化されるため,顔認識の精度を保つことができる.特徴量の正規化には,顔の大きさの確率的な推定手法と効率的な処理を行うために改良したガボールウェーブレット変換を用いる.我々は提案手法に基づいた個人識別システムを構築し,個人識別実験によりその有効性を検証した.Facial recognition technology needs to be robust for arbitrary facial appearances because a face changes according to facial expressions and facial poses. In this paper, we propose a method which automatically performs face recognition for variously scaled facial images. The method performs flexible feature matching using features normalized for facial scale. For normalization, the facial scale is probabilistically estimated and is used as a scale factor of an improved Gabor wavelet transformation. We implement a face recognition system based on the proposed method and demonstrate the advantages of the system through facial recognition experiments.
著者
渡辺 孝弘 李 七雨 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.6, pp.1571-1580, 1997-06-25
被引用文献数
43

本論文では, インタラクティブシステム構築に適した動画像からの実時間ジェスチャ認識手法について述べる. 本手法は, ジェスチャを行う特定部位の部分画像を低次元のジェスチャ空間内で表現することによって, 大量の動画像情報を効率的に処理するものである. まず, 画像中からジェスチャを行う特定部位がMaskable Template Model (MTM) を用いて実時間でロバストに抽出される. MTMとはさまざまに変形する物体との柔軟なマッチングが行えるように, 従来のテンプレートマッチングの手法を我々が改良したものである. 次に, その抽出された部位画像系列をジェスチャ空間に投影して入力ジェスチャ曲線として表現し, この曲線とモデルジェスチャ曲線を比較することによってジェスチャを認識する. ここでのジェスチャ空間は, モデルジェスチャの部位画像系列をKL展開することによってあらかじめ構成しておく. 我々は, 本手法を利用して実時間インタラクティブシステムー仮想指揮システムを実現した. 本システムは, ユーザが行う指揮者のジェスチャを認識して, 計算機が奏でる音楽を実時間で制御するもので, 本手法の有効性を示すものである.
著者
岩井 儀雄 八木 康史 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-2, 情報・システム 2-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.1, pp.44-55, 1997-01-25
参考文献数
16
被引用文献数
58

単眼動画像からの構造・運動推定問題は剛体で単純な形状であれば可能であるが, 関節物体などは解析的に問題を解くのが困難で形状モデルを用いた方法がよく研究されている.特に, 関節物体の一つである手の運動推定は, 手話理解や人工現実感のような応用が期待できる. 手の動作を認識する研究の中で, 手話理解のようなカのフィードバックを必要としないインタフェースでは, 手に何もつけない状態の方が有効である. 本研究では非接触で手の3次元運動と位置を復元する方法を提案する. 非接触の入力装置としては単眼のカメラを用いて, 手形状モデルを生成し, 時系列画像から手の特徴抽出および対応付けを行う. 対応付けの結果より得られた特徴点の軌跡から手の3次元運動を求め, その後, 獲得した手形状モデルを用いてモデルマッチングの手法で指の位置を推定する.
著者
砂山 渡 井山 晃洋 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理 (ISSN:09151915)
巻号頁・発行日
vol.87, no.12, pp.1089-1097, 2004-12-01
被引用文献数
4

検索エンジンにおいて検索結果として表示される情報は,目的の情報を素早く獲得する上で重要なものである.特に,検索結果の各Webページの要約文は,各Webページの内容を知る上で重要であるとともに,ユーザが入力した検索語が各Webページ内でどのように使われているか,すなわち検索語と各Webページとのかかわりを知るために有効である.しかし,従来の検索エンジンにおける検索結果の要約文は,Webページの冒頭部分のテキストが抜き出されて検索語が含まれていなかったり,検索語を含んでいても文の途中で切れていて文として不完全で,文脈やWebページの内容を把握できないという問題点がある.そのため文を単位とした要約の出力が望まれるが,HTMLテキストにおいては,句点を含まない,文以外の記述が数多く含まれているため,そのまま文を単位とした重要文抽出システムによって要約文を提供することは困難である.そこで本論文では,各Webページのソースを文に相当する意味の切れ目において分割するHTMLテキスト分割システムを提案する.また,本システムにより生成されるテキストが,Webページの要約生成に有効に働くことを実験により検証した.
著者
大澤幸生 須川 敦史 谷内田 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告知能と複雑系(ICS) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.45, pp.7-12, 1998-05-27
被引用文献数
5

コンピュータ上で作業を行なっている時に,以前に使用あるいは参照したファイルの数々を再度使用,参照する必要は頻繁に発生する.しかし,ファイルの名前が分からなかったり,複雑な構造のディレクトリに保存されていたりすると,多数のファイルをいちいち開いて中身を確認するという面倒な作業を課せられてしまう.本研究では,ファイル整理を自動的に行なうシステムの実現を目的とする.その手法として,過去に使用・参照した各ファイルの用いられた履歴をユーザの行動に関する文章のように見立て,文章における単語の関係・重要さを自動表示する手法KeyGraphを(単語⇔ファイル)という対応からそのまま転用してファイルの関係・重要さを二次元ディスプレイに表示する.It is a frequent and daily desire to search files previously used by the same user. If one cannot find the wanted file easily, one may use file-searchers or may open some directories. However, it is troublesome if the file name is forgotten or if the file is hidden in some deep directory in a complex srtuctrure. This paper aims at visualizing important files for the current user. Here we employ KeyGraph, a indexing and visualizing tool of document contents. That is, here the history of a user is regarded as something like a document, and files are something like words. The presented system shows graphically which files and clusters of files are important for the moment, for the current user, by exactly the same manner as KeyGraph.
著者
相良 直樹 砂山 渡 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.104, no.418, pp.7-12, 2004-10-30

情報化社会の発展に伴い,文書の電子化や大量管理,共有が可能となった.これにより,人が処理しなければならない情報量も増加している.現在,この問題に対処すべくテキスト要約において主題抽出の研究は盛んに行われているが,ストーリー抽出に関しては人手に頼らざるを得ないのが現状である.本研究においては,従来の重要文抽出を利用したテキストからのストーリー抽出手法を提案し,この有効性について考察する.
著者
相良 直樹 砂山 渡 谷内田 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.108, pp.159-164, 2004-11-06

情報化社会の発展に伴い,文書の電子化や大量管理,共有が可能となった.これにより,人が処理しなければならない情報量も増加している.現在,この問題に対処すべくテキスト要約において主題抽出の研究は盛んに行われているが,ストーリー抽出に関しては人手に頼らざるを得ないのが現状である.本研究においては,従来の重要文抽出を利用したテキストからのストーリー抽出手法を提案し,この有効性について考察する.Development of information society caused computerizing of documents, and made a lot of managements and share of documents possible. It caused the increase in the amount of information which people have to process. Currently although research of extracting subjects is active in text summarization to deal with this problem, story extraction cannot be performed without manpower. In this paper, we propose a method of story extraction from text using key sentences, then discuss the proposing method.
著者
山口 智浩 野村 勇治 田中 康祐 谷内田 正彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能 (ISSN:21882266)
巻号頁・発行日
vol.12, no.6, pp.870-880, 1997-11-01 (Released:2020-09-29)

The advantage of emergence is that various solutions are emerged. However, it takes large computation cost to emerge them since it requires the numbers of iterations of simulation. So we try to reduces the computation cost without losing variety of solutions by introducing the abstraction technique in Artificial Intelligence. This paper presents Isomorphism Based Reinforcement Learning by Isomorphism of Actions that reduces the learning cost without losing variety of solutions. Isomorphism is one of the concepts in Enumerative Combinatorics of mathematics. First we explain Isomorphism of Actions, then explain Isomorphism of Behaviors. Isomorphic behaviors those perform the same task can be obtained by transforming the learning result of the task by "the appropriate permutation". However, a priori knowledge that represents "the appropriate permutation" is not always given, so this paper uses the generate & test method that first generates the isomorphic learning results by transforming the learning result of reinforcement learning for a task by the combinatorial permutations, then tests to select two kinds of the behaviors performing the following tasks ; (1) isomorphic behaviors those perform the same task ; (2) discovery of the behaviors those are converged to the new task state. Since the acquired learning results are isomorphic each other, the merits of our method are those the time cost for generating various learning results is small and also the space cost is small too because it needs only the original learning result and the set of permutations for it. For these reasons, this method is significant for realizing the learning various behaviors for the dynamic environment or multiagent.
著者
砂山 渡 大澤 幸生 谷内田 正彦 Wataru Sunayama Yukio Ohsawa Masahiko Yachida 大阪大学大学院基礎工学研究科システム人間系専攻 筑波大学大学院経営システム科学専攻 大阪大学大学院基礎工学研究科システム人間系専攻 Dept.of Systems and Human Science Graduate School of Engineering Science Osaka University. Graduate School of Systems Management University of Tsukuba. Dept.of Systems and Human Science Graduate School of Engineering Science Osaka University.
雑誌
人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence (ISSN:09128085)
巻号頁・発行日
vol.15, no.6, pp.1117-1124, 2000-11-01

In recent years, Web pages have become the most available resource of information. However, it is hard to express a user interest by words, so people are hard to access those information by using search engines. In this paper, we suggest a system which supplies keywords used in real Web pages. This system aims at making up a lack of user's knowledge and filling the gap between user's knowledge and real information. Along with these, a two-dimensional search interface is supplied to a user. In this interface, keywords are classified by a user interest and are arranged with expressing the relation between a user interest and Web pages cleary. As a result, a user can make his/her own interest concrete and can get disirable pages quickly.
著者
奥村 仁 八木 康史 谷内田 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.36, no.10, pp.2263-2276, 1995-10-15
参考文献数
17
被引用文献数
5

人は道路などを歩く時、環境中のすべてのものに詳細な注意を払うのではなく、環境に対する自已位置推定や障害物の発見など歩行のために必要な情報を環境全体から大まかに把握する(大局視と呼ぶ)。一方、興昧ある物体(作業対象、障害物、道しるべ、近づいてくる物体等)に対しては、人は興味部分を注視し、その部分についての詳細な情報を収集する(局所視と呼ぶ)。人と同様に自律移動ロボットにおいても、目的地までの安全な誘導および目的地での作業など作業内容により、必要とされる観測情報の性質は異なる。本報告では、ロボットにとって必要とされる大局視と局所視との機能を持つ複合視覚センサMISS(Mu1tip1e Image Sensing System)を提案し、試作したプロトタイプの構成について報告する。さらに注視対象の発見からその物体の3次元情報獲得までの一連の処理を両視覚機能の情報を統合することで行う一方法について報告する。大局視では周囲360度を一度に観察できる全方位視覚センサを用い、得られる全方位画像とあらかじめ与えられた周囲環境のモデルとの照合を行い、注視すべき物体(作業対象、障害物等)を発見する。一方、局所視ではその物体を注視しながらいくつかの位置から観測し、注視物体の3次元形状を認識する。
著者
吉村 浩典 岩井 儀雄 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.90, no.8, pp.1987-1997, 2007-08-01
被引用文献数
11

本論文では,屋外環境において照明変動に対してロバストかつ物体の影を除去した移動物体検出手法を提案する.この手法は明るさ可変背景モデルを用いて背景成分をカルマンフィルタにより連続して推定,更新を行うことで実現する.また移動物体の検出には,明るさ可変背景モデルを用いて色情報により識別を行う.更にMSC(Margined Sign Correlation:マージン付き符号相関)を利用して空間情報による識別も同時に行う.これにより更なる移動物体の検出精度の向上を図る.このシステムを実際に屋外において撮影された動画像に適用することで,カルマンフィルタによる背景成分の推定の様子を示し,移動物体の検出精度の評価とその考察を行う.
著者
柳生 智彦 八木 康史 谷内田 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI)
巻号頁・発行日
vol.1994, no.23, pp.1-7, 1994-03-10
被引用文献数
2

情報処理の対象は、数値情報から文字情報、さらに感性情報へと次第に人間的なものへと拡大してきた。感性情報は、デザインや芸術といった人間の高度な機能を支援したり、人とマシンとのインターフェイスを円滑にするための重要な情報である。そのため、コンピュータが感性情報を処理し理解できることは有意義なことである。本報告では、視覚情報から受ける暑そう、寒そうと言った温度印象(以下、画像温度印象度と呼ぶ)と周囲の温度変化との関係を解明し、画像温度印象度をモデル化することで人と同じような感性を計算機上で実現することを試みた。Described here are the results of analyzing and modeling visual impressions of human being. Generally, visual impressions of human being vary according to conditions of environment; the weather, the season, the time and so on. For instance, red and blue images are usually felt warm and cool, respectively. However, blue image is felt not so cold in the warm room. Therefore, for estimating themodel, we have to observe temporal changes of visual impressions. In this paper, we analyze and model the visual impressions of human being with temperature change. Parameters of model such as the temperature of a room and the differential of the temperature are estimated by a regression analysis method.
著者
呉 海元 陳 謙 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.7, pp.1774-1785, 1997-07-25
被引用文献数
35 8

本論文は, ファジイパターン照合による色彩画像から個数, サイズ, 位置, 姿勢が未知である顔の検出法を提案する. 本手法では, まず色情報をFarnsworthが提案した均等知覚色空間で表現し, 多種多様な環境で撮影された多数の顔画像より, その色空間における肌の色の分布と髪の色の分布を調べて, 肌の色および髪の色を表現できるモデルを構築する. 次にそれらを用いて, 入力画像から肌色らしい領域と髪色らしい領域を抽出し, 前もって用意された5種類の頭部形状モデルの大きさを変化させながら, 我々が提案したファジイパターン照合の手法により, 顔候補を検出する. 実験から, 複雑な背景をもつ室内および屋外シーンの場合でも, 複数の人が存在する場合でも顔が正確に抽出できることが確認でき, 本手法の有効性が示された.
著者
谷内田 正彦 石黒 浩 八木 康史
出版者
大阪大学
雑誌
一般研究(B)
巻号頁・発行日
1994

平成6年度には双曲面鏡をテレビカメラの前に設置した新たな全方位視覚センサの試作,全方位視覚センサからの情報を用いた環境の大局モデルの作成,大局モデルを用いた移動経路の計画と更新について研究を行った.平成7年度には以下の研究を行った.[1]注視物体の発見:局所視で注視すべき物体を発見する方式の研究を行った。注視物体としては、(1)作業対象となる物体、(2)目的地に移動するときの経路の目印(道しるべ)となるもの、(3)通行を妨げる障害物(狭い通路)、(4)不審物、(5)衝突の危険のある移動体(人など)である。それぞれを発見する専門家モジュールを作成した。これらの専門家モジュールが常に大局モデルを監視し、候補が見つかれば局所視を起動して検証するという方式をとった。[2]局所視による注視物体の詳細な立体形状の認識:発見された注視物体の候補を局所視で注視しながら移動し、その詳細な立体形状を認識する研究を行った。注視すべき物体の3次元位置と形状は大局視により概略分かっているので、物体がカメラの中心にくるようにカメラを回転し、画面いっぱいに写るようにズ-ムを制御し、また鮮明な画像が得られるように焦点調節する。いくつかの視点から対象が観測されるので、三角測量の原理から対象の3次元形状を求めた。[3]統合視覚システムの試作と実環境での評価:大局視、局所視を一体化した視覚システムを作成した。また、大学の廊下や実験室などの実験境下で実験を行ない、良好な結果を得た。
著者
八木 康史 森島 繁生 金子 正秀 原島 博 谷内田 正彦 原 文雄 橋本 周司
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.26, pp.65-72, 1998-03-19
被引用文献数
4

顔画像処理に対する様々な分野での関心の高まりや、工学分野における顔画像処理技術の研究成果の蓄積を背景にして、顔画像処理に関する共通ソフトウェアのツールの作成に向けた活動が進められている。この活動は、「感性擬人化エージェントのための顔情報処理システムの開発」(略称、アドバンストエージェントプロジェクト)と呼ばれ、情報処理振興技術協会(IPA)における独創的情報技術育成事業に関わる開発テーマの一つとして、平成7年度より3年間の計画で精力的に活動を行ってきた。擬人化エージェント技術はさまざまな技術要素から構成されているが、本プロジェクトでは、この中で特に『顔』の役割に着目し、顔画像の認識・合成に関わる顔情報処理システムの開発に主眼をおいた。これと同時に、本システムでは工学のみならず心理学や医学などの分野も含めた顔関連分野における共通の実験用ツールを広く提供することも目標としている。本稿では、平成10年3月で終了するこのプロジェクトの概要と、共通ソフトウェアの紹介を行う。The aim of Advanced Agent Project, supported by Information Technology Promotion Agency (IPA), is to develop the image processing environment for analysis and synthesis of human facial images. This report is mainly concerned with an introduction of an overview of the project and the developed environment for the facial image processing.
著者
内海 ゆづ子 岩井 儀雄 谷内田 正彦
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.19, no.5, pp.476-487, 2007-10-15 (Released:2008-01-25)
参考文献数
20
被引用文献数
1 1

顔認識の特徴量としては,様々なものが利用されているが,その代表的なものとしてGaborウェーブレット特徴量がある.Gaborウェーブレット特徴量は,出力特性が生物の視覚特性と似ており,Eigenface等,他の顔認識手法と比較して良好な性能を示している.しかし,顔認識の特徴量として,Gaborウェーブレット特徴量が最適であるか明らかではない.そこで,本研究では,Gaborウェーブレット以外の様々なウェーブレット(Haar, French hat, Mexican hat, Daubechies, Coiflet, Symlet, O-spline)を用いて特徴抽出を行い,どのウェーブレット特徴量が顔認識に最適であるかを調べた.ウェーブレットのスケールを固定したもの,スケールを可変にしたものの認識率を AR Face Databaseを用いて比較を行った.さらに,スケール可変ウェーブレットを8方向に回転させ特徴抽出を行い,認識を行った.その結果,スケール可変ウェーブレットで8方向から特徴抽出を行った場合,全てのテスト画像において Haarウェーブレットが Gaborウェーブレットより高い認識率を示すことが明らかになった.
著者
畠 直志 岩井 儀雄 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.9, pp.1983-1992, 1998-09-25
参考文献数
25
被引用文献数
28

本研究では, 接触型センサやマーカなどを装着することなく, また背景や人物が異なった場合などの環境の変化にもよらない人物のジェスチャを認識するロバストなシステムを提案する.本手法は, カメラから得られる動画像において人物の動き情報に注目し, 画像上の各点の動き(オプティカルフロー)を抽出する.そして, 得られた動き情報をKL展開(Karhunen-Loeve Expansion)することでジェスチャ空間を作成する.入力された動き情報は, そのジェスチャ空間に投影して次元圧縮し, 1次元のシンボルに変換する.得られたシンボル系列を解析する方法としてHMM(隠れマルコフモデル)を用いる.シンボルの時系列をHMMで学習させ, 各HMM内でのゆう度を計算し, 最大となるHMMのモデルを選択することで認識を行う.このシステムを評価するために, 楽器を演奏するジェスチャをサンプル画像として用い, 異なる環境のもとで学習者以外の人物によるジェスチャ認識の実験や, 主成分数を変えたときの認識率の実験を行った.