著者
田中 克己 福井 和広
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.9, pp.1464-1472, 2002-09-01
被引用文献数
11

エージェントとユーザ間のインタラクションを活用した視線入力インタフェースを提案し,実タスクに基づく評価を行った.このシステムにおいては,ユーザとのインタラクションの単位として複数の選択対象エージェントを設定する.各エージェントはユーザからの視線入力に基づいて自らに対する注目の度合を,ベイジアンネットワークを用いて確率的に学習する.いったん学習されたエージェントは,システムへの入力から自らへの注目確率を推定し,それに応じたアクションを行う.このアクションがユーザへのフィードバックとなり,ユーザに対し,自らの注視によりエージェントを活性化させることにより選択している感覚をもたせることになる.最終的にはエージェント活性化により,あらかじめ登録されたショートカットコマンドを起動し,ユーザの意図を実行する.今回は各エージェントにWindows上でのイベント登録・実行機能をリンクさせることにより,ユーザがエージェントを選択すると同時にコマンド選択・スクロール・IMEモード切換を実行させる機構を作成し,現行のインタフェースとの定量的.定性的比較を行った.その結果,コマンド選択機能については10%程度の効率向上が,他のタスクについては同等に近い効率を得ることができた.
著者
藤田 昌彦 雨海 明博 皆川 双葉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.11, pp.1897-1905, 1996-11-25
被引用文献数
12

サッカード(Saccade,跳躍性眼球運動)最中の視標の系統的なステップバックによって適応が生じて,数百回の試行でゲインが変化する.本論文では,これまで試みられてきた視覚依存性サッカード以外に,記憶依存性サッカードにおいても適応が生じること,適応によって1種類のサッカードのゲインを変化させても,適応を施さなかった他の種類のサッカードのゲイン変化はわずかであり,同時に逆向きのゲイン変化も可能であるという適応の独立性を報告する.適応過程での修正サッカードは両者共通に,ステップバックした視標に導かれた視覚依存性サッカードであった.このことは修正サッカード中の信号のみで適応が進むという可能性を否定する.サッカードの誤差知覚がさかのほって第1サッカードを生成した信号に干渉を与えて学習が進むという可能性,あるいは,誤動作が記憶され,次回以降の同種同サイズのサッカードに働きかけて,学習が生じる可能性の2通りが考えられる.そこで視標の修正ステップに数百ミリ秒の遅延を与えたときの適応の有無を調べた.これらをもとにして,サッカードならびにバリスティックな随意運動一般における学習様式を考察する.
著者
澤井 秀文 木津 左千夫 遠藤 哲郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.2, pp.450-452, 1998-02-25
被引用文献数
8

遺伝的アルゴリズムにおいて, 初期集団数, 交叉率, 突然変異率などの遺伝的パラメータの設定をする必要がない新しいアルゴリズム(PfGA)を提案し, いくつかの関数最適化ベンチマーク問題に対して単純遺伝的アルゴリズムとの比較から種々の優れた性能を示す.
著者
川村 正樹 岡田 真人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.10, pp.2302-2311, 2001-10-01
被引用文献数
8

系列想起モデルにおける想起過程の厳密解を議論する.連想記憶モデルの想起過程を解析するための理論として, 経路積分法や統計神経力学が提案されている.経路積分法は厳密解を与える理論であるが, 系列想起モデルでは, 定常状態しか議論されていない.我々は想起過程を議論するために, クロストークノイズの時間相関に注目し, 過渡状態を含むすべての場合に適応可能な厳密解を求めた.驚くべきことに, クロストークノイズがガウス分布に従うと仮定した統計神経力学の結果とこの厳密解は一致する.クロストークノイズの正規性を調べるために, クロストークノイズ分布のキュムラントの時間発展を調べた.その結果, パターンを想起することに失敗した場合においても, 3次と4次のキュムラントは0になっており, クロストークノイズが常にガウス分布に従っていることを確認した.また, 理論と計算機シミュレーションより得られる想起過程の結果は一致している.更に, 巨視的な不安定定常状態がセパラトリックスに完全に一致していることがわかった.
著者
今川 和幸 呂 山 猪木 誠二 松尾 英明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.8, pp.1787-1795, 1998-08-25
被引用文献数
22

手話動画像から両手を追跡するシステムにおいて, 手袋やマーカーを用いずに手を追跡する手法について述べる.素手の追跡の場合, 顔や首といった肌色領域の前では, 手が隠れて見えるという問題がある.そこで, 手話の場合, 手に比べ顔や首の動きが少ないことに着目し, 手話動画像から肌色領域(手・顔領域)を抜き出した画像と, その時間差分画像から求められる領域(ブロブ)をもとに, カルマンフィルタを用いて両手の位置を追跡する.更に, 肌色領域を抜き出す際に, 顔の前の手の動きが差分画像として安定的に得られることを目的とした色領域抽出手法を提案する.聴覚障害者の実際の手話動作による動画像に対して本手法を適用し, 肌色領域の前で動作する手の追跡に対して有効性を示し, その限界を明らかにする.
著者
相澤 彰子
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.1, pp.94-104, 1995-01-25
被引用文献数
14

本論文では,確率的スキーマ貧欲法(Stochastic Schemata Exploiter,SSE)と呼ぶ新しい集団型探索アルゴリズムを提案する.SSEは遺伝的アルゴリズム(Genetic Algorithms,GA)と同様に,スキーマと呼ばれる超平面表現の処理により解空間の探索を進めるが,GAと比較して局所的探索処理を重視している点が特徴である.従来,GAに関しては,その適応的な大域的探索能力が長所として強調されてきた.これに対してSSEでは,現実の最適化問題への適用ではGAの大域的探索能力が必ずしも有効な形で反映されないという観点から,GAの大域的探索処理を,集団型探索の特徴を生かしつつ簡単化して,制御パラメータの数が少なく単純な探索法を実現している.論文中では,GAにおけるスキーマ処理を概観した後にスキーマ貧欲と呼ぶ性質を定義し,これに基づきスキーマ貧欲な探索アルゴリズムを構成,簡単なGA容易/困難テスト問題を用いて単純GAと比較・評価を行っている.
著者
渡辺 賢 岩井 儀雄 八木 康史 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.10, pp.2713-2722, 1997-10-25
被引用文献数
21

本論文では, 単眼カメラから手を撮像し, 得られた画像特徴量から指文字を認識するシステムの構築を目的とする. 手のような関節物体は自由度が多く多彩な変形をするため, その形状を認識する際には, 対応付け問題, オクルージョン問題などのさまざまな問題が発生する. そこで, 本研究では撮像の際にカラーグローブを装着することにより, 手の特定領域の検出を正確かつ容易にし, オクルージョンにも対処できる方法を提案する. また, 実画像データをもとに計算機で生成したCAD理想モデルを用いた決定木の学習結果と, 実画像を用いた学習結果の検証についても併せて紹介する.
著者
石淵 耕一 岩崎 圭介 竹村 治雄 岸野 文郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.7, pp.1218-1229, 1996-07-25
被引用文献数
19

本論文では, ユーザインタフェースのための画像処理を用いた実時間手振り推定手法について述べる. まず, 手形状が非剛体であることを考慮し, 画像処理を用いた手振り推定手順を定式化する. 次に, 実時間処理を達成するために, パイプライン方式並列処理を用いた実時間手振り推定手法を提案する. 特に提案手法では, 安定した手振り推定を行うため, 手の大局的特徴を用いて指先の誤検出点を除去する. その後, オクルージョンが手振り推定に与える影響について調べると共に, その解決策を複数カメラの配置問題に帰着させる. 更に, 提案手法を実際に装置化し, この装置を用いたユーザインタフェース環境の構築を通じて, 本手法の有効性を示す. その際, オクルージョン問題や手の姿勢問題が完全に解決されずとも十分なインタフェース環境が構築可能であることも併せて示す.
著者
津田 宏治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.4, pp.592-599, 1999-04-25
被引用文献数
29

部分空間法は, 通常, 特徴量を基底とする多次元数空間(i.e. 特徴空間)に適用される. しかし, 部分空間は任意の線形空間で定義できるので, 数空間だけでなく, 関数空間にも, 部分空間法は適用可能である. 本論文では, 特徴空間の各点を, その点を中心とするガウスカーネル関数に対応づけることにより, 特徴空間を, ヒルベルト関数空間に写像し, そこで, 部分空間法を用いて識別を行うことを提案する. 平仮名認識実験を行った結果, 従来の部分空間法よりも, 高い認識率を得ることができた. この認識率の向上は, ヒルベルト関数空間において, 各クラスの部分空間同士の共通部分の次元数が0になることに起因すると考えられる.
著者
木下 智義 坂井 修一 田中 英彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.4, pp.1073-1081, 2000-04-25
被引用文献数
19

音響信号により外界の事象を理解する聴覚的情景分析に関して, 従来多くの研究がなされてきた.特に対象を音楽に絞った場合, 自動採譜等の実現を目指し, いくつかの研究例がある.その一つとして, 筆者らはこれまでに音楽音響信号を対象とした聴覚的情景分析の処理モデルOPTIMAを提案し, その実験システムを構築した.しかしながら, その認識精度は実用上十分とはいえず, その改善が課題となっている.本論文では, 従来の処理の問題点である周波数成分の重なりに対する脆弱性を改善するための新たな処理を提案する.本手法では, 周波数成分が重なったときの特徴に合わせて特徴量を分類し, それに応じて重なりのある周波数成分の特徴量を適応的に変化させ, 音源同定処理を行う.また, 各特徴量の音源同定の際の手掛りとしての重要度を計算し, 同定処理に導入した.評価実験の結果, 処理精度の向上が認識され, 提案する処理の有効性が明らかになった.
著者
深津 真二 北村 喜文 正城 敏博 岸野 文郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.9, pp.1905-1915, 2000-09-25
被引用文献数
10

広大かつ複雑な仮想環境内において, 利用者に自己位置や方向, 仮想環境全体の構造などを正確に認識させるためには, 仮想環境内の任意の位置から仮想環境を大局的に眺めた鳥瞰(かん)画像を利用者の視点から見た等身大画像とともに提示することが有効である.本研究では, 利用者の通常の視点(利用者視点)に加え, この仮想環境を大局的にとらえるための視点(鳥瞰カメラ視点)を自らの身体運動に関連づけて直感的に制御する手法として, 座標系対連動法を提案する.これは, 利用者視点と鳥瞰カメラ視点の動きを連動させる手法であり, 利用者の空間構造を理解しようとする行動に合致した直感的な方法により, 鳥瞰カメラ視点を制御することを可能とする.そして, 座標系対の連動を用いた仮想環境内ナビゲーションシステムを実装し, 鳥瞰カメラ視点の制御手法として従来手法を用いたシステムを比較対象に評価実験を行い, 提案手法の操作性と制御の直感性を評価する.
著者
西村 雅史 伊東 伸泰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.11, pp.2473-2480, 2000-11-25
被引用文献数
26

ディクテーションシステムが実用となった今, 大語彙音声認識の研究対象は, 「読み上げ(read speech)」から自然で自由な発話(spontaneous speech)」へと移行しつつある.このような自由発話については過去に対話音声コーパスを利用して様々な観点からその性質が調べられてきた.しかし, 特に日本語に関してはそのデータ量が統計的手法に基づく大規模な音声認識システムを構築するには不十分であったこともあり, 自由発話の書き起こしを目的とするような大語彙音声認識システムの性能についてはあまり報告されていない.我々は自由発話の認識精度改善を目的として, 放送大学の講義音声を題材とした自由発話コーパスの整備を進めてきた.ここではこのコーパスの概要と, それを用いて作成した自由発話の大語彙音声認識システムの認識性能について報告する.実験の結果, 従来の読み上げを対象とするシステムでは51.5%であった講義音声の単語誤り率が, 16.4%にまで改善された.
著者
加藤 敏洋 平田 富夫 斉藤 豊文 吉瀬 謙二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.12, pp.1750-1757, 1995-12-25
被引用文献数
11

本論文では,サイズがN×Nの2値画像のユークリッド距離変換をO(N^2)時間で実行するアルゴリズムを与える.距離変換とは,入力として与えられた2値画像の各画素についてそこから最も近い0画素への距離を求める処理で,ディジタル画像処理における基本的な処理である.このアルゴリズムは,4近傍距離や8近傍距離などユークリッド距離以外の他の距離についてもアルゴリズム中の距離関数を置き換えるだけで距離変換が実行でき,その意味で一般的な距離変換アルゴリズムとなっている.また,p(1≦p≦N)台のプロセッサを用意すればO(N^2/p)時間の並列アルゴリズムが得られ,これまでの並列アルゴリズムより効率が良い.
著者
小林 稔 志和 新一 北川 愛子 市川 忠嗣 一之瀬 進
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.5, pp.933-943, 1998-05-25
被引用文献数
21

映像や音声を統合することで, サイバースペースはより豊かなコミュニケーションが可能な空間になってきている.これまでのサイバースペースの移動インタフェースには, 手による操作や視線方向を利用したものが多かった.しかしコミュニケーションにおいて豊かな表現力をもつ手や視線を, 移動のためのインタフェースに利用するのは適当ではない.本論文は, HMDを用いたサイバースペースでの使用を前提に, 足による移動インタフェースを提案する.本論文のインタフェースでは, ユーザは円盤に乗り, 進みたい方向に体重を移動することでサイバースペース内を自由に移動できる.本論文では, まずサイバースペース内を移動するためのインタフェース技術を整理し, それをもとに新しいインタフェースの設計を明らかにする.最後に本インタフェースを使用したユーザの移動軌跡と使用感に関する報告をまとめ, 本インタフェースの効果を整理すると同時に, 身体の向きを変えるときの足の踏み換え動作によるノイズなど特有の課題を示す.
著者
小松 邦紀 瀬崎 薫 安田 靖彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.3, pp.429-436, 1995-03-25
被引用文献数
51

従来の濃淡静止画像の可逆的なサブバンド符号化に用いられる1次元フィルタバンクにおいては,高域信号が,予測のために両側の画素のうち片側の画素しか用いられていない外挿予測誤差信号,あるいは両側の画素が用いられてはいてもレベル数が入力信号の4倍である内挿予測誤差信号であった.そこで,本論文では,高域信号のエントロピーを小さくして圧縮効率を高くするために,レベル数が入力信号の2倍である内挿予測誤差信号を高域信号とする1次元フィルタバンクを用いる可逆的なサブバンド符号化を提案する.更に,予測を上下左右の4画素により行う非可分型方式の設計も行う.複数の実画像を用いた圧縮効率の比較では,提案方式は従来の可逆的なサブバンド符号化よりエントロピーが0.1〜0.5bits/pel小さいこと,提案方式のうちのいくつかは可逆的な予測符号化より圧縮効率が高いこと,可分型の提案方式は非可分型の提案方式より圧縮効率の高い場合が多いことが示される.また,可分型の提案方式を用いた縮小画像の品質の評価では,低域フィルタのタップ数を大きくすることにより折返しひずみが抑制されることが示される.
著者
松岡 達雄 大附 克年 森 岳至 古井 貞煕 白井 克彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.12, pp.2125-2131, 1996-12-25
被引用文献数
39

近年,大語い連続音声認識の研究がアメリカ英語,イギリス英語,フランス語,ドイツ語,イタリア語などを対象に新聞記事を用いて盛んに行われている.しかしながら,日本語を対象とした,これに類する研究については報告がない.これは,主に,日本語が単語間にスペースなどのデリミタをおくことなく書かれるため,大語い連続音声認識において重要な役割を果たす単語N-gramなどの言語モデルの導入が容易でないためと考えられる.我々は,日本語新聞記事を対象として大語い連続音声認識の研究を進めている.単語N-gramを言語モデルとして用いるため,テキストを形態素解析することにより形態素(単語)にセグメンテーションした.形態素を単語と定義し,約5年分の新聞記事を用いて単語N-gram言語モデルを推定した.認識システムを評価するため,音声データベースを設計し,54名の話者の各100文ずつの音声データを収録した.この音声データベースの最初の10名の音声を用いて大語い連続音声認識の実験を行った.7 kの語いサイズに対して,no-grammar言語モデル,音素文脈独立音響モデルを用いた場合には単語誤り率が82.8%であった.単語bigram言語モデルと音素文脈依存音響モデルを用いることにより単語誤り率が20.0%に改善された.
著者
安藤 剛寿 関谷 好之 上原 貴夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.10, pp.2366-2375, 1998-10-25
被引用文献数
11

上級者と対等に勝負ができるコンピュータブリッジを開発するには, 不完全情報ゲームに特有なさまざまな課題を解決する必要がある.我々は, これに挑戦することにより新しい問題解決手法の研究を進めている.ブリッジにおけるオークションの過程では, 限られたビッドを通してパートナと情報を交換しつつ, 互いに協力して良いコントラクトに到達する努力がなされる.本論文では, 従来のプログラムより人間的(柔軟)なビッドができることを目指して立案した枠組みについて報告する.まず, ビッドにおけるパートナシップを共通の知識と仮説推論機構をもつ二つのエージェント間のコミュニケーションとしてモデル化した.その知識は専門知識と常識に分け, 前者から外れた相手のビッドに対しても, 後者を用いて対応できるようにした.また, パートナのハンドを推論する際には, パートナがこちらのハンドについてどのようなイメージをもっているかも推論し, より妥当な仮説の生成に努めた.その結果, 相手に応じた柔軟なビッドをするプログラムをつくることができた.
著者
越智 洋司 川崎 桂司 矢野 米雄 林 敏浩
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.12, pp.3210-3219, 1997-12-25
被引用文献数
1

本論文では, 外国人の擬態語・擬音語学習を支援する辞書システム JAMIOS (Japanese Mimesis and Onomatopoeia Dictionary System) について述べる. 日本人は擬態語や擬音語を頻繁に用いる. しかしこれらは, 日本語独特の表現であり感覚的な語のため, 日本語を学習する外国人にとり理解が困難である. そこで, 我々は状況・発音・意味・使い方・感覚などに着目し, 擬態語・擬音語知識を表現した. JAMIOSは, (1)使用する状況をマルチメディア情報により提示し, その状況や発音形態を変化させることで関連語の検索できる, (2)擬態語・擬音語の特徴に沿ったさまざまな知識や関連語を検索できるなどの特徴をもつ.
著者
阿部 正博 酒匂 裕 佐川 浩彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.9, pp.2023-2030, 1993-09-25
被引用文献数
17

手話は音声に基づく自然言語とは異なる独自の表現形式をもつボディランゲージである.本論文では,手話通訳者の機能代行を目指す手話通訳システムにおいて,手話が認識された後の手話単語列を自然な文章に変換する言語処理方式について提案する.本手法は,意味主導型の格フレーム照合により手話単語列の意味構造を解析し,ルールベースの手法を用いて,省略されている格助詞や助動詞等を補充し,日本語として自然な表現に変換することを特徴とする.本方式をインプリメントし,手話入門テキストの123の手話例文を用いて実験を行った結果,76%の文に対して期待された正しい変換結果が得られた.また,データグロブ入力による実際の手話認識データを用いて変換実験を行った結果,手話の認識結果にはあいまいさが多く,非文を含めて多くの単語列候補が得られること,従って,正しい単語列候補の変換精度向上と並んで,誤った候補をリジェクトする機能が非常に重要であることがわかった.そのためには,今後,単語間の意味的関係だけでなく,表情や空間表現などの末使用情報の利用や,文脈処理が必要となる.
著者
内田 誠一 迫江 博昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.6, pp.1251-1258, 1998-06-25
被引用文献数
35

2画像間の最大一致を実現する画素間のマッピングとして定義される2次元ワープは, パターンに生じる変形に適応可能なテンプレートマッチング法とみなすことができる.本論文では新しい2次元ワープ法の枠組みを提案し, 基礎的な考察を行う.本手法の第一の特徴は, 2次元的な自由度をもちながら, パターンの位相を保存するワープを構成できることである.この性質はワープに対する単調性および連続性制約により実現される.第2の特徴は, 画像全体での最適性が保証されるように構成された動的計画法(DP)を, 最大一致の探索法として用いる点である.DPの利用により, 評価関数に対する微分可能性の制約がないなどの特長も生じる.実験により, 提案した手法の基本的特性を確認した.