著者
清木 康 金子 昌史 北川 高嗣
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.4, pp.509-519, 1996-04-25
被引用文献数
100

画像データを対象としたデータベースシステムにおいては, 検索者の印象や画像の内容による検索を実現する方法が重要である. 我々は, 文脈あるいは状況に応じて動的に変化するデータ間の意味的な関係を計算するモデルである意味の数学モデルを提案している. 本論文では, 意味の数学モデルを用いた意味的画像探索方式を提案し, また, その学習機構を示す. 本方式では, メタデータ空間と呼ぶ正規直交空間を形成し, その空間上に画像データ群, および, 検索に用いるキーワード群を配置する. そして, その空間上での距離計算により, 検索者の印象, および, 画像の内容の指定に応じた画像探索を実現する. 検索対象の各画像は, 画像の特徴(印象あるいは内容)を表す言葉(単語群)によって表現されることを前提とする. 本方式は, 検索者が発行する検索語, および, 画像データの特徴を表現する単語間の相関関係の分析により, 画像を検索する方式として位置づけられる. 本方式では, 検索者が指定する印象あるいは画像の内容を文脈として言葉により与えると, その文脈に対応する画像をメタデータ空間より動的に抽出する. 本学習機構では, その文脈から得られた画像が, 本来, 抽出されるべき画像と異なる場合, 抽出されるべき画像を指定することにより, 文脈を構成している言葉についての学習を行う. 本学習機構を適用することにより, 画像の印象表現における個人差に対応することが可能となる.
著者
近藤 和弘 チャールズ ヘンプヒル
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.2, pp.257-267, 1998-02-25
参考文献数
16
被引用文献数
13

不特定話者連続音性認識を用いて, 音声でWorld Wide Web(WWW)ブラウザが制御可能なシステムを試作した.このシステムでは現在ブラウズしているページ中のアンカー名を読むことにより, そのリンク先のページに進むことができる.また, 音声を用いて, ブラウザを制御することも可能である.新しいWWWページに移行するたびにブラウズ中のページからアンカー名を抽出し, これを音素列に変換し, 文法を作成し, 音声認識システムに与えて語いをダイナミックに切り換える.このとき, 日付, 年齢などの例外的な読み方に対応する必要がある.簡単な音素列変換テストの結果, 最も正答に近い候補中に97%の正しい音素列が含まれていることが確認された.更に, 日本語ページには英文アンカー名も多く含まれるため, 限定語いの英語も認識できるようにした.簡単なユーザテストの結果, 91.5%のタスク達成率を得た.エラーの原因は音声認識精度によるものよりむしろユーザの誤読, 音声検出ミスなどの方が多いことがわかった.不慣れなために起こるユーザ誤操作を除いたタスク達成率は94.1%である.
著者
坂口 嘉之 美濃 導彦 池田 克夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.3, pp.483-491, 1995-03-25
参考文献数
20
被引用文献数
14

衣服の数値計算において,動的に変形する衣服と人体との衝突を,摩擦と跳ね返りの影響をも含んだ制約条件とみなした制約充足型アプローチによる衝突の影響の計算方法とその応用について述べる.衣服の変形過程は,衣服の自己衝突と人体形状に影響されるため,衣服形状を計算するには,これらとの衝突を計算する必要がある.また,衣服を着た人間の動きを表現する場合には,衣服の動きと人体の動きの両方を考慮した衝突計算を行わなければならなず,複雑で時間のかかる処理となる.しかし,人体の動きと衣服の動きの相対速度が十分小さい場合には,衣服から人体への衝突だけに注目すればよく,計算速度を向上させることができる.計算実験として,実際の婦人用ワンピースの型紙と,実測の布特性を用いて,距離画像から作成した人体モデルに着せつけた.その結果,布が人体表面を滑らかにすべるような状況が計算でき,計算結果は実物の形状に近いものになった.
著者
若林 哲史 鶴岡 信治 木村 文隆 三宅 康二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.1, pp.73-80, 1997-01-25
参考文献数
19
被引用文献数
6

正準判別分析は分散比 (F比) を最大化する最も代表的な特徴選択手法であるが, クラス数以上の特徴が選択できないため,少クラスの分類問題に対する有効性に限界がある. この問題を解決するために, 新しい特徴選択手法 (FKL法) を提案し, 手書き数字認識実験によりその有効性を評価する. FKL法は, F比を最大化する正準判別分析と, 次元減少による平均2乗誤差を最小化する主成分分析 (K-L展開) を特殊な場合として含む, より一般的な特徴選択手法である. 正準判別分析, 主成分分析, 正規直交判別ベクトル法 (ODV法) などとの比較実験の結果, 少クラスの分類問題ではFKL法により選択された特徴量の識別力が最も高いことを示す.
著者
新田 克己 長谷川 修 秋葉 友良 神嶌 敏弘 栗田 多喜夫 速水 悟 伊藤 克亘 石塚 満 土肥 浩 奥村 学
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.8, pp.2081-2087, 1997-08-25
被引用文献数
17

論争支援マルチモーダル実験システムMrBengoは, 法廷における論争をシミュレートする知識ペースシステムに, 顔認識, 表情合成, 音声認識, 音声合成, WWWブラウザなどのモジュールを結合したマルチモーダル実験システムである. このシステムは, 原告(検察官), 被告側弁護士, 裁判官という仮想的な三つのエージェントからなっている. ユーザは被告側弁護士に音声で指示を出して, 検察官と法廷論争を行い, 論争が終了すると裁判官が判決を下す. 論争の状況に応じて, エージェントの表情が変化するので, ユーザはそれを見ながら論争の戦略をたてることができる.
著者
庄野 逸 福島 邦彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.5, pp.940-950, 1994-05-25
被引用文献数
6

手書き英字筆記体連結文字列認識を行うシステムの一つとして選択的注意機構を用いたシステムが今川らによって提唱された.しかしながら今川らのシステムは,それほど高い認識能力をもっていたわけではなく,認識する文字カテゴリーも5文字と比較的小規模なシステムであった.本研究では今川らの認識システムを拡張し,更に高い認識能力をもつシステムを作成した.我々は"選択的注意のモデル"の一部分がパターン認識システム"ネオコグニトロン"に類似していることに着目した.ネオコグニトロンにおいて,折れ点検出回路を導入すると認識能力の向上が認められることが報告されているので,我々は今川らのシステムに折れ点処理回路を導入したシステムを作成した.更に本システムに対して種々のテストパターンを与え,コンピュータシミュレーションを行い,筆記体連結文字列の認識に対して有効であることを確認した.
著者
中川 聖一 山本 誠治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.12, pp.2139-2145, 1996-12-25
被引用文献数
9

本論文では,対話方法と被験者の違いによる振舞いや主観の違いの検討を行うために,"Wizard of Oz法"でインプリメントしたシステムを用いて評価実験を行った."Wizard of Oz法"とは,システムに精通した人(ウィザード)がシステムの代わりに処理を行うことによって,あたかもシステムが存在しているかのように見せかける実験方法である.評価実験で用いたタスクは,"富士五湖周辺の宿泊施設案内"で,対話方法としてはシステム主導型とユーザ主導型の二つを用意した.また,被験者として情報工学系の学生と工学系でない一般の女性を選び,合計16人で実験を行った.評価実験で得られた対話データをもとにユーザの平均発話数,1発話当りのユーザのシステム占有時間,聞き直し,間投詞,言い直し,単語カバー率について詳しく検討した.その結果,ユーザの平均発話数はシステム主導型の方が多くなるが,ユーザのシステム占有時間はユーザ主導型の方が長くなることわかった.また,間投詞,言い直しはユーザ主導型の方が多く出現することわかった.更に,システム主導による入力の方がユーザ主導に比べて使用される単語にかなりの制限が加えられることが確認できた.
著者
崎山 朝子 大平 栄二 佐川 浩彦 大木 優 池田 尚司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.2, pp.182-190, 1996-02-25
被引用文献数
60

本論文では, リアルタイムで3次元コンピュータグラフィックスの手話アニメーションを合成する方法と, その評価について述べる. 聴覚障害者に, より多くの情報を, 状況に合った手話表現で迅速に伝えられるようにするためには, 変更が簡単なコンピュータグラフィックスで手話が表示できる必要がある. 本研究では, 自然な手動作を実現するために, 人間の手動作を計測したデータを用いて手話アニメーションを合成した. また, 3次元空間の手の位置関係を正確に伝えるために, 遠近表現を誇張する方法を開発した. 更に, 作成した手話アニメーションと日常で用いられている実写画像の自然さとわかりやすさをSD法を用いて評価し, 両者を比較した. この結果, (1)手動作のみの手話で, 手話アニメーションで約8割, 実写画像で約9割が正確に伝わること, (2)手話アニメーションの手動作の自然さは, 実写画像に近いこと, (3)手話アニメーションで手の位置関係を正確に伝えるためには, 遠近の誇張だけではなく, 実写画像に近い手の陰影表現も必要であることがわかった.
著者
竹林 洋一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1417-1428, 1994-08-25
被引用文献数
84

ユーザ中心の音声自由対話システムTOSBURG II(Task-Oriented dialogue System Based onspeech Understanding and Response Generation)についてメディア技術とマルチモーダルインタフェースの観点から論じる.筆者らは,「ユーザに対して何ら制約を設けない」というコンセプトのもとで,雑音免疫ワードスポッティング,キーワードに基づく自由発話理解,ユーザ主導型対話制御,マルチモーダル応答生成,音声応答キャンセル等の要素技術を開発し,それらを統合して不特定ユーザ向きの実時間音声対話システムを開発した.また,実システム上に構築した音声対話データ収集・評価システムは,実音声データと,キーワード検出,音声理解,対話処理等の対話システムの中間処理結果とを記録でき,システム性能評価のほかに音声対話コーパスの構築やヒューマンファクタの評価改良に活用できる.不特定ユーザによる実システムの試用と評価実験の結果,ユーザからの割込み機能,マルチモーダル応答,キーワードに基づく自由発話理解が対話の自然性とロバスト性の向上に有効であることを確認した.
著者
村瀬 洋 シュリー ナイヤー
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.11, pp.2179-2187, 1994-11-25
参考文献数
18
被引用文献数
148

2次元画像から3次元物体を識別し,その物体の向きを検出する技術は,工業部品の分類など実用的な価値は高い.従来の代表的な手法としては,画像からエッジや表面形状などの3次元構造に着目する方法があるが,この枠組みでは3次元構造の抽出自体が困難であり,任意形状の物体に対して高い精度は得られていない.本論文では,2次元照合により3次元物体を認識する手法について述べる.2次元照合による手法は,3次元特徴の抽出が不要である等の特長はあるが,見る方向や光源の位置により複雑に変化する2次元画像をあらかじめ学習しておくことが記憶容量,計算量の点で困難であると考えられ,従来試みられていなかった.本手法では画像符号化を基本としたパラメトリック固有空間法の提案により,少ない記憶容量で3次元物体を2次元画像の集合体として学習することができるようになった.その結果,2次元画像例から物体を容易に学習すること,および困難な特徴抽出なしで3次元物体の認識とポーズ推定をすることが可能となった.本論文では,手法の提案と共に他の2次元照合的な手法との比較実験結果についても述べる.
著者
西村 拓一 向井 理朗 野崎 俊輔 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.6, pp.1563-1570, 1997-06-25
参考文献数
12
被引用文献数
60

我々は, 動作者にデータグロープ等の接触型センサやマーカーを装着させることなく, 人間の身振り手振りをとらえた動画像からのジェスチャ認識を試みている. ここでは, 時間差分画像から特徴を抽出しているが, 衣服・背景の変化や動作の軌跡変動に影響されやすいという問題点があった. そこで, 本論文では, 時間差分画像の2値化により変化領域を求めることで前者の問題に対処し, 更に低解像度の画像特徴を用いることで後者の問題を解決できることを示す. また, 複数人物を同時にとらえるために適したカメラを用いて, 低解像度の人物のジェスチャでも本手法によりロバストに認識可能であることを実証する.
著者
廣瀬 通孝 小木 哲朗 石綿 昌平 山田 俊郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.5, pp.888-896, 1998-05-25
参考文献数
7
被引用文献数
130

本論文では, 5面のスクリーンを有する多面型全天周ディスプレイCABINの設計, 試作ならびにその特性評価について述べる.このシステムの特徴としては, 利用者の体重を支えることができるように下面スクリーンに強化ガラスを用いていること, CG映像と実写映像の両方を投影できること等を挙げることができる.5面スクリーンを使用することによって, 映像を見渡す際の視野角を大きくとることができ, 更に画面から飛び出して見える3次元物体をいろいろな方向から見回す際の視点の移動可能領域が格段に大きくなることが期待できる.試作システムについてその領域の大きさを定量的に解析した結果, 5面のスクリーンの必要とされる領域が非常に大きいこと, スクリーン枚数の増加による視野角の増大が顕著なことなどが明らかになった.また, 生成された仮想空間の精度についても評価を行ったところ, 中央付近から全体を見渡すような場合には, かなり実空間に近い視空間が生成できていることを実験的に検証することができた.
著者
李 晃伸 河原 達也 堂下 修司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.1, pp.1-9, 1999-01-25
被引用文献数
80

大語彙連続音声認識のための効率の良い段階的 (2パス) 探索手法を提案する. 中間表現として従来広く用いられているN-best表現の一種である単語グラフ形式は, 単語単位で決定的に区分化するためにコンテクストに依存したマッチング長の変動を表現できず, 直前単語ごとに仮説を多重化する単語対近似に伴う処理量の増大が著しい. これに対して単語トレリスインデックスという形式を提案する. 仮説を多重化せずに, 第1パスのトレリスでビーム内に残った単語終端ノードのゆう度と対応する始端をすべて保存することで, 単語境界の存在範囲のあいまい性を保持する. 第2パスではこれを逆引きすることで探索空間の絞込みを行い, またヒューリスティックスコアとして用いることで, 大語彙においても高精度かつ効率の良い探索を実現する. 5000語の毎日新聞記事読上げタスクで評価を行った結果, 単語グラフ形式に比べて高精度であることが確かめられた. 更に仮説を多重化しない1-best近似を用いることで, メモリ効率を10倍以上改善しながら従来手法とほぼ同等の認識精度が得られた. 単語間音素環境依存性を考慮した最終的な単語認識精度は91.4%を達成した.
著者
ズデネク プロハースカ 伊藤 崇之 岡本 敏雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.6, pp.1150-1159, 1998-06-25
被引用文献数
17

表情認識において最も根本的な問題は, 顔画像から個人差にできるだけ左右されない表現の特徴を安定かつ自動的に抽出することである.本論文では, 表情認識のための特徴として, 顔表面上の特定領域内の動きに着目し, その自動的な抽出手法を提案する.また, 本手法で抽出される特徴の性質を示すと共に, その特徴を用いることにより自動化を考慮していない従来の手法とほぼ同等な認識率が達成されることを示す.分析の結果として「喜」, 「哀」, 「驚」, 「恐怖」, 「怒」の五つの表現パターンは「喜」, 「驚」と「哀」, 「恐怖」と「怒」の三つの分離容易なグループを形成することが明らかになった.
著者
山澤 一誠 八木 康史 谷内田 正彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.5, pp.698-707, 1996-05-25
被引用文献数
200

ロボットをナビゲーションするには, ロボットの周囲の環境がどのような状況にあるかをセンサ情報から知る必要がある. 本論文では, 双曲面ミラーを用いた全方位視覚系(HyperOmni Vision)を提案し, その特徴と, HyperOmni Visionを用いた視覚誘導方法について述べる. 従来の全方位視覚系では, 光学系の特性が中心射影でなかったため独自の視覚情報の獲得方法が必要だった. しかし双曲面ミラーを用いた全方位視覚系は, 全方位の視野をもち, かつ中心射影の光学的特性ももつため, 一般のカメラで直接とった画像などに変換できる. そのため処理に応じた画像に変換でき, 独自の手法だけでなく従来の画像処理技術も利用できる利点がある. ここではHyperOmni Visionの構成, 特徴と光学系の特性, またHyperOmni Visionを用いた移動ロボットシステムとそのロボットのテンプレートマッチングによる移動量推定, 障害物検出について報告する.
著者
松井 甲子雄 大西 淳児 中村 康弘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.6, pp.1017-1024, 1996-06-25
被引用文献数
41

この論文では, 画像を多重解像度表現する直交ウェーブレット変換において, ひそかに署名データを画像に埋め込む一方法を提案する. その原理は, 画像の多重解像度表現における差分出力に偏りがあることに注目し, その特徴を手掛りに署名ビット系列を画像に埋め込むものである. その際, 256×256画素からなる濃淡画像でおおむね6Kバイト程度の文字情報を合成可能である. この方法は画像の著作権を表示する署名データのみならず, 画像の作者や使用条件, あるいは画像そのものの属性情報までも包含でき, 画像データベースの検索などにおいても類似画像の識別を容易にできるなどの応用が考えられる.
著者
土居 元紀 陳 謙 眞溪 歩 大城 理 佐藤 宏介 千原 國宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.8, pp.2203-2208, 1997-08-25
被引用文献数
37

会社やマンションなど, 不審人物の侵入を防ぎたい管理施設の入口において, より信頼性が高く利用しやすいセキュリティシステムが望まれている. そこで, 顔画像照合の結果により入口の解錠を決定する解錠制御システムを試作した. 実用的な解錠制御システム開発の観点から顔画像照合を検討し, 顔画像照合手法を, 入力画像からの顔領域の抽出, 顔領域の大きさ・傾き正規化と顔部品照合で構成した. 信頼性の高い照合実現のため, 目頭検出による精度の高い顔領域の大きさ・傾きの正規化を用いた. また, 目・鼻・口といった特徴的な顔部品を照合対象とすることにより, 眼鏡や髪型などの偽証しやすい部分を照合領域から排除している. 顔部品照合において本人のものか否かを決定するしきい値は統計的に決定した. 実際にシステムの性能について評価した結果, 本人の入室許可が92.2%, 他人の入室拒否が99.6%という照合成功率を得た.
著者
長坂 晃朗 宮武 孝文
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.8, pp.1831-1837, 1998-08-25
被引用文献数
32

本論文では, 過去に入力された映像と同一の映像の入力をリアルタイムで検出してクラスタリングするシーン分類手法を提案する.これは, 連続して入力される映像について, その特徴を時系列圧縮して記憶し続けると同時に, それまでに入力された映像系列の中から, 最新の入力映像と一致する無制限の長さの部分映像区間をすべて見つけ出す.本手法を一般的なパソコンに実装し, 放送中のコマーシャル映像を分類する実験を行ったところ, 特徴量を1秒当り平均20バイト以下の容量で記憶しながら, 漏れなく一意に分類できることを確認した.また, 過去8時間分の映像を記憶した状態でも1フレーム入力当りの処理時間は平均10ms以下であり, 数日分の映像に対して実時間で分類ができる見通しを得た.
著者
長尾 智晴 安居院 猛 長橋 宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.3, pp.557-565, 1993-03-25
被引用文献数
60

本論文では,任意の点列としてあらかじめ与えられたモデル図形に相似な図形を,ノイズを多く含む2値画像から抽出する手法について述べている.原画像中の相似図形の位置,拡大倍率,回転角度はすべて未知とする.この抽出処理は,モデル図形を原画像中の図形に重ねたときに,最もよく重なるときのモデル図形の重心のx,y座標,拡大倍率,回転角度を求める処理であり,これら四つのパラメータによる空間において,図形の重なりを評価値にしたときの最大値探索問題とみなすことができる.そこで本論文では,最適値探索手法として知られている遺伝的アルゴリズムの考え方を用いた遺伝的手法を提案している.本手法では,特に,探索空間に対する前処理,および親の個体の適応度に応じた遺伝規則の調整を考慮したアルゴリズムを提案している.そして,本手法がこのようなパターンマッチングの問題に有効に適用できることを,実験結果を用いて示している.
著者
瀧 剛志 長谷川 純一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.8, pp.1802-1811, 1998-08-25
参考文献数
13
被引用文献数
38

本論文では, チームスポーツにおける集団行動を映像に基づいて定量的に評価するための基本的な特徴量について検討する.ここで提案する特徴量は, 集団動きの中で各個人がつくる一種の勢力範囲である.本論文では, これをボロノイ領域の一つの拡張として定式化し, 人間の近似的な運動モデルを用いた具体的な計算方法を示す.この勢力範囲を実際にサッカーゲームにおける種々の行動評価に応用し, チームワークをボールの受け渡しスペースを維持するための動きであると限定的にとらえれば, その定量化が可能であることを実験的に示す.