著者
柳原 圭雄 濱 裕光
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.11, pp.1977-1979, 1996-11-25
参考文献数
3

PET画像による脳賦活部位抽出法を提案し,抽出の確からしさを検討した.均一濃度ファントム画像を用いて補正式を作成し画素ごとの濃度ばらつきを補正するものである.リーブワンアウト(leave-one-out)法により信頼性のある抽出ができることを確認した.
著者
大和 淳司 大谷 淳 石井 健一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.12, pp.2556-2563, 1993-12-25
被引用文献数
59

本論文では,画像によるモニタリングの自動化を目的として,動画像中の人物像の行動を認識する方法を提案している.実画像に対してもロバストな認識系を構築するために,幾何学的なモデルに基づくモデルフィッティングによらず,特徴量ベースのボトムアップな学習によるアプローチをとる.このために隠れマルコフモデル(HMM)を適用した時系列パターン認識を行った.HMMは音声認識で広く応用されているが,動画像への適用はほとんど例がない.本手法では,画像中の人物領域のメッシュ特徴をベクトル量子化によりシンボルに変換し,このシンボル列をHMMで学習,認識する.これにより,教師付き学習による,所与の動作カテゴリーの認識が実現できる.テニスの動作を列に,複数の被験者の動作認識実験を行い,90%以上の認識率を得た.また,不特定多数の人物動作認識を目的として,学習に用いなかった被験者を認識対象とした場合についても検討を行った.この場合,認識率の低下が起こるが,学習に用いる被験者数を増やすことにより認識率が向上することを確認した.
著者
谷川 昌司 福島 邦彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.10, pp.2215-2222, 1993-10-25
被引用文献数
8

ネオコグニトロンはパターン認識能力をもった階層型の神経回路モデルである.ネオコグニトロンの中間層にはさまざまな種類の部分特徴を抽出する細胞(特徴抽出細胞)が存在している.特徴抽出細胞は可変入力結合をもっており,特徴抽出細胞の結合荷重は抽出する特徴の種類ごとに異なる.この結合荷重は,教師なし学習法によって決められ,ある標準的なパターンが刺激として与えられたときに,細胞が最大出力を出すように調節される.この標準的なパターンからどの程度変形した特徴までを同じ特徴であるとみなすかの度合(特徴選択性)は,特徴抽出細胞のしきい値によって調節することができる.本論文では,ネオコグニトロンの中間層において,特徴選択性を定めるしきい値が認識率にどのような影響を与えるかを調べる.そして,従来のネオコグニトロンでは学習段階のしきい値と認識段階のしきい値を同一にしていたが,認識段階のしきい値を学習段階のしきい値よりも小さく設定することによって,認識率を大きく向上できることを明らかにする.
著者
長谷川 修 坂上 勝彦 速水 悟
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.10, pp.1666-1674, 1999-10-25
被引用文献数
9

本研究では,システムのモニタ上に人の上半身の姿を有する3次元コンピュータグラフィックス像(人間型ソフトウェアロボット:以下ロボット)を表示し,これに視覚や聴覚を用いた対話機能や,表情や視線,指さしジェスチャの細やかな制御機能を与え,実空間を対象とした人と計算機の円滑なインタラクションを図る.試作したロボットは,あらかじめ登録(学習)した実空間中(オフィス内)の人物や物体を視覚的に探索・捕そくし,それらの発見位置/時刻を履歴として管理するとともに,その3次元的な位置を発話と視線/指さしジェスチャで人間に示すことができる.またこのロボットは,新たな対象物の登録を対話的に行えるほか,その人物の名前や物体の名称/所有者なども併せて登録でき,こうした機能を活用して室内の状況に関して人間(ユーザ)と簡単な対話を行う(タスクをこなす)ことが可能である.
著者
上田 博唯 宮武 孝文 吉澤 聡
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J75-D2, no.2, pp.216-225, 1992-02-25

映像を中心とするマルチメディアの自由な編集・作成という,ユーザの創造的活動を支援する環境を実現するための新しいアプローチを提案し,プロトタイプの試作結果について報告する.このアプローチの特徴は音声や画像の処理・認識技術を応用して,映像情報の時間・空間構造を一貫性のある形で視覚化して,それをダイレクトマニピュレーションできるようにすることにある.これによりユーザは対話的に映像素材を編集できる.プロトタイプでは,まず自動カット分割機能とカットの内容解析機能の一部を開発した.そしてこれらの機能によりアイコン化されたカットを用いた映像の構造の視覚化を実現し,その上でカット・アイコンのダイレクトマニピュレーションによる時間軸編集を実現した.また,画像中の対象物の抽出についても実験的な機能を組み込み,そのユーザにとってのメリットについて検討した.これらの結果により,本アプローチの有用性と妥当性が示された.
著者
助川 寛 佐藤 俊雄 岡崎 彰夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.6, pp.1053-1060, 2001-06-01
被引用文献数
6

本論文では, 目を閉じた状態を避けて人物の顔を撮影する画像処理システムについて報告する.目つぶりを排除する処理は, 分離度フィルタによる目の候補点の検出と, 辞書とのマッチングによるパターンの分類を中心に構成され, 更に動きの特徴を解析することで目の開閉状態を判断する.合図後の1秒に相当する5画面のうち開眼状態を検出すればその画像を出力し, すべての画面で開眼状態を検出できなければ合図直後が画面を出力する顔撮影システムを試作した.740名に対して性能を評価した結果, 目を開けた状態で撮影する撮影成功率は99.8%以上を達成することができた.
著者
菊池 英明 工藤 育男 小林 哲則 白井 克彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1502-1511, 1994-08-25
被引用文献数
19

音声を利用したマルチモーダルインタフェースのベースシステムとなる音声対話インタフェースにおいて,ユーザに発話のタイミングに関する自由を保証するための割込みの扱いについて検討した.ユーザに割込みを許すとき,従来のように1文を単位としてシステムの発話を計画するのでは,計画した発話内容と実際に発話した内容あるいはユーザが受け取った内容の間に差異が生じる.そこで,発話の計画の単位を,1文中の伝えるべき情報と定め,対話中に話者間でやりとりされる発話権を管理することにより,どの情報が受聴されたかを常に把握する方式を提案した.実験の結果,提案した方式によって,システムが計画した発話とユーザが受聴した発話の差異をなくしながら,スムーズな割込みへの対処が被験者の半数以上に認められた.また,割込みに対処することにより,ユーザのタスク完了までの所用時間は7%減少し,積極的な話題提起数が21%増えるなど,インタフェースの利便性が向上することが確認された.
著者
上田 修功 中野 良平
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.9, pp.2512-2521, 1997-09-25
参考文献数
17
被引用文献数
30

最近, 汎化能力向上のための新たなアプローチとして, 同一タスクに対して複数の予測器を個別に学習した後, それらの出力の平均値(一般には重み付き平均)を予測値とするアンサンブル学習法が提案され実験的にその有効性が示されている. しかしながら, これまでアンサンブル予測器の汎化誤差に関する厳密な議論は十分になされていない. 本論文では, 回帰問題に焦点をあて, 一般のアンサンブル予測器の汎化誤差改善効果に関する数理的考察を行う. すなわち, 同一タスクに対して個別に学習させた任意の非線形予測器のアンサンブルによる汎化誤差を, 各予測器の推定値のバイアス, 分散, 予測器間の出力の共分散, 学習データのノイズの分散を用いて表し, 各々が汎化誤差に及ぼす影響を明らかにする. 次いで, 実用上興味深いケース(各予測器が同一モデルからなる等)について考察し, 計算機シミュレーションにより解析結果の検証を行う. 解析結果をもとに, 一つのデータセットのみが与えられているという実用上自然な状況下では, データセットを分割する方法では予測の精度向上は期待できないことを明らかにし, その場合の有効なアンサンブル学習法について言及する.
著者
山崎 恭 小松 尚久
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.8, pp.1335-1346, 1996-08-25
被引用文献数
22 7

個人の身体的特徴・特性の一つとしてオンラインで取得された筆跡情報に着目し, より信頼性の高い筆者認識手法の確立に必要となる新たな個人性の抽出手法を提案する. 従来の筆者認識研究では, 個人の特徴を反映するパラメータ (特徴パラメータ) が, 個人の特徴の現れやすい部分から抽出されたものであるか否かということは, 必ずしも問題とされていない場合が多い. これに対して筆者らの提案する個人性の抽出手法では, 複数のグループ (カテゴリー) に特徴パラメータを分類し, 個人の特徴の現れ方に応じて特徴パラメータに重み付けを施すことで, 従来よりも筆跡情報に現れる個人性をより明確化することが可能となる. また, 提案手法では, 字種への依存度を可変とする特徴パラメータを使用しており, 筆者照合方式へ適用した場合, テキストを固定する従来の署名照合方式に対し, 登録時と照合時に異なる字種を用いることの可能な, 字種選択の自由度が高い照合方式を構築することができる. 本論文では, 筆跡情報からの個人性の抽出手法を提案すると共に, 実際の筆記データを用いたシミュレーション実験により, 提案手法の信頼性を評価した結果について報告する.
著者
松浦 大祐 山内 仁 高橋 浩光
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.6, pp.1075-1083, 2002-06-01
被引用文献数
44

現在,高度道路交通システム(Intelligent Transport Systems:ITS)及びその1構成システムであるAHS(Advanced cruise-assist Highway Systems)についての研究が盛んである.このAHSを構成する一つとして,道路カラー画像から道路標識を抽出・認識し運転者に注意を喚起するシステムが考えられている.本論文では,実用的な処理時間で円形道路標識を抽出可能な新しい手法を提案する.提案手法は,入力となる道路カラー画像から道路標識に使用されている色(特定色)を判別した後,その分布状況によって抽出処理の対象領域を限定することにより,処理時間の大幅な削減を図っている.更に,抽出領域に占める特定色の面積比率を利用することにより,抽出精度の向上と更なる処理時間の短縮を図っている.53枚の道路カラー画像を用いた評価実験の結果,94.7%の高抽出率を達成するとともに,平均処理時間が約2.18秒とほぼ実用的な処理時間を達成できることが示された.
著者
船橋 淳一郎 松尾 啓志 岩田 彰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.5, pp.1113-1121, 1997-05-25
被引用文献数
5

3次元形状に対して多重解像度表現を行い, 適応的なマッチングを適用して物体の識別を行う手法を提案する. MEGIはEGIを拡張し, 任意形状の表現を可能にしたモデルである. しかし曲面を含む形状では適当な分解能を選択しなければ満足な表現を得ることは難しい. そこでMEGIを利用して, 形状の多重解像度表現を行う. ここで提案する多重解像度表現は基本要素の単調減少性を有し, 異なる解像度に属す要素の間で対応が一意に決まり, 最低解像度を根とする木で表される. 照合とこの木を根から葉方向へたどることによる類似部分の高解像度化を繰り返し, 最終的に形状全体の類似性を判定する. 最後に, 本手法の有効性を計算機シミュレーションを通じて明らかにする.
著者
東海林 健二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.9, pp.1753-1760, 1994-09-25
被引用文献数
10

2値画像の回転や拡大縮小といったアフィン変換のアルゴリズムとして,2値画像をランの形式で表現し,斜交軸変換と転置を組み合わせて行う方法が知られている.この従来手法は,ラン形式を用いるため,斜交軸変換は簡単なアルゴリズムで高速に実行可能であるが,転置のアルゴリズムは複雑で比較的多くの実行時間を要していた.本論文では,ランで表現された画像の転置,すなわち縦と横を入れ替える操作を効率良く行う手法およびこの転置手法を用いた画像の回転,拡大,縮小を含むアフィン変換の方法を提案する.本手法で採用したランデータの表現方法は,pxy表と呼ばれる形式で,一次元配列に黒ラン,白ランの開始座標を交互に格納するという単純な方法である.実験により従来手法と提案手法の時間コストの比較を行った結果,従来手法でのアフィン変換は,ラン当りの実行時間が黒ラン長に従い増加するが,一方,提案手法では.ラン当りの実行時間はラン長によらず一定であった.すなわち,提案手法を用いると,2値画像のアフィン変換が,およそラン数にだけ比例する時間で行えることがわかった.
著者
田中 勝
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.2, pp.161-173, 2002-02-01
被引用文献数
3

本論文では,非加法的エントロピーであるTsallisエントロピーの平衡分布に2次までのq-モーメントの存在を要求したときに得られる確率分布について考察する.この確率分布は一つのパラメータqと平均と分散を指定することにより特定の確率分布を表すようになる.例えば,q=1のときは通常の正規分布を表し,q=2のときはCauchy分布を表す.ただし,q=2のCauchy分布の場合は2次のモーメントは存在しないので,形式的に確率分布関数の中に現れるパラメータσ^2は単にスケールファクタと解釈する.特にq=1+2/(n+1)のときは`t-分布'が得られるが,この場合も2次モーメントが存在しない場合には,確率密度関数の中に現れるパラメータσ^2をスケールファクタとして解釈する.また,q=-∞の場合には標準偏差の2倍(2σ)の幅をもつ一様分布が得られる.すなわち,ここで考察する確率密度関数は,サポートがコンパクトな一様分布からサポートが非コンパクトな正規分布を経て,`t-分布'やCauchy分布を経由して非コンパクトなサポートをもつ一様分布(完全に平たんな分布)までを,パラメータqを通じて滑らかに結ぶことのできる確率密度関数である.ここでは,この確率密度関数をq-正規分布と呼ぶ.q-正規分布と,従来知られている正規分布を含む確率分布族との最も重要な違いは,通常の正規分布を含む確率分布族では,正規分布のみが情報量すなわちBoltzmann-Shannonエントロピーを最大化するものとして明確なエントロピーとの関係が付けられるのに対して,q-正規分布では,パラメータqにより決定されるすべての確率分布は,必ずそのqの値に応じたエントロピー(Tsallisエントロピー)をただ一つもっており,その対応するエントロピーを最大化するという例外のない明確な情報量との関係をもつことである.このようなq-正規分布による期待値には,通常の期待値のほかに,エスコート分布による期待値の2通りの期待値が考えられる.それぞれについてモーメントを得るための一般的な公式も与える.また,q-正規分布はqについて滑らかなので,正規分布の周りで展開することができる.つまり,他の確率密度関数を正規分布を用いて近似することができる.このことについても併せて考察する.更に,q-正規分布p_q(χ:μ,σ)は,エスコート分布を介して,他のq-正規分布p_<1/(2-q)>(χ:μ,√<(3-q)/(5-3q)σ>)と双対な関係をもつことも示す.
著者
太田 寛志 佐治 斉 中谷 広正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.7, pp.1129-1139, 1999-07-25
被引用文献数
32

顔面筋に基づく顔構成要素モデルを用いた表情の認識手法を提案し, 表情の時間的変化の認識について述べる. 顔モデルは, 眉・目・口それぞれの顔構成要素の可変モデルからなる. 各モデルは数個の制御点と顔面筋の収縮方向のベクトルで構成される. 制御点の移動方向は顔面筋が収縮する方向と一致しているため, モデルの変形は実際の顔構成要素と同じ変形規則をもつ, 顔動画像にモデルをマッチングさせることで, 顔構成要素の動きの追跡ができ, 顔面筋の収縮度が求められる. 得られた収縮度を要素とする表情パターンと, あらかじめ決定されている表情標準パターンとを比較することで各表情の表出度が得られる. 表情表出度は, 顔に表れている表情のめいりょうさを示しており, 値の大小から表情を識別する. また, 表情表出度の時間的変移から表情の発生・持続・終了を検出できる.
著者
松田 晃一 上野 比呂至 三宅 貴浩
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.10, pp.1675-1683, 1999-10-25
被引用文献数
36

最近のコンピュータ技術とネットワーク技術の進歩により,サイバースペースを実現するための基盤が整ってきた.このような環境の中,3Dのマルチユーザ仮想空間の実用化研究がなされ,参加したユーザが同じ仮想空間内で同じ体験を共有できるメディアとして実現されてきた.今後の重要なステップとしては,このメディアを仮想社会にまで昇華させることである.我々は,これまで開発してきたCommunityPlaceシステム上に,パーソナルエージェント指向の仮想社会PAW(Personal Agent World)を構築し,数百人の同時アクセス,数千人の延べアクセスを目標とした大規模仮想社会の実験を行ってきた.PAWは,アバタとテキストなどによるコミュニケーションという従来の仮想空間のもつ機能に加え,ユーザと一緒に行動する犬型のパーソナルエージェント,社会的・環境的なインフラストラクチャをもつ仮想社会である.本論文では,PAWのインターネット上での公開実験に関して,その設計方針,ユーザプロファイル,特性,コミュニティについてその結果を報告し,今後の課題について考察する.
著者
三輪 多恵子 田所 嘉昭 斎藤 努
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.9, pp.1965-1974, 1998-09-25
被引用文献数
51

近年の自動採譜の研究は, 異種複数楽器により演奏された混合音和音に対するピッチ推定および各楽器音の分離同定を目的とした研究へ, その対象が拡張される傾向にある.ここで, ピッチの推定には入力楽器音の周波数の分析が必要であり, 各楽器音の分離同定には各々の楽器音の抽出および特徴の判別が必要である.しかし, 各楽器音は固有の倍音成分を含み, 混合音和音ではそれらが複雑に重畳するため, 混合音和音の採譜は大変困難であり複雑な計算等が必要となる.筆者らは, 周波数領域において等間隔に零点をもち, 問題とされていた倍音成分の影響を回避できるくし形フィルタを用いたピッチ検出方法を提案した.本システムでは, くし形フィルタを用いて楽器音に含まれるすべての周波数成分を除去し, 零出力の検出によりピッチ推定を行うため, 楽器の種類と数に関係なくピッチが推定できる.本論文では, 各楽器が異なった音を演奏した場合を仮定して, くし形フィルタによる異種楽器和音の推定法と単一楽器音の分離する手法を提案し, その波形情報を利用した楽器判別法の可能性を示した.
著者
中島 淑貴 柏岡 秀紀 キャンベル ニック 鹿野 清宏
出版者
電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.87, no.9, pp.1757-1764, 2004-09-01
参考文献数
11
被引用文献数
37

非可聴つぶやき認識」という,新しいスタイルの実用的な入力インタフェースを提案する.これは音声認識の雑音に対する脆弱性,情報の周囲への漏えい性を克服するため,声帯の振動を伴う通常音声の空気伝搬ではなく,「非可聴つぶやき(Non-Audible Murmur:NAM)」,つまり第三者に聴取不能な声帯の振動を伴わない調音呼気音の体内伝導を,体表からサンプリングし.HMMを用いて認識するものである,これを実現するための基礎として,第一に医療用膜型聴診器の原理を応用した体表接着型マイクロホンを開発した.第二として体内を伝導するNAMを採取して認識するために最適な接着位置を発見した.第三としてNAMの音響学的性質を検討した.第四として,この部位から採取されたサンプルを用い.HMM音響モデルに追加学習してNAM音響モデルを作成した.これらをもとに,日本語ディクテーション基本ソフトウェアを評価に用い,認識エンジンJuliusを使用して大語い連続認識実験を行い.NAM認識の実用可能性を検討した.
著者
金出 武雄 コンラッド ポールマン 森田 俊彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.8, pp.1497-1505, 1993-08-25
被引用文献数
83 11

時系列画像からの特徴点追跡結果を用いて,3次元的なカメラの相対運動と対象物の形状を求める因子分解法は,線型な定式化を行い,数値計算的に安定な行列の特異値分解を用いたため,安定に運動と形状を復元することができる.本論文では,Tomasiと金出による正射影モデルにおける因子分解法の考え方を発展させ,より中心射影に近いscaled orthographic projectionとparaperspective Projectionへの拡張を行うと共に,特徴点追跡の不確かさを考慮に入れて復元の精度を高める重み付け因子分解法を示す.
著者
金寺 登 荒井 隆行 船田 哲男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.7, pp.1261-1269, 2001-07-01
被引用文献数
41

CMS法や動的特徴量を用いることにより, 音声認識性能が向上することが知られている. これらの手法では特徴パラメータの時間軌跡を操作している. この時間軌跡を周波数次元で表したものは変調スペクトルと呼ばれる. よってCMS法や動的特徴量は, 変調スペクトルを操作しているものとみなせる. また音声認識情報のほとんどが1〜16Hzの変調周波数バンドに存在することが明らかになってきた. そこで本研究では, 音声認識情報を担う変調スペクトル成分のみを特徴量として用い, 数字音声認識実験を行った. 広く用いられているRASTAではIIRフィルタを用いて約1〜12Hzの変調周波数バンドを抽出しているのに対し, 本論文では位相ひずみの少ないFIRフィルタを用いることにより認識性能が向上することを確認した. また, この特徴量と一般によく用いられている動的特徴量を含めたMFCCを種々の雑音環境(SNR 10dB)において比較した結果, 認識誤り率が平均3%改善されることを確認した. 更に重要な変調周波数バンドを複数のバンドに分割すると, 認識誤り率が平均8%改善された.