著者
澤木 美奈子 村瀬 洋 萩田 紀博 石井 健一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.10, pp.2480-2482, 1998-10-25

文字や記号などの複数の情報が重畳して記述されている尺八譜を認識する手法について述べる.補完類似度を用いることにより, 複数の情報を独立に扱うことが可能となり, 高い認識率が得られることを示す.
著者
柳原 圭雄 濱 裕光
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.11, pp.1977-1979, 1996-11-25
参考文献数
3

PET画像による脳賦活部位抽出法を提案し,抽出の確からしさを検討した.均一濃度ファントム画像を用いて補正式を作成し画素ごとの濃度ばらつきを補正するものである.リーブワンアウト(leave-one-out)法により信頼性のある抽出ができることを確認した.
著者
大和 淳司 大谷 淳 石井 健一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.12, pp.2556-2563, 1993-12-25
被引用文献数
59

本論文では,画像によるモニタリングの自動化を目的として,動画像中の人物像の行動を認識する方法を提案している.実画像に対してもロバストな認識系を構築するために,幾何学的なモデルに基づくモデルフィッティングによらず,特徴量ベースのボトムアップな学習によるアプローチをとる.このために隠れマルコフモデル(HMM)を適用した時系列パターン認識を行った.HMMは音声認識で広く応用されているが,動画像への適用はほとんど例がない.本手法では,画像中の人物領域のメッシュ特徴をベクトル量子化によりシンボルに変換し,このシンボル列をHMMで学習,認識する.これにより,教師付き学習による,所与の動作カテゴリーの認識が実現できる.テニスの動作を列に,複数の被験者の動作認識実験を行い,90%以上の認識率を得た.また,不特定多数の人物動作認識を目的として,学習に用いなかった被験者を認識対象とした場合についても検討を行った.この場合,認識率の低下が起こるが,学習に用いる被験者数を増やすことにより認識率が向上することを確認した.
著者
谷川 昌司 福島 邦彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.10, pp.2215-2222, 1993-10-25
被引用文献数
8

ネオコグニトロンはパターン認識能力をもった階層型の神経回路モデルである.ネオコグニトロンの中間層にはさまざまな種類の部分特徴を抽出する細胞(特徴抽出細胞)が存在している.特徴抽出細胞は可変入力結合をもっており,特徴抽出細胞の結合荷重は抽出する特徴の種類ごとに異なる.この結合荷重は,教師なし学習法によって決められ,ある標準的なパターンが刺激として与えられたときに,細胞が最大出力を出すように調節される.この標準的なパターンからどの程度変形した特徴までを同じ特徴であるとみなすかの度合(特徴選択性)は,特徴抽出細胞のしきい値によって調節することができる.本論文では,ネオコグニトロンの中間層において,特徴選択性を定めるしきい値が認識率にどのような影響を与えるかを調べる.そして,従来のネオコグニトロンでは学習段階のしきい値と認識段階のしきい値を同一にしていたが,認識段階のしきい値を学習段階のしきい値よりも小さく設定することによって,認識率を大きく向上できることを明らかにする.
著者
菊池 英明 工藤 育男 小林 哲則 白井 克彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1502-1511, 1994-08-25
被引用文献数
19

音声を利用したマルチモーダルインタフェースのベースシステムとなる音声対話インタフェースにおいて,ユーザに発話のタイミングに関する自由を保証するための割込みの扱いについて検討した.ユーザに割込みを許すとき,従来のように1文を単位としてシステムの発話を計画するのでは,計画した発話内容と実際に発話した内容あるいはユーザが受け取った内容の間に差異が生じる.そこで,発話の計画の単位を,1文中の伝えるべき情報と定め,対話中に話者間でやりとりされる発話権を管理することにより,どの情報が受聴されたかを常に把握する方式を提案した.実験の結果,提案した方式によって,システムが計画した発話とユーザが受聴した発話の差異をなくしながら,スムーズな割込みへの対処が被験者の半数以上に認められた.また,割込みに対処することにより,ユーザのタスク完了までの所用時間は7%減少し,積極的な話題提起数が21%増えるなど,インタフェースの利便性が向上することが確認された.
著者
上田 修功 中野 良平
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.9, pp.2512-2521, 1997-09-25
参考文献数
17
被引用文献数
30

最近, 汎化能力向上のための新たなアプローチとして, 同一タスクに対して複数の予測器を個別に学習した後, それらの出力の平均値(一般には重み付き平均)を予測値とするアンサンブル学習法が提案され実験的にその有効性が示されている. しかしながら, これまでアンサンブル予測器の汎化誤差に関する厳密な議論は十分になされていない. 本論文では, 回帰問題に焦点をあて, 一般のアンサンブル予測器の汎化誤差改善効果に関する数理的考察を行う. すなわち, 同一タスクに対して個別に学習させた任意の非線形予測器のアンサンブルによる汎化誤差を, 各予測器の推定値のバイアス, 分散, 予測器間の出力の共分散, 学習データのノイズの分散を用いて表し, 各々が汎化誤差に及ぼす影響を明らかにする. 次いで, 実用上興味深いケース(各予測器が同一モデルからなる等)について考察し, 計算機シミュレーションにより解析結果の検証を行う. 解析結果をもとに, 一つのデータセットのみが与えられているという実用上自然な状況下では, データセットを分割する方法では予測の精度向上は期待できないことを明らかにし, その場合の有効なアンサンブル学習法について言及する.
著者
山崎 恭 小松 尚久
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.8, pp.1335-1346, 1996-08-25
被引用文献数
22 7

個人の身体的特徴・特性の一つとしてオンラインで取得された筆跡情報に着目し, より信頼性の高い筆者認識手法の確立に必要となる新たな個人性の抽出手法を提案する. 従来の筆者認識研究では, 個人の特徴を反映するパラメータ (特徴パラメータ) が, 個人の特徴の現れやすい部分から抽出されたものであるか否かということは, 必ずしも問題とされていない場合が多い. これに対して筆者らの提案する個人性の抽出手法では, 複数のグループ (カテゴリー) に特徴パラメータを分類し, 個人の特徴の現れ方に応じて特徴パラメータに重み付けを施すことで, 従来よりも筆跡情報に現れる個人性をより明確化することが可能となる. また, 提案手法では, 字種への依存度を可変とする特徴パラメータを使用しており, 筆者照合方式へ適用した場合, テキストを固定する従来の署名照合方式に対し, 登録時と照合時に異なる字種を用いることの可能な, 字種選択の自由度が高い照合方式を構築することができる. 本論文では, 筆跡情報からの個人性の抽出手法を提案すると共に, 実際の筆記データを用いたシミュレーション実験により, 提案手法の信頼性を評価した結果について報告する.
著者
船橋 淳一郎 松尾 啓志 岩田 彰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.5, pp.1113-1121, 1997-05-25
被引用文献数
5

3次元形状に対して多重解像度表現を行い, 適応的なマッチングを適用して物体の識別を行う手法を提案する. MEGIはEGIを拡張し, 任意形状の表現を可能にしたモデルである. しかし曲面を含む形状では適当な分解能を選択しなければ満足な表現を得ることは難しい. そこでMEGIを利用して, 形状の多重解像度表現を行う. ここで提案する多重解像度表現は基本要素の単調減少性を有し, 異なる解像度に属す要素の間で対応が一意に決まり, 最低解像度を根とする木で表される. 照合とこの木を根から葉方向へたどることによる類似部分の高解像度化を繰り返し, 最終的に形状全体の類似性を判定する. 最後に, 本手法の有効性を計算機シミュレーションを通じて明らかにする.
著者
東海林 健二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.9, pp.1753-1760, 1994-09-25
被引用文献数
10

2値画像の回転や拡大縮小といったアフィン変換のアルゴリズムとして,2値画像をランの形式で表現し,斜交軸変換と転置を組み合わせて行う方法が知られている.この従来手法は,ラン形式を用いるため,斜交軸変換は簡単なアルゴリズムで高速に実行可能であるが,転置のアルゴリズムは複雑で比較的多くの実行時間を要していた.本論文では,ランで表現された画像の転置,すなわち縦と横を入れ替える操作を効率良く行う手法およびこの転置手法を用いた画像の回転,拡大,縮小を含むアフィン変換の方法を提案する.本手法で採用したランデータの表現方法は,pxy表と呼ばれる形式で,一次元配列に黒ラン,白ランの開始座標を交互に格納するという単純な方法である.実験により従来手法と提案手法の時間コストの比較を行った結果,従来手法でのアフィン変換は,ラン当りの実行時間が黒ラン長に従い増加するが,一方,提案手法では.ラン当りの実行時間はラン長によらず一定であった.すなわち,提案手法を用いると,2値画像のアフィン変換が,およそラン数にだけ比例する時間で行えることがわかった.
著者
三輪 多恵子 田所 嘉昭 斎藤 努
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.9, pp.1965-1974, 1998-09-25
被引用文献数
51

近年の自動採譜の研究は, 異種複数楽器により演奏された混合音和音に対するピッチ推定および各楽器音の分離同定を目的とした研究へ, その対象が拡張される傾向にある.ここで, ピッチの推定には入力楽器音の周波数の分析が必要であり, 各楽器音の分離同定には各々の楽器音の抽出および特徴の判別が必要である.しかし, 各楽器音は固有の倍音成分を含み, 混合音和音ではそれらが複雑に重畳するため, 混合音和音の採譜は大変困難であり複雑な計算等が必要となる.筆者らは, 周波数領域において等間隔に零点をもち, 問題とされていた倍音成分の影響を回避できるくし形フィルタを用いたピッチ検出方法を提案した.本システムでは, くし形フィルタを用いて楽器音に含まれるすべての周波数成分を除去し, 零出力の検出によりピッチ推定を行うため, 楽器の種類と数に関係なくピッチが推定できる.本論文では, 各楽器が異なった音を演奏した場合を仮定して, くし形フィルタによる異種楽器和音の推定法と単一楽器音の分離する手法を提案し, その波形情報を利用した楽器判別法の可能性を示した.
著者
金出 武雄 コンラッド ポールマン 森田 俊彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.8, pp.1497-1505, 1993-08-25
被引用文献数
83 11

時系列画像からの特徴点追跡結果を用いて,3次元的なカメラの相対運動と対象物の形状を求める因子分解法は,線型な定式化を行い,数値計算的に安定な行列の特異値分解を用いたため,安定に運動と形状を復元することができる.本論文では,Tomasiと金出による正射影モデルにおける因子分解法の考え方を発展させ,より中心射影に近いscaled orthographic projectionとparaperspective Projectionへの拡張を行うと共に,特徴点追跡の不確かさを考慮に入れて復元の精度を高める重み付け因子分解法を示す.
著者
庄境 誠 中村 哲 鹿野 清宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.10, pp.2636-2644, 1997-10-25
被引用文献数
14 3

本論文では, 乗法性ひずみの補正に有効とされているケプストラム平均正規化法(CMN)について考察する. 従来のCMNは単一のケプストラム平均(CM)により正規化を行うため, 実環境に存在する多くの乗法性ひずみ要因を補正するには十分ではない. この問題を解決するため, 話者ごとにかつ音声/非音声で別々に求めたCMを入力ケプストラムから減じる, 新しい方法E-CMNを提案する. この方法は, さまざまな乗法性ひずみを一括して補正し, 入力スペクトルを正規化することが可能である. 更に, 加法性雑音と乗法性ひずみのある実環境に対応するため, E-CMNとHMM合成法を組み合わせた, 新しいモデル適応化手法E-CMN/PMCを提案する. 本方法は, 加法性雑音モデルに対する音声モデルの周波数帯域ごとのゲイン, すなわち, 乗法性ひずみをE-CMNにより音声のCMとして一意に推定できるため, 音声モデルと雑音モデルを繰返し計算なしに加算できるという意味で簡便な方法である. 最後に, E-CMN/PMCの自動車環境内での性能を評価する.
著者
松野 勝弘 李 七雨 辻 三郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1591-1600, 1994-08-25
被引用文献数
66

本論文では,物理モデルであるポテンシャルネットとKL展開を組み合わせた顔表情認識の手法について述べる.ポテンシャルネットは,ノードが2次元グリッド状に相互にばねで連結された構造をもつ.画像からの力によって各ノードが顔器官の特徴に移動するためネットは変形し,変形したネットの形状には顔の特徴が反映されている.ポテンシャルネットにより求めた高次元の特徴ベクトル空間から,認識に有効なより低次元の特徴ベクトル空間を構成するために,照合パターンの特徴ベクトルの集合をKL展開して正規直交基底を求める.次に,求めた正規直交基底で表現される低次元のカテゴリー空間を構成し,この空間で入力パターンと照合パターンの距離を求め,最小距離判別法により認識を行う.本手法を未知の人物に対する識別能力,照明条件変動に対する耐久性,位置ずれに対する安定性の観点から評価し,その有効性を示した.
著者
山本 眞司 田中 一平 千田 昌弘 舘野 之男 飯沼 武 松本 徹 松本 満臣
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.2, pp.250-260, 1993-02-25
被引用文献数
59

肺癌早期発見のための専用CTを開発することを提唱し,その基本構想を明らかにした.次いで,このシステムに必須の診断支援用画像表示方式として,下記2方式を並列に用いることを検討し,良好な結果を得た.(1)40スライスからなる3次元情報を,病巣陰影の情報を損なうことなく2次元に投影表示する手段として,MIP(Maximum Intensity Projection)法を応用した.但し単なるMIP法では妨害臓器情報による弊害が大きいため,あらかじめこれらの不要情報をしきい値法にて除去する方式を開発した.(2)各スライス断面ごとに病巣陰影候補を自動認識し,陰影候補の見つかったCT断面のみをCRT表示することにより,表示断面を大幅に削減する方式を開発した.病巣陰影の自動認識には,我々が新たに開発したQuoit(輪投げ)フィルタを用いた.
著者
亀田 能成 美濃 導彦 池田 克夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.1, pp.26-35, 1996-01-25
被引用文献数
74

1枚のシルエット画像から, その画像中に写された関節物体の姿勢を, モデルマッチングによって推定する方法を提案する. 対象となる関節物体モデルをあらかじめ計算機に構築しておく. 関節物体モデルが対象物体を正確に反映するものならば, 特徴点に基づく逆運動学的な解法やマッチング処理の内部にヒューリスティックな知識を埋め込まなくとも, 本方法により姿勢推定が可能であることを示す. 本論文で取り扱う関節物体は, 部品が関節によってつながった木構造をしているものと仮定する. その姿勢は関節のすべての角度を決定することで定まる. CG合成画像に対して本方法を適用し, その能力と特徴を評価した後, 実際の人体についても実験を行い有効性を確認した.
著者
高橋 勝彦 関 進 小島 浩 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1552-1561, 1994-08-25
被引用文献数
110

CCDカメラ等によって得られる動画像から人間の身振り手振りを認識する手法を提案する.入力画像系列から,垂直・水平・時間方向のエッジ特徴を抽出し,これらを時空間的にリダクションすることによって得られる時空間ベクトル場を用いて各ジェスチャーの標準パターンを表現する.認識対象画像系列と標準パターンとのマッチングにはスポッティング認識手法を用いる.スポッティング認識は,(1)ジェスチャーの時間区間のセグメンテーションが不要,(2)フレームワイズ,すなわち入力画像フレームに同期して認識結果を生成する,といった特長をもつ.7種類のジェスチャーを認識対象として実験を行った結果,本手法によってほぼ正しくジェスチャーを認識できることがわかった.特に時間方向のエッジ特徴を用いた場合は,標準パターン作成時の認識時での被験者の衣服・背景の変化に対し,ロバストであることが確認された.また,本手法を画像処理ボードとワークステーションを組み合わせたシステムにインプリメントし,4種類のジェスチャーをリアルタイムに認識するシステムを構築した.
著者
小杉 信
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.6, pp.1132-1139, 1993-06-25
参考文献数
11
被引用文献数
69

顔画像のモザイクパターンとニューラルネットを組み合わせた顔の認識法を提案する.顔画像の場合,顔の輪郭や目・鼻・口などの形状,ならびにこれらの位置関係が顔の重要な特徴であるが,顔は陰影が柔らかで正確な形状抽出が困難であり,更に,互いによく似ているため,従来,多人数の顔の認識はほぼ不可能であった.そこで,線分形状ではなく顔の濃淡情報に注目し,顔画像の中心部を12×12に粗くモザイク化し,これをニューラルネット(3層BPN)に入力して多人数の識別を試みた.この結果,学習後の中間層の各ユニットは,モザイク画像の各所から濃淡情報をきめ細かく集めることにより,互いに共通の特徴をもつ顔画像,例えば男女,を自動的に分類した.また,100人の上半身動画像から得た各人一つの正面向き平常顔を学習後,同じ録画像から任意にサンプルした平常顔ならびに微笑顔をテストし100%の認識率を得た.更に,学習の対象外,すなわち,見知らぬ顔に対しては,「その他検出」専用の出力ユニットを設けることにより,見知らぬ顔に対するエラー率を約1/2に低減することができた.
著者
藤村 恒太 横矢 直和 山本 和彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.2, pp.382-390, 1993-02-25
被引用文献数
25

本論文では,医用画像処理における今後の重要な課題の一つである動画像処理のアプローチとして,医用分野で大半を占める形状およびその動き・変形が滑らかな非剛体物体の動画像を対象とした物体の追跡と動きの解析について述べる.物体の輪郭形状に対するフレーム内とフレーム間での制約をエネルギー関数として定義した動的輪郭モデルを用い,多重スケールでの動的計画法を用いたエネルギー最小化により対象物体の輪郭を抽出・追跡し,その動きを解析する.ここで提案する多重スケールでの動的計画法は,スケールに応じて動的計画法の探索近傍を変化させるもので,粗いスケールでは粗い近傍を,細かいスケールでは細かい近傍を定義し,粗いスケールから細かいスケールへとエネルギーの最小化を行う.これによって物体の大きな動き・変形に対処することができる.本手法を「条件付け学習の神経機構の解明を目的とするナメクジの行動解析」の動画像と超音波心臓動画像に適用し,非剛体物体追跡の有効性を確認した.なお,前者の適用例では,動きの解析として,輪郭に沿った曲率の正の極大点を物体の変形に不変な特徴として抽出し.その移動量を計測した.これによって,物体の大まかな動きの測定が可能となった.
著者
新見 道治 野田 秀樹 河口 英二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.6, pp.1132-1140, 1998-06-25
参考文献数
8
被引用文献数
40

本論文は新たな画像深層暗号化法を提案するものである.これまでに, 離散コサイン変換を用いた画像深層暗号化法が提案されている.この方法によると, 埋め込めるデータ量は, 濃淡画像をダミー画像とした場合, たかだかダミー画像の13%程度である.一方, 本手法は2値画像のノイズ状の領域に秘密データを埋め込もうとするものである.ノイズ状の領域であるか否かは, "複雑さ"なる尺度を利用することにより判定する.本手法では視覚的に簡単な複雑な領域に変換できる"コンジュゲート"演算を利用して秘密データを加工することにより, どんなデータでも埋込みが可能となる.実験では8ビットのダミー濃淡画像に対して, 原画像の約36%のデータ量のJPEGファイルを, 35dB程度の視覚的に見劣りがしない状態で, 埋め込むことができた.
著者
赤松 茂
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.8, pp.2031-2046, 1997-08-25
被引用文献数
175

コンピュータによって顔画像の個人認識を行う技術の最近の研究動向について述べる. まず, これまでに多くの研究が行われてきた正面顔画像による個人識別を目的とした顔パターンの表現法について紹介すると共に, 更にこれらを顔の姿勢変化による見え方の変化を許容する方向に拡張しようとする研究の動向について述べる. また米国においてそのようなロバストな顔認識技術の確立を目指した研究の推進の原動力の一つとなっている顔認識技術開発計画FERETの動向についてもあわせて解説する. 更に, コンピュータによる顔の認識をコンテンツによる映像データベースの検索や編集というメディア処理の要素技術の一つとしてとらえ, 顔が伝える感性的な情報に対する人間の認知特性をコンピュータによる顔の認識に反映させることを狙いとして, 人間による顔認識過程をモデル化しようとしている試みについても紹介する. 最後に, 個人識別やデータベース検索など, 顔に対するさまざまな高次視覚情報処理を実現する前提として重要な, シーン画像から顔パターンを抽出する機能の実現についての研究の現状を述べる.