著者
笠尾 敦司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.2, pp.221-228, 1995-02-25
被引用文献数
12

画像の加工を目的とした画像編集作業を行う前に,加工すべき領域を指定しやすくするために画像を絵柄に応じた小さな領域に分割しておくことは有益である.その技術として領域分割アルゴリズムの利用が考えられる.しかし,画像編集で扱う画像は非常に大きいため,既存のK-平均アルゴリズムを画像編集の前処理に応用すると,大きな作業メモリと極端に長い処理時間が必要になる.そこで,大きな画像を小方形領域に分割して処理を進める分割K-平均アルゴリズムを開発した.小方形領域の境界で生じる分割領域のつながりの悪さを解消するため,小方形領域の間に境界領域を設け,既に分割し終わった境界領域の分割結果と,分割領域の情報を記録した分割領域テーブルを参考にし,K-平均アルゴリズムで分割処理を進める手法を開発した.本分割K-平均アルゴリズムを利用することで,少ない作業メモリで高速に領域分割処理を実行できるようになった.
著者
鷹見 淳一 嵯峨山 茂樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.10, pp.2155-2164, 1993-10-25
被引用文献数
109

本論文では,HMMを用いた音素認識において,従来知識や経験,あるいはゆう度とは異なる尺度に基づいて決められていた認識単位やモデルの状態共有構造を,モデルパラメータと合わせてすべてを同時に学習・形成することのできる逐次状態分割法(SSS)と,SSSにより自動生成される表現効率の高い異音モデルである隠れマルコフ網(HMnet)を用いた音素認識手法を提案する.HMnetを用いた日本語26音素に対する音素識別実験では,従来の混合ガウス分布音素HMMを上回る認識性能が得られ,本手法の有効性を確認した.
著者
関口 博之 杉本 直三 英保 茂 花川 隆 浦山 慎一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.1, pp.126-133, 2004-01-01
被引用文献数
13

MRAにおける血管領域の信号強度は血流量を反映するため,細い血管ほど輝度が低くなる.また細い血管ほどパーシャルボリュームの影響を強く受け,その輝度は更に低下する.このためMRAの血管輝度は広い範囲にわたり,単純なしきい値処理ですべての血管を抽出することは不可能である.血管輝度のレンジの広さはリージョングローイングによる抽出手法においても大きな問題となり,拡張条件を血管の位置や輝度に応じて動的に変更するといった対処法が必要になる.しかし一般的なリージョングローイングでは複数の血管内で拡張が同時に進行するため,各拡張点に異なる拡張条件を適用することは難しい.これを解決するために,血管を各枝単位に抽出する,枝単位リージョングローイングを提案する.枝単位リージョングローイングでは拡張条件の局所的な最適化だけでなく,拡張の途切れ先への再接続も容易に行えるため,抽出精度の更なる向上が期待できる.本手法を頭部MRAデータ5例に適用したところ,すべての例について抽出誤差が従来手法に比べて減少することを確認した.本論文では上記の抽出手法,並びに,客観的評価を行うために今回開発した,投影像を利用した数値評価法について述べる.
著者
稲本 奈穂 斎藤 英雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.8, pp.1693-1701, 2005-08-01
被引用文献数
21

スポーツイベントを対象にした自由視点映像合成技術を複合現実感に応用し, HMDを用いた新しいスポーツ観戦の枠組みを提案する. スタジアムで撮影される多視点スポーツ映像から, 視点の内挿によって観察者の視点位置に相当する仮想視点の映像を生成し, HMDを用いて現実空間にスポーツシーンを重畳表示する. これにより, HMDを装着した観察者は, あたかも目の前で試合が行われているかのような感覚を得ることができる. 本手法では, 試合を撮影する多視点カメラや現実空間を撮影するHMDカメラの校正を行わずに, 自然特徴点の対応関係のみから推定可能なカメラ間の射影幾何的関係を用いて, 仮想視点映像の生成や現実空間と仮想物体との位置合せを実現する. 本論文では, 本手法の有用性を検証するために, サッカー映像を複合現実提示するシステムを構築した. このシステムでは, サッカースタジアムで多視点カメラにより撮影したサッカー映像を, 机の上に設置したフィールド模型の上にHMDを用いて重畳表示することができる.
著者
柏野 邦夫 中臺 一博 木下 智義 田中 英彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.11, pp.1751-1761, 1996-11-25
被引用文献数
70

音楽演奏の音響信号を対象として演奏情報を認識する試みとしては,従来自動採譜の研究が行われているが,複数種類の楽器音を含む音楽演奏を対象とする場合には,認識処理の有効性は極めて限られていた.そこで本論文では,複数種類の楽器音を含む音楽演奏の認識を音楽情景分析の問題としてとらえ,その解決を図る.ここで音楽情景分析とは,音楽演奏の音響信号から,単音や和音などの音楽演奏情報を記号表現として抽出することを指す.本論文ではまず,音楽情景分析を実現する上では情報統合の技術が不可欠であるとの認識から,ベイジアンネットワークによる情報統合の機構を備えた音楽情景分析の処理モデルOPTIMAを提案する.次に,特に単音の認識に的を絞って,提案する情報統合機構の有効性を示す.
著者
神尾 広幸 松浦 博 正井 康之 新田 恒雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1429-1437, 1994-08-25
被引用文献数
31

本論文では,音声入出力を中心としたマルチモーダル対話システムMultiksDialについて述べる.このシステムは,入力手段に音声認識装置とタッチパネル,出力手段に音声規則合成装置とディスプレイを備え,入出力の双方をマルチモーダル化していることが特長である.また補助入力手段に光電センサを使用し,ユーザの状況を検知しながら操作ガイダンスを提示することによって,スムーズな対話を実現している.MultiksDial上に情報案内システムを構築し,ユーザインタフェースの操作性を評価する.入力手段の比較実験結果から,直接指示可能な音声入力は,階層的な指示を必要とするタッチ入力よりも速く操作を完了できること,また初心者では,操作ガイダンスを合成音声で提示することにより,スムーズな対話が行えることを示す.これらの事実から,対話チャネルのマルチモーダル化は,ユーザとシステムとの対話をより効率よく行うのに有効であることが確認された.
著者
杉村 昌彦 飯国 洋二 足立 紀彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.1, pp.101-108, 1997-01-25
被引用文献数
11

イメージマッチングとは, 異なる状況下で得られた2枚の画像間の対応点を探索し, 対応関係を表す写像を見つけることであり, 画像処理における基本的問題の一つである. 本論文では, ツェルニケモーメントを特徴量とする2次元動的計画法を使って, 2次元の変形を含んだ2枚の階調画像の対応点を探索する方法を示す. この動的計画法では, 画像を複数の円形領域で区切り, その円形領域を対応単位とする. そして, 直線上の領域を曲線上の領域に対応させることで, 画像の局所的な平行移動, 伸縮成分を吸収する. また, 各円形領域の特徴量として回転に不変なツェルニケモーメントを用いることで, 画像の局所的な回転成分を吸収する. 計算機実験により画素を対応単位とする従来法に比ベ, 計算量が削減できると共にマッチング精度が向上することを確認した.
著者
大脇 崇史 中坊 嘉宏 並木 明夫 石井 抱 石川 正俊
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.5, pp.918-924, 1998-05-25
被引用文献数
18

実環境にある物体の視覚情報をリアルタイムに触覚情報に変換することにより, 物体に仮想的に触れることができるシステムを構築した.このシステムは, アクティブビジョンによって実環境にある対象物の局所的な視覚情報を得て, 高速並列画像処理システムで処理した後DSPシステムを介して視覚情報を対象物からの仮想的な反力に変換し, 触覚提示装置を用いて指先に反力を与えることで仮想的な接触を実現するものである.本システムでは, 独自に開発した高速画像処理システムを用いることにより, 視覚情報のセンシングから触覚提示までのループが約200Hzで動作する.本論文では, モダリティ変換の基本構造を述べた上で, システムの構成を示し, 最後にシステムの動作を確認するために4種類の2次元物体について行った形状をなぞる実験について, その結果を述べる.
著者
椿井 正義 伊東 正安
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.86, no.6, pp.895-907, 2003-06-01
被引用文献数
4

可変構造要素による適応的モフォロジーの境界強調機能について議論する.境界が強調される仕組みを定量的に説明し,超音波画像の境界強調とスペック低減のための有効な構造要素の定義域の設定と値の制御方法を提案する.構造要素の値を画像の境界部分で大きくして,境界以外の部分で小さくなるように制御するば,opening演算とclosing演算によって境界強調とスペックル除去を同時に行えることを示す.これを処理対象画像の情報を使って自動設定するために,超音波画像の空間分解能とスペックルの輝度値の統計的性質を利用する.本手法の有効性を,計算機シミュレーションによって作成した数値ファントムを用いた定量的評価と,実際の生体超音波画像からの境界抽出への応用によって明らかにする.スペックル低減と境界強調の性能が従来手法よりも高いことが示された.
著者
磯部 義明 大久保 なつみ 山本 眞司 鳥脇 純一郎 小畑 秀文
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.2, pp.279-287, 1993-02-25
被引用文献数
50

癌領域を同心円形孤立性陰影と仮定し,これを選択的に抽出するQuoit(輪投げ)フィルタを新たに開発した.このフィルタはいわゆるMorphologyフィルタの一変形であるが,(1)入力画像として同心円形でかつ中心から周辺に向かって単調減少するモデルを仮定した場合,フィルタ出力が解析的に表現できる特徴をもっている(結果が予測できる),(2)このフィルタを2回連続して適用すると,上記モデル画像を選択的に復元する能力を有する,などの興味ある事実を明らかにした.次いでこのフィルタを乳癌X線陰影抽出に応用し,12症例全例の乳癌部分を正しく抽出することを実証した.
著者
願 力栩 田中 直樹 金子 豊久 Haralick R. M.
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.10, pp.2696-2704, 1997-10-25
被引用文献数
30

文字は主に細長い線分で構成されることから, 画像中に存在する文字領域は「細長い領域」を検出することにより抽出が可能と考えられる. 本論文では, まず数学モルフォロジーを用いて濃淡画像における領域の幅(文字線幅)を得る方式について述べ, 更にそれに基づく文字領域抽出方式について述べる. 本方式は, 多様な背景部をもつ画像に適用可能であり, 背景部と文字領域が複雑に入り組むような場合にも単純な画像の場合と全く同等に処理できる. 雑誌の表紙画像を実験対象として文字列抽出実験を行った結果, 白黒濃淡画像に対して81%, カラー画像では95%の抽出結果を得ることができた. また, 解像度の関係で, 今回用いた最小の構造化要素と同等の文字サイズしかもたない小さな文字を除くと, それぞれ92%, 100%の抽出結果を得ることができた.
著者
柳原 英孝 河上 雅範 工藤 峰一 外山 淳 新保 勝
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.5, pp.1266-1273, 2000-05-20
被引用文献数
4

画像を低周波成分と高周波成分の二つの成分に分離し, 各成分を別々に符号化する2チャネル符号化において, 低周波成分の符号化にスプライン曲面を用いる手法を提案する.本手法では, 原画像から抽出した標本点をもとに, スプライン曲面を用いて原画像を近似することにより, 少ないビット数で滑らかな低周波成分を得る.高周波成分は原画像と低周波成分との差分を離散コサイン変換符号化を用いて符号化する.実験により, 本手法が従来の多チャネル符号化方式やJPEG方式と比較して, より高品位な再生画像を得ることができることを示す.
著者
伊田 政樹 中村 哲
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.86, no.2, pp.195-203, 2003-02-01
被引用文献数
18

実環境下で音声認識システムを利用することを考えた場合,入力音声への周囲の環境雑音の混入が避けられず,認識性能の劣化を招く.混入する雑音を予測することは多くの場合困難であり,入力信号と音響モデルの間の雑音環境の不一致が認識性能劣化の原因である.このことから,多様な雑音の混入に対してロバストな音響モデルの構築法が求められている.混入する雑音の問題は雑音の種類の多様性の問題とSN比の多様性の問題の二つに分けて考えることができる.本論文では,前者の問題に対しては雑音GMMの重み適応化によるHMM合成法を用い,後者の問題に対してSN比別のマルチパスモデルを用いることで,これらの問題の解決を試みる.旅行対話タスクとAURORA2タスクによる雑音下音声認識実験により,二つの手法を併用した場合の性能評価を行った.実験の結果,AURORA2タスクSN比=5dBにおいて1秒の適応データを用いた場合,ベースラインのHMMに対して53%の認識率改善を得た.これは従来法のHMM合成では10秒の適応データを用いた場合に匹敵する.
著者
汪 増福 加藤 博一 佐藤 宏介 井口 征士
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J75-D2, no.7, pp.1177-1186, 1992-07-25

鏡面物体の3次元復元問題は視線の拘束,スネルの反射法則および理想的な結像の拘束といった拘束条件下での局所的最小化問題として形式化される.そこで,周囲の物体などの3次元環境および物体の鏡面像の3次元位置を既知として,物体とその鏡面像の対応関係を用いて鏡面物体の3次元情報を再構成する手法を提案し,これを実現する実験的なシステムを構成し,実物の鏡面物体を対象に,手法の有効性を示した.
著者
高元 政典 山田 直之 小林 康弘 野中 久典 大越 茂
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.10, pp.2075-2082, 1994-10-25
参考文献数
12
被引用文献数
4

工業プラントの建設工程計画作成では,各作業単位に必要な資源量から算出する毎日の必要総資源量の変動やピークはできるだけ小さい方が望ましい.縦軸に必要総資源量を,横軸に時間をとり,必要資源を山積みで表すと,必要総資源量の変動やピークの最小化はその山積みの平準化に相当する.この山積みの平準化には,平準化に伴い単調増加または減少する関数を目的関数として各作業単位の開始日を決定する最適化問題を効率的に求解する必要がある.しかし,工業プラントの建設は,作業単位が100以上,建設に要する全期間が1,000日以上と大規模な場合が多く,上記最適化問題の大域的最適解の求解は困難である.また近似解法であってもその求解効率が問題となる.そこで,本研究では,必要資源量の山積みの平準化を目的とした大規模最適化問題に対し,近似解を高速に求解するアルゴリズムを開発した.本アルゴリズムは,最適化問題を定式化した0-12次計画問題に対し,平準化のために設けたピボット変数選択規則によるピボット操作を繰り返して準最適解を高速求解する.本アルゴリズムを実際の工業プラントと同規模の例題へ適用した結果,よい近似解を数分(計算機性能:28MIPS)で得るこができ,アルゴリズムの有効性を確認した.
著者
若原 徹 木村 義政 鈴木 章 塩 昭夫 佐野 睦夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.86, no.1, pp.63-71, 2003-01-01
参考文献数
15
被引用文献数
23

身体特徴を用いた個人認証手段として指紋照合技術への期待が大きい.本論文では,高精度な回転・位置ずれ補正,高速・安定なマニューシャマッチングを実現する指紋照合方式を提案する.処理の流れとしては,濃淡指紋画像の 2 値化を行った後,1) 局所領域ごとの指紋隆線方向分布を用いた登録指紋-入力指紋間の高精度な回転・位置ずれ補正,2) 登録-入力マニューシャ間での高速組合せ探索による最適対応付け,3) 指紋隆線方向分布間距離及びマニューシャ照合率のしきい値処理による本人受理/拒否の判定,の過程を経る.静電容量方式の市販半導体式指紋センサを用いて収集した80名×4指×10枚の指紋画像データを対象とした指紋照合実験より,本人拒否率及び他人受理率を評価して,提案手法の有効性を示す.
著者
原崎 俊介 斎藤 英雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.1, pp.46-55, 2002-01-01
参考文献数
17
被引用文献数
5

本論文では, 拡張現実感における実画像と仮想物体との幾何学的整合性を解決するために, 2台の未校正カメラから定義される射影グリッド空間と, 視点間のエピポーラ幾何を表すF行列を用いて, 未校正カメラにより撮影された任意視点画像に仮想物体像をオーバレイ表示する手法を提案する.本手法では, 仮想物体を定義するオブジェクト座標系と基底画像間で5点以上の対応点を与えることにより, オブジェクト空間と射影グリッド空間の座標変換を算出する.そして, 任意視点のカメラ画像と基底画像間で8点以上の対応点からF行列を算出し, 任意視点画像とオブジェクト空間を座標変換することによって, 仮想物体を任意視点画像にオーバレイ表示する.本手法は, 射影カメラを用いているので仮想物体の奥行や視点から仮想物体までの距離に関しての制限がない.また, 実装時には, 幾何学的位置合せのための特徴点の3次元位置や幾何学的特徴が不要であるため, 特殊なマーカ等の設置が不要となる.更に, 8点以上の対応点のトラッキングを行うことにより実現できるので, 仮想物体を実画像にオーバレイ表示する処理が軽く, 実時間処理に向いている.本手法に基づいて拡張現実感表示を行う実験システムを構築したところ, 良好な結果が得られ本手法の有効性が確認できた.
著者
坂本 靜生 宮尾 陽子 田島 譲二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.8, pp.1796-1804, 1993-08-25
参考文献数
12
被引用文献数
20

顔画像から目の構造特徴を検出する新しいアルゴリズムを提案する.従来のエッジベースの手法では,ノイズや経年変化に弱く,特に目尻点の検出において満足な結果を得ることが困難であった.そこで,より多くの画像特徴を利用するために,新しくエッジと領域を検出する画像解析方法を提案する.本方法により得られる画像特徴と,手入力により抽出した目構造とを比較することにより,ノイズや経年変化に強い目構造を新しく定義し直す.目の部分画像から目構造を自動抽出する,論理演算を主体としたシンプルな構成をもつ,パラメータの少ないアルゴリズムを提案し,日本人成人男子100名の右目部分画像に適用した.その結果,従来手法では検出することが困難であった画像に対しても良い結果を得ることができた.
著者
羽下 哲司 鷲見 和彦 八木 康史
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.5, pp.1104-1111, 2004-05-01
参考文献数
6
被引用文献数
23

木の揺れや,水面の乱反射等の背景変動のある屋外情景から,歩行者を検出する画像処理アルゴリズムを提案する.従来より,人のようにほぼ等速直線運動する対象は時空間的パス内での局所的な動きが強め合い,他の背景変動では弱め合うことに着目して,歩行者のみを検出する手法が提案されている.しかしこのような,時間平均した動きの強さを用いた判定では,移動対象の誤った関連付けや,高コントラスト領域の一時的な動きが平均値を引き上げ,誤報となるケースが見られる.本手法では,動きの特徴量として,時間平均した動きの強さに加えて,空間平均した動きの強さ,時間的な動きの一様性という特徴量を定義し,これら三つの特徴により構成される特徴空間で歩行者と他の背景変動とを識別する.実画像による評価で,提案手法は時間平均した動きの強さにのみ着目した従来手法に比べて誤検出率,未検出率ともに約1/3に低減できることを確認した.更に提案手法をオンラインで実現するシステム構築し,実環境で2週間にわたる評価試験を行った結果,失報率1%未満,誤報発生1日平均3件以下の性能を得ることができた.
著者
川谷 隆彦 清水 裕之 マッキーチャン マーク
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.7, pp.1742-1751, 1997-07-25
被引用文献数
10

本論文は筆者の一人が先に提案したLDA法の改良と手書き数字認識への応用について述べている. LDA法ではフィッシャーの判別分析で求められる判別関数を原距離関数に重畳することにより原距離関数のパラメータの学習を行う. 判別分析においては, 判別すべき二つのパターン集合を1次元の軸z上に射影する. 今回新たな問題点として, LDA法では判別関数に1次の項のみならず2次の項まで用いるためにz軸上の分布は対称にならないこと, また, そのために最適な判別関数が求められず認識精度の向上に限界があることが判明した. 本論文では, 非対称性の影響を軽減させる方法を提案し, NISTのデータベースに含まれる手書き数字を用いた認識実験によりその効果を確認している. また, 誤読パターンの傾向の評価, および人間の読取り結果との比較を通じ, OCRの読取り能力は人間のそれにかなり接近してきていることを示している.