著者
森 偉明 鈴木 智 安野 貴之 堀越 力
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.3, pp.409-419, 1995-03-25
被引用文献数
8

3次元物体を認識する際,階層的にマッチングしていくのが最も効率的である.従来,詳細な3次元構造を抽出した後,わざわざそれを粗くすることによって階層的な構造を作ることがよく行われている.しかし,最初に詳細な3次元構造を得るのは非常に困難であり,かつ大量な計算が必要であるため,このようなアプローチは極めて非効率である.本論文では,まず,直接に粗い3次元構造から順次に多重スケール3次元構造を抽出できる手法を提案する.物体が存在する空間を最初に粗いボクセルに分割し,カメラのレンズ中心と画像上の特徴点を結んだ逆投影線の通るボクセルに対してある値を加算するという3Dボーティングを行う.加算値の高いボクセルは実際に3次元特徴点が存在する領域として抽出する.更に,3次元特徴点が存在するボクセルを再分割し,3Dボーティングを行うことを繰り返すことによって,効率的に粗いボクセルから細かいボクセルまでの物体の階層的な構造を抽出できる.次に,本論文では,画像上の特徴点の位置ずれとカメラレンズ中心の位置ずれによる3Dボーティングへの影響を解析する.そして,これらの誤差の影響を抑えるために,3Dボーティング後のボクセル空間に対して◸^2Gフィルタを掛けることが有効であることを示す.提案した手法を実画像に適用した結果では,複雑なシーンの6枚の画像から正確に階層的な3次元構造を抽出できた.
著者
佐賀 聡人 牧野 宏美 佐々木 淳一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1610-1619, 1994-08-25
被引用文献数
24 9

本論文では,ペン入力システム上での手書きによる直接的な図形入力ヒューマンインタフェースを実現するための基礎技術として,手書き描画動作をあいまいな曲線としてモデル化する手法「ファジースプライン補間法」を提案している.本手法によって得られるあいまいな曲線のモデル「ファジースプライン曲線」は,曲線の幾何モデルとして有用なスプライン曲線をファジー理論に基づいて拡張することによって定義され,幾何学的な取扱いとファジー集合としての取扱いが同時に可能な手書き曲線の内部表現モデルを与える.従ってこれは,書き手の本来意図した理想的な曲線を必ずしも忠実に表していない手書き曲線をもとにして書き手の意図の幾何学的な意味を推論する問題を考える場合の基礎を与える.本論文の後半ではファジースプライン補間法の一応用として,一筆書きされた手書き曲線を書き手の意図したストロークごとに分割する手法を提案し,本手法の必要性を実験的に示す.
著者
塩 昭夫 青木 康浩
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.3, pp.431-439, 1999-03-25
被引用文献数
5 2

定規などを用いずに手書きされた建築間取り図面を, スキャナから読み取って認識し, 建具, 収納, 階段などの建築要素に自動変換するシステム(Sketch Plan)を開発した. 本論文では, このシステムの入力条件, 図面認識/理解処理アルゴリズム, 及びシステム評価の結果について述べる. 筆記変動を含む手書き図面を自動認識するため, 図面上の線分情報と領域情報を独立に処理し, それらの結果を統合する独自の図面認識処理アルゴリズムを考案した. このアルゴリズムを実際の手書き間取り図面を用いて評価した結果, 認識率93%を得た. また, 認識結果の確認・修正も含めた図面入力時間を実測した結果, マウスを用いたマニュアル入力の約1/9になることがわかった.
著者
水上 嘉樹 古賀 和利 鳥岡 豊士
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.1, pp.63-72, 1997-01-25
被引用文献数
22

本研究では階層的変位抽出アルゴリズムを用いてパターン間の対応変位を抽出し, 得られた変位関数に基づいた認識を行う手書き文字認識システムを提案する.階層的変位抽出アルゴリズムにおいては,計算対象画像間の対応誤差を表す項と抽出された変位の滑らかさを表す制約項からなるエネルギー汎関数を定義し, これより導出されるGauss-Seidel型の漸化式の反復演算によりパターン間の変形変位を抽出する. また, 大局的変位からより局所的な変位へと段階的な変位抽出を実現するために階層的構造を用いている. 文字パターンに対する階層的変位抽出アルゴリズムの妥当性, 提案した手法の認識性能を計算機実験により明らかにした. 更に, 類似パターン間の過対応が良好な認識を妨げることを考慮して, 変位抽出能力の大きさと認識性能の関係について検討を行い, 変位抽出能力を決定するシステムパラメータの与え方について一考察を与える.
著者
竹内 亮 MacKay David J.C. 中沢 進 松本 隆
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.9, pp.2502-2511, 1997-09-25
被引用文献数
6 2

正則化とは, 適当に重み付けされた拘束条件(regularizer)を付加することにより, 逆問題の不良設定性を解消する手法である. 正則化をベイズ推定の枠組みでとらえる際生じる周辺ゆう度の微分公式とregularizer比較(モデル比較)の陽な公式を与え, 数値実験でその有効性を示す.
著者
鈴木 敏 安藤 広志
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.7, pp.1291-1300, 1996-07-25
被引用文献数
11

本論文では2次元射影像のみから複数の3次元物体の認識・類別を行う神経回路モデルを提案する. 本モデルは複数のモジュールからなり, モジュール間で競合を行いながらそれぞれのモジュールで入力射影像の圧縮・復元を学習する. その結果, 各モジュールはそれぞれ一つの物体の射影像のみを復元できるようになり, その復元精度から物体の類別を行うことが可能となる. この過程では物体のラベル等の教師信号は不要である. 更に, 本モデルでは入力特徴を限定していない. すなわち, 入力情報を画像濃淡値としても, 各特徴点の座標としても同様のネットワーク構造で扱うことができる. 本論文では本モデルの詳細を説明すると共に, 計算機実験の結果も併せて提示する. この実験結果は, 視点方向によらない3次元物体の認識が教師信号なしに可能であり, 各モジュールの内部表現 (圧縮表現) は視点方向に等価であることを示している. これは2次元情報のみからの3次元情報の推定を意味している. また, 脳内の神経結合と比較して, 情報の圧縮・復元過程は二つの視覚領野間の双方向結合に, モジュール間の競合は視覚領野内の水平方向の結合に対応づけて考えることができる.
著者
東海林 健二 矢野 将哉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.9, pp.2393-2401, 1997-09-25
被引用文献数
2

2次元2値画像のアフィン変換アルゴリズムの一つとして, 画像をPXY表と呼ばれるラン形式で表し, skewと転置を組み合わせて行う効率の良い方法を我々は以前に提案した. 本論文では, SPXY表と呼ばれる3次元ラン形式で表した3次元物体(3次元2値画像)のアフィン変換の新しいアルゴリズムを提案する. SPXY表は2次元のPXY表を積み重ねたものである. SPXY表の上でのアフィン変換は, 2次元PXY表の場合の拡張として, 3次元skewと転置の組合せとして実現される. 実験結果は, ボクセルごとに変換を行う素朴な方法に比べ, 提案手法が36〜389倍高速であることを示している. また, 提案手法によるアフィン変換のCPU時間は3次元物体を表すラン数に比例することを示している. 提案手法によるアフィン変換の結果は, 小数点数を整数に四捨五入したときの丸め誤差より大きい誤差を含む. アフィン変換のうちでも最もよく用いられる3次元回転について誤差解析を行った. その結果, 提案手法による各座標の絶対誤差は最大1.4であった.
著者
新堀 英二 高木 幹雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.9, pp.1932-1940, 1993-09-25
被引用文献数
39

離散的コサイン変換(DCT)を用いたGerchberg-Papoulis(GP)の反復法を適用した画像拡大法"IM-GPDCT"を提案し,その特性を評価した.従来用いられてきた補間法による拡大画像は,観測過程において失われた空間的高周波成分を復元することが原理的に不可能なため,画質劣化が避けられなかった.IM-GPDCT法は観測時に失われた空間的高周波成分を復元する概念を用いることにより拡大画像の画質を改善する.IM-GPDCT法では,周波数帯域拡張の基本原理としてGP反復法を用いており,画像をDCTにより正逆両方向に変換する過程において,画像の広がりが有限であることと空間的低周波成分の正しい情報が既知であることの二つの拘束条件を用いて空間的高周波成分を復元する.提案手法と3種の従来法(補間法)を再生誤差と拡大画像の画質の観点から比較した.その結果,IM-GPDCT法は再生誤差の観点から補間法よりも優れていること,また,拡大画像の画質は鮮鋭さ,ジャギーのないエッジ再現やテクスチャの再現性に優れていることが示された.
著者
箕浦 大祐 山名 岳志 正木 茂樹 一之瀬 進
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.5, pp.962-971, 1998-05-25
被引用文献数
15

ネットワークを介して接続されている各端末にコンピュータグラフィックスを用いて表示される利用者参加型の3次元仮想空間において, 大規模な人数が参加することによって生じるシステムのネットワーク負荷を軽減し, かつそれだけの人数の分身を仮想空間内に見えるようにするためのシステムの設計方法について述べる.仮想空間に利用者の分身を登場させるためにはその分身の仮想空間における位置情報をはじめとする利用者情報をサーバで管理して各利用者の端末に送信する必要がある.そのため通信回線容量と利用者端末の計算機能力の制限から実際にシステム上で有効なサービスを展開するためにはシステムへの利用者の参加者数には限界がある.本論文では, 仮想空間をいくつかの部分領域に分割して利用者の位置情報を管理し, 領域内に存在する利用者は従来どおりサーバから位置情報をもらって分身モデルを表示し, 領域外の利用者は画像によって表示することによってサーバと利用者端末間の通信量を抑える3次元仮想空間における多人数表示方法を提案する.本手法を用いて構築したシステムにおいてサーバと利用者端末の間の通信量および利用者端末の描画時間を計測し, 本提案手法の有効性を確認した.
著者
長井 敦 久野 義徳 白井 良明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.5, pp.1086-1095, 1997-05-25
被引用文献数
50

複雑に変動する背景を伴うシーンにおいても有効に機能する移動物体の検出手法を提案する. シーンの動き場において移動物体に対応する部分は, 空間方向に一様で, かつ滑らかに移動することを利用して検出を試みる. オプティカルフローを抽出し, 空間的に均一なフローをもつ領域を切り出して, 得られた領域が移動物体(若しくはその一部)であると仮定する. その後の予測される時空間上の位置に投票を行うことにより, シーン内を横切ったものだけを移動物体として検出する. 背景変動の程度に応じて, 適応的に検出の際の投票値のしきい値を決定する. 移動物体に対して等速直線運動の拘束を与える場合と, 加速度への対応のための拡張手法のそれぞれについて述べる.
著者
宮森 恒 粕谷 英司 富永 英義
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.6, pp.1590-1599, 1997-06-25
被引用文献数
32

本論文では, 動作語を用いた問合せを受け付ける映像検索方式を提案する. 提案方式は,「だれだれが〜するシーンを検索せよ」といった動作に関連した問合せと, それが暗示する物体の位置関係とその時間変化に着目し, これを動き関連の言葉と階層的に対応づけ, 照合することによって映像の内容検索を実現するものである. 本方式は, 物体の近似手法により種々の映像へ適用可能と考えられ, 単純なキーワード検索ではカバーしきれない映像の内容にまで踏み込んだ内容検索機能をユーザに提供できる点が特徴である. ここでは, テニス2試合90ポイント分の中継映像を例とし, 映像インデキシングの自動化・半自動化が比較的容易に行えること, テニスの動作判定に不可欠なボールのインパクト時刻の検出に, 前/後方選択型の速度ベクトルが効果的であることを実験的に示した. また, テニスの中継映像を用いた検索実験によって, 定義した10の動作語について全体として4.8%の検出誤り, 1.9%の検出もれといった結果が得られ, 提案手法によって映像の内容検索が有効に実現できることを示した.
著者
佐川 浩彦 酒匂 裕 大平 栄二 崎山 朝子 阿部 正博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.4, pp.753-763, 1994-04-25
被引用文献数
58

聴覚障害者と健聴者のコミュニケーション支援を目的として,手話通訳システムの開発を行っている.手話通訳システムでは手話から日本語への変換を行うために,手振りの情報からその中に表現されている手話単語を認識する必要がある.本システムでは,データグローブから入力した手話パターンと,あらかじめ登録してある手話単語パターンを音声認識で一般的な連続DP照合を用いて照合することにより,手話単語を認識する.しかし,データグローブからの入力データ量が多いため,通常の連続DP照合ではリアルタイムな認識が困難になる.そのため,手話パターンの動的な特徴に基づいたパターン圧縮を行い,圧縮パターン同士を直接照合する圧縮連続DP照合を開発した.本方式の有効性を検証するため,単語数17語の連続手話認識実験と単語数620語を用いた大語い手話単語認識実験を行った.この結果,従来の連続DP照合の認識率と比較して精度の低下がなく,認識時間としては実測で約1/16に短縮できることが確認できた.更に,大語い認識実験においても98.7%の認識率が得られ,本方式の有効性を確認できた.
著者
竹野内 紋子 中島 真人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.9, pp.2402-2410, 1997-09-25
参考文献数
7
被引用文献数
1

本論文では, 3次元物体を多方向からコード化する2色格子投影法と, それによって得られる情報を用いて, 3次元物体を識別する手法を提案する. 本法は, 3次元物体にしま模様を投影し, それを2次元にコード化する手法であるところのグリッドコーディング法を発展させたものである. これはオクルージョンの低減を目的として提案されたものであり, 多方向から観察した物体の情報を, 投影格子に色情報を付加することによって同時取得可能としている点が特長である. 更に3次元物体の識別過程では, コード化画像のパワースペクトルが対象物体の3次元形状を反映したパターンとなることを利用し, それから物体の平面内での回転や平行移動の影響を受けにくい特徴量を抽出している. そして, 特徴量の微妙な変化へ対応するため, ニューラルネットワークの汎化機能を利用して識別を行っている. 識別に用いる際の問題点を考察するために単純な形状の被験体を用いた識別実験を行ったところ, 識別率で約95%なる結果を得ることができた.
著者
笠尾 敦司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.78, no.2, pp.221-228, 1995-02-25
被引用文献数
12

画像の加工を目的とした画像編集作業を行う前に,加工すべき領域を指定しやすくするために画像を絵柄に応じた小さな領域に分割しておくことは有益である.その技術として領域分割アルゴリズムの利用が考えられる.しかし,画像編集で扱う画像は非常に大きいため,既存のK-平均アルゴリズムを画像編集の前処理に応用すると,大きな作業メモリと極端に長い処理時間が必要になる.そこで,大きな画像を小方形領域に分割して処理を進める分割K-平均アルゴリズムを開発した.小方形領域の境界で生じる分割領域のつながりの悪さを解消するため,小方形領域の間に境界領域を設け,既に分割し終わった境界領域の分割結果と,分割領域の情報を記録した分割領域テーブルを参考にし,K-平均アルゴリズムで分割処理を進める手法を開発した.本分割K-平均アルゴリズムを利用することで,少ない作業メモリで高速に領域分割処理を実行できるようになった.
著者
鷹見 淳一 嵯峨山 茂樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.10, pp.2155-2164, 1993-10-25
被引用文献数
109

本論文では,HMMを用いた音素認識において,従来知識や経験,あるいはゆう度とは異なる尺度に基づいて決められていた認識単位やモデルの状態共有構造を,モデルパラメータと合わせてすべてを同時に学習・形成することのできる逐次状態分割法(SSS)と,SSSにより自動生成される表現効率の高い異音モデルである隠れマルコフ網(HMnet)を用いた音素認識手法を提案する.HMnetを用いた日本語26音素に対する音素識別実験では,従来の混合ガウス分布音素HMMを上回る認識性能が得られ,本手法の有効性を確認した.
著者
柏野 邦夫 中臺 一博 木下 智義 田中 英彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.11, pp.1751-1761, 1996-11-25
被引用文献数
70

音楽演奏の音響信号を対象として演奏情報を認識する試みとしては,従来自動採譜の研究が行われているが,複数種類の楽器音を含む音楽演奏を対象とする場合には,認識処理の有効性は極めて限られていた.そこで本論文では,複数種類の楽器音を含む音楽演奏の認識を音楽情景分析の問題としてとらえ,その解決を図る.ここで音楽情景分析とは,音楽演奏の音響信号から,単音や和音などの音楽演奏情報を記号表現として抽出することを指す.本論文ではまず,音楽情景分析を実現する上では情報統合の技術が不可欠であるとの認識から,ベイジアンネットワークによる情報統合の機構を備えた音楽情景分析の処理モデルOPTIMAを提案する.次に,特に単音の認識に的を絞って,提案する情報統合機構の有効性を示す.
著者
神尾 広幸 松浦 博 正井 康之 新田 恒雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1429-1437, 1994-08-25
被引用文献数
31

本論文では,音声入出力を中心としたマルチモーダル対話システムMultiksDialについて述べる.このシステムは,入力手段に音声認識装置とタッチパネル,出力手段に音声規則合成装置とディスプレイを備え,入出力の双方をマルチモーダル化していることが特長である.また補助入力手段に光電センサを使用し,ユーザの状況を検知しながら操作ガイダンスを提示することによって,スムーズな対話を実現している.MultiksDial上に情報案内システムを構築し,ユーザインタフェースの操作性を評価する.入力手段の比較実験結果から,直接指示可能な音声入力は,階層的な指示を必要とするタッチ入力よりも速く操作を完了できること,また初心者では,操作ガイダンスを合成音声で提示することにより,スムーズな対話が行えることを示す.これらの事実から,対話チャネルのマルチモーダル化は,ユーザとシステムとの対話をより効率よく行うのに有効であることが確認された.
著者
杉村 昌彦 飯国 洋二 足立 紀彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.1, pp.101-108, 1997-01-25
被引用文献数
11

イメージマッチングとは, 異なる状況下で得られた2枚の画像間の対応点を探索し, 対応関係を表す写像を見つけることであり, 画像処理における基本的問題の一つである. 本論文では, ツェルニケモーメントを特徴量とする2次元動的計画法を使って, 2次元の変形を含んだ2枚の階調画像の対応点を探索する方法を示す. この動的計画法では, 画像を複数の円形領域で区切り, その円形領域を対応単位とする. そして, 直線上の領域を曲線上の領域に対応させることで, 画像の局所的な平行移動, 伸縮成分を吸収する. また, 各円形領域の特徴量として回転に不変なツェルニケモーメントを用いることで, 画像の局所的な回転成分を吸収する. 計算機実験により画素を対応単位とする従来法に比ベ, 計算量が削減できると共にマッチング精度が向上することを確認した.
著者
大脇 崇史 中坊 嘉宏 並木 明夫 石井 抱 石川 正俊
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.5, pp.918-924, 1998-05-25
被引用文献数
18

実環境にある物体の視覚情報をリアルタイムに触覚情報に変換することにより, 物体に仮想的に触れることができるシステムを構築した.このシステムは, アクティブビジョンによって実環境にある対象物の局所的な視覚情報を得て, 高速並列画像処理システムで処理した後DSPシステムを介して視覚情報を対象物からの仮想的な反力に変換し, 触覚提示装置を用いて指先に反力を与えることで仮想的な接触を実現するものである.本システムでは, 独自に開発した高速画像処理システムを用いることにより, 視覚情報のセンシングから触覚提示までのループが約200Hzで動作する.本論文では, モダリティ変換の基本構造を述べた上で, システムの構成を示し, 最後にシステムの動作を確認するために4種類の2次元物体について行った形状をなぞる実験について, その結果を述べる.
著者
磯部 義明 大久保 なつみ 山本 眞司 鳥脇 純一郎 小畑 秀文
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.2, pp.279-287, 1993-02-25
被引用文献数
50

癌領域を同心円形孤立性陰影と仮定し,これを選択的に抽出するQuoit(輪投げ)フィルタを新たに開発した.このフィルタはいわゆるMorphologyフィルタの一変形であるが,(1)入力画像として同心円形でかつ中心から周辺に向かって単調減少するモデルを仮定した場合,フィルタ出力が解析的に表現できる特徴をもっている(結果が予測できる),(2)このフィルタを2回連続して適用すると,上記モデル画像を選択的に復元する能力を有する,などの興味ある事実を明らかにした.次いでこのフィルタを乳癌X線陰影抽出に応用し,12症例全例の乳癌部分を正しく抽出することを実証した.