著者
先山 卓朗 大野 直樹 椋木 雅之 池田 克夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.2, pp.248-257, 2001-02-01
参考文献数
12
被引用文献数
41

複数台のカメラにより撮影される遠隔講義において, 遠隔地に送信すべき映像を選択するという作業は, 現在主に講義を行う講師自身により行われており, 講師にとって大きな負担となっている.そこで, 本論文ではこの作業を自動化する手法を提案する.まず, あらかじめ定義した講義状態の遷移系列により講義状況を表し, その講義状況とそれに応じた送信映像との関係をルール化する.講義状態は, 実際の講義の情景から容易に観測可能な情報を組み合わせて構成するため, 抽出された講義状態系列と作成したルールをマッチングさせることにより, 講義の内容理解にまで踏み込むことなく, 適切な映像を選択することが可能となる.黒板, OHPを利用した模擬講義に対して実験を行い, 本手法により実時間での送信映像選択が可能であることを示した.
著者
西川 大亮 兪 文偉 横井 浩史 嘉数 侑昇
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.9, pp.1510-1519, 1999-09-25
被引用文献数
23

本論文では筋電義手制御のための新しい学習法を提案する.従来研究されている筋電義手の制御手法は,切断者に対する義手適用訓練と義手に対する個人差の学習を別々に行うOff-line型である.そのため切断者は訓練中においては義手操作の感覚をつかみづらく,使用中は義手を自身の変化に追従させるのが困難であった.そこで本論文では実時間で学習を行うOn-line型の学習機構を設計する.本手法では切断者本人が使用中に与える評価から,義手装置は表面筋電位と動作の間の適切な写像関係を獲得する.これにより訓練時間の短縮と個人差への適応を実時間で実現する.本論文では手法の検証のために6種類の動作識別実験を行っている.まず前腕の運動イメージを用いた実験を行い,従来のOff-line型の手法と比較している.更に上腕での切断者を意識して,肩甲帯の運動から筋電信号を取り出し義手駆動実験を行っている.実験における前腕での識別率は提案手法で89.9%,従来法で80.3%であった.また提案手法における肩甲帯での識別率は79.3%の性能が達成されており,上腕切断者に対する本筋電義手制御法の適用の可能性が確かめられている.
著者
井関 文一 バイガルマ ツァガーン 小畑 秀文 大松 広伸 柿沼 龍太郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.9, pp.1533-1535, 1999-09-25
被引用文献数
20

本研究では,胸部CT画像から肺野内の血管の3次元木構造を抽出する方法を示す.先に我々が提案した再帰的領域探索法を用いた方法では,必ず探索開始領域を探索に先立って決定する必要がある.今回我々は,肺野内の血管を抽出する際に,心臓から肺野内への血管の侵入部分である肺門部の位置を気管支形状との関係から推測し,肺門部における血管の断面領域を探索開始領域とするアルゴリズムを開発した.更に,このアルゴリズムにより,気管支と同様に血管の自動抽出が可能であることを示す.
著者
東海林 健二 矢野 将哉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.9, pp.2393-2401, 1997-09-25
被引用文献数
2

2次元2値画像のアフィン変換アルゴリズムの一つとして, 画像をPXY表と呼ばれるラン形式で表し, skewと転置を組み合わせて行う効率の良い方法を我々は以前に提案した. 本論文では, SPXY表と呼ばれる3次元ラン形式で表した3次元物体(3次元2値画像)のアフィン変換の新しいアルゴリズムを提案する. SPXY表は2次元のPXY表を積み重ねたものである. SPXY表の上でのアフィン変換は, 2次元PXY表の場合の拡張として, 3次元skewと転置の組合せとして実現される. 実験結果は, ボクセルごとに変換を行う素朴な方法に比べ, 提案手法が36〜389倍高速であることを示している. また, 提案手法によるアフィン変換のCPU時間は3次元物体を表すラン数に比例することを示している. 提案手法によるアフィン変換の結果は, 小数点数を整数に四捨五入したときの丸め誤差より大きい誤差を含む. アフィン変換のうちでも最もよく用いられる3次元回転について誤差解析を行った. その結果, 提案手法による各座標の絶対誤差は最大1.4であった.
著者
新妻 弘崇 石井 信 伊藤 実
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.12, pp.2375-2384, 1999-12-25
被引用文献数
2

本研究では,ニューラルネットワークに基づく新しい組合せ最適化問題の解法を提案する.特に2次割当て問題に対して適用する.本手法は,順列のλ個の要素を同時に入れ替えるλ-optヒューリスティックスのアナログ版とみなすことができる.λの値として中程度の値を使うことができるため,中距離サーチを実現できる.この中距離サーチは,浅い局所最適解を乗り越えることができる.比較的大きな(N=80∼150)2次割当て問題に対してこの手法の計算機実験を行った結果,我々の新しい手法は今までのチャンピオンのアルゴリズムと同程度に良い近似解を計算できることがわかった.また,二つのべンチマークについては,現在のチャンピオンのアルゴリズムよりも良い解が計算できることがわかった.
著者
新堀 英二 高木 幹雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.76, no.9, pp.1932-1940, 1993-09-25
被引用文献数
39

離散的コサイン変換(DCT)を用いたGerchberg-Papoulis(GP)の反復法を適用した画像拡大法"IM-GPDCT"を提案し,その特性を評価した.従来用いられてきた補間法による拡大画像は,観測過程において失われた空間的高周波成分を復元することが原理的に不可能なため,画質劣化が避けられなかった.IM-GPDCT法は観測時に失われた空間的高周波成分を復元する概念を用いることにより拡大画像の画質を改善する.IM-GPDCT法では,周波数帯域拡張の基本原理としてGP反復法を用いており,画像をDCTにより正逆両方向に変換する過程において,画像の広がりが有限であることと空間的低周波成分の正しい情報が既知であることの二つの拘束条件を用いて空間的高周波成分を復元する.提案手法と3種の従来法(補間法)を再生誤差と拡大画像の画質の観点から比較した.その結果,IM-GPDCT法は再生誤差の観点から補間法よりも優れていること,また,拡大画像の画質は鮮鋭さ,ジャギーのないエッジ再現やテクスチャの再現性に優れていることが示された.
著者
青木 美奈 藤田 昌彦 町澤 朗彦 皆川 双葉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.10, pp.2338-2345, 2001-10-01
被引用文献数
1

サッカード中には, 網膜に写った外界の像は激しく揺れ動いているにもかかわらず, 我々はその動きを知覚することはない.このサッカード抑制という現象について, 従来から様々な実験が行われてきており, その要因には中枢性の抑制説, マスキング説などが考えられてきた.本論文では, 水平サッカード中に色縞のパターンを垂直, 水平にして瞬時呈示し, その判別をさせる実験を行って, サッカード中にも視覚が成立していることを示した.また, 背景輝度を様々に変化させた実験も行い, 輝度差によるマスキングの効果を確認した.これらの実験結果より, サッカード中の知覚が低下する要因として, 主にマスキングが働き, 更に網膜像の濁りや中枢性の抑制も多少なりとも存在し, それらが合成されていることを単一の実験手法で確認できた.
著者
岡 隆一 西村 拓一 張 建新 伊原 正典
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.86, no.6, pp.764-775, 2003-06-01
被引用文献数
21

語彙に依存しない音声の検索方式を二つ取り上げ,それらの性能を比較する.検索方式の二つとは,検索対象の音声データベースと音声クエリー波形の双方について,各フレームの表現が分析フレーム特徴そのものとしてそれを用いるものと,フレーム特徴から音素々に変換したものを用いるもの,である.フレーム系列表現された検索対象の音声データベースと音声クエリーとの間では連続DPによるスポッティング処理が適用される.連続DP値のローカルピークを検出し,それの抽出する音声データベース中の重なりのない音声区間を検索出力とする.日常会話の発話音声を検索対象者音声データとし,音声クエリーによる検索実験を行った.より高い検索性能を与える方式は各フレーム特徴を音素記号に変換した方式であることが明らかになった.
著者
和田山 正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.88, no.2, pp.170-187, 2005-02-01
被引用文献数
11

本論文は, 記憶性の通信路の一種であるバースト誤り通信路に適した反復復号法の原理, 並びにこの分野の研究動向に関する紹介を目指したものである.論文の前半では, バースト通信路モデル, 既存のバースト誤り訂正手法, LDPC符号の基礎などについて述べる.後半では, Belief Propagationに基づく記憶性の通信路に適した反復復号法の原理を紹介したのち, 具体例としてギルバート通信路, 二次元バースト通信路に適した反復復号法についてその詳細を示す.
著者
戸崎 哲也 河田 佳樹 仁木 登 大松 広伸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.8, pp.1327-1338, 1999-08-25
参考文献数
22
被引用文献数
82

近年, ヘリカルCT技術の開発により, 3次元CT画像診断に大きな関心と期待がもたれている. この中で, 計算機を活用した3次元CT像を解析する手法が求められている. ここでは, 肺がん診断に有益な情報を提供する胸部3次元CT像の解析法について述べる. 肺野領域は気管支, 肺動脈, 肺静脈などの臓器から構成され, 肺がんなどの病変が存在しているとそれらが複雑に絡み合った状態となっている. そこで, 胸部3次元CT像から解剖学的知識と3次元画像処理手法を用いて気管支, 肺動脈, 肺静脈を抽出して分類し, これらと肺がん候補との関係を呈示する手法について述べる. 肺野内臓器の抽出は, バイアス成分除去, 気管支・肺血管の抽出2気管支と肺血管の分離, 肺血管の肺動脈と肺静脈の分離からなる. また, 肺がん候補とそれに接触する肺野内臓器との関係を数値的に呈示する. これらを健常肺及び肺がんの3次元CT像に適用して有効性を示す.
著者
秦東寺 久美 石橋 聡 小林 直樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.6, pp.1018-1030, 1999-06-25
被引用文献数
20

次世代動画像圧縮の標準であるMPEG-4では, 新たにVOP (Video Object Plane)という概念を取り入れ, 背景や物体等のビデオオブジェクトごとに符号化することが可能である. 特に動画像中の各々のフレームに共通な領域の動きが一組の平面の動きモデルで表されるとき, スプライトと呼ばれる平面オブジェクトを生成することが可能である. すなわち, 背景画像に代表されるような動画像中の複数フレームにわたる領域を1枚の静止画であるスプライトから再構成できる. スプライトを使用すると符号化効率の大幅な改善が期待できるため, スプライト生成技術に関する期待は大きい. 本論文では, ビデオクリップを撮影したときのカメラモーションに着目し, (1)7種類のカメラモーションと平行移動動きベクトルの関係を定式化し, (2)カメラモーションを反映した大局的な動きを算出するアルゴリズムを提案, (3)大局的な動きを用いてスプライトを自動生成するアルゴリズムを提案した. また, 複数の実画像を用いて実験を行った結果, 撮影時のカメラモーションを良好に抽出でき, これを用いてスプライトを自動生成することができた.
著者
箕浦 大祐 山名 岳志 正木 茂樹 一之瀬 進
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.5, pp.962-971, 1998-05-25
被引用文献数
15

ネットワークを介して接続されている各端末にコンピュータグラフィックスを用いて表示される利用者参加型の3次元仮想空間において, 大規模な人数が参加することによって生じるシステムのネットワーク負荷を軽減し, かつそれだけの人数の分身を仮想空間内に見えるようにするためのシステムの設計方法について述べる.仮想空間に利用者の分身を登場させるためにはその分身の仮想空間における位置情報をはじめとする利用者情報をサーバで管理して各利用者の端末に送信する必要がある.そのため通信回線容量と利用者端末の計算機能力の制限から実際にシステム上で有効なサービスを展開するためにはシステムへの利用者の参加者数には限界がある.本論文では, 仮想空間をいくつかの部分領域に分割して利用者の位置情報を管理し, 領域内に存在する利用者は従来どおりサーバから位置情報をもらって分身モデルを表示し, 領域外の利用者は画像によって表示することによってサーバと利用者端末間の通信量を抑える3次元仮想空間における多人数表示方法を提案する.本手法を用いて構築したシステムにおいてサーバと利用者端末の間の通信量および利用者端末の描画時間を計測し, 本提案手法の有効性を確認した.
著者
中島 康之 陸 洋 菅野 勝 柳原 広昌 米山 暁夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.5, pp.1361-1371, 2000-05-20
被引用文献数
23

キーワードスポッティングやコンテンツベースのオーディオビジュアル検索システムにおいては動画像のショット切換り点の検出やオーディオ情報の自動分類が非常に重要な課題になる.本論文では, MPEG符号化データからオーディオ情報をサブバンド上で高速に分類する手法を提案する.まず無音区間をサブバンドエネルギーの分散を用いて検出し, 次に有音区間に対してサブバンドデータの時間的エネルギーの疎密度, 平均サブバンド数とサブバンド重心を用いて音楽, 音声, 歓声雑音の3種類のクラスに分類した.識別法としてはクラス数や識別条件が増加するに従い複雑になるしきい値法に代わってBayes決定における正規分布に対する最適識別関数を用いた.分類実験では, MPEGオーディオデータを1秒単位に分類し, 90%以上の精度で無音や音声区間を検出することができ, 検出処理はMPEGオーディオ復号処理時間の1/6以下で検出が可能になった.
著者
長井 敦 久野 義徳 白井 良明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.5, pp.1086-1095, 1997-05-25
被引用文献数
50

複雑に変動する背景を伴うシーンにおいても有効に機能する移動物体の検出手法を提案する. シーンの動き場において移動物体に対応する部分は, 空間方向に一様で, かつ滑らかに移動することを利用して検出を試みる. オプティカルフローを抽出し, 空間的に均一なフローをもつ領域を切り出して, 得られた領域が移動物体(若しくはその一部)であると仮定する. その後の予測される時空間上の位置に投票を行うことにより, シーン内を横切ったものだけを移動物体として検出する. 背景変動の程度に応じて, 適応的に検出の際の投票値のしきい値を決定する. 移動物体に対して等速直線運動の拘束を与える場合と, 加速度への対応のための拡張手法のそれぞれについて述べる.
著者
宮崎 英明 亀田 能成 美濃 導彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.10, pp.1598-1605, 1999-10-25
被引用文献数
40

講義室に配置された複数の首振りカメラの制御とそれらの映像の切換えにより,複数のユーザがそれぞれ望むように実時間で講義を映像化する方法について述べる.講義を映像化するとき,ユーザが見たい対象は講義の状況によって変わってくる.状況に応じて各ユーザが見たい対象や撮影の方法は変化するが,カメラ台数が限られているので,いくつかのカメラワークだけを選択する必要がある.次に,選択されたカメラワークで各カメラの制御と映像の切換えを行うが,このときの映像の急激な変化の解消法について述べる.
著者
千葉 直樹 蚊野 浩 美濃 導彦 安田 昌司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.10, pp.1581-1589, 1999-10-25
被引用文献数
56

複数の静止画像からパノラマ画像を自動合成する手法を提案する.我々の手法は従来手法よりも処理が高速で,かつ自由なカメラ運動で撮像された奥行の深いシーンでも合成可能である.これを実現するために画像特徴 (小方形領域) を用いた,次の二つの特長を有する手法を提案する.第1は,階層的オプティ力ルフロー推定に基づいて画像特徴の対応を得た後,線形解法により変換行列を算出する高速な変換行列算出方法である.この方法により,画像間の幾何学的な変形を高速かつ正確に行うことが可能になった.第2は,シーンが単一平面で近似できない場合に,画像特徴を頂点とする三角パッチに分割し,各パッチごとに平面射影変換行列を算出することで,奥行が深いシーンへの対応を可能としたことである.ここで,平面射影変換行列を求めるためには,通常4組の対応点が必要であるが,3組の対応点がら算出する手法を提案する.最後に実画像を用いた実験により,本手法の有効性を示す.
著者
宮森 恒 粕谷 英司 富永 英義
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.6, pp.1590-1599, 1997-06-25
被引用文献数
32

本論文では, 動作語を用いた問合せを受け付ける映像検索方式を提案する. 提案方式は,「だれだれが〜するシーンを検索せよ」といった動作に関連した問合せと, それが暗示する物体の位置関係とその時間変化に着目し, これを動き関連の言葉と階層的に対応づけ, 照合することによって映像の内容検索を実現するものである. 本方式は, 物体の近似手法により種々の映像へ適用可能と考えられ, 単純なキーワード検索ではカバーしきれない映像の内容にまで踏み込んだ内容検索機能をユーザに提供できる点が特徴である. ここでは, テニス2試合90ポイント分の中継映像を例とし, 映像インデキシングの自動化・半自動化が比較的容易に行えること, テニスの動作判定に不可欠なボールのインパクト時刻の検出に, 前/後方選択型の速度ベクトルが効果的であることを実験的に示した. また, テニスの中継映像を用いた検索実験によって, 定義した10の動作語について全体として4.8%の検出誤り, 1.9%の検出もれといった結果が得られ, 提案手法によって映像の内容検索が有効に実現できることを示した.
著者
佐川 浩彦 酒匂 裕 大平 栄二 崎山 朝子 阿部 正博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.4, pp.753-763, 1994-04-25
被引用文献数
58

聴覚障害者と健聴者のコミュニケーション支援を目的として,手話通訳システムの開発を行っている.手話通訳システムでは手話から日本語への変換を行うために,手振りの情報からその中に表現されている手話単語を認識する必要がある.本システムでは,データグローブから入力した手話パターンと,あらかじめ登録してある手話単語パターンを音声認識で一般的な連続DP照合を用いて照合することにより,手話単語を認識する.しかし,データグローブからの入力データ量が多いため,通常の連続DP照合ではリアルタイムな認識が困難になる.そのため,手話パターンの動的な特徴に基づいたパターン圧縮を行い,圧縮パターン同士を直接照合する圧縮連続DP照合を開発した.本方式の有効性を検証するため,単語数17語の連続手話認識実験と単語数620語を用いた大語い手話単語認識実験を行った.この結果,従来の連続DP照合の認識率と比較して精度の低下がなく,認識時間としては実測で約1/16に短縮できることが確認できた.更に,大語い認識実験においても98.7%の認識率が得られ,本方式の有効性を確認できた.
著者
堀田 健一 岩田 彰 松尾 啓志 鈴村 宣夫
出版者
電子情報通信学会情報・システムソサイエティ
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 = The transactions of the Institute of Electronics, Information and Communication Engineers (ISSN:09151923)
巻号頁・発行日
vol.75, no.3, pp.545-553, 1992-03-25
被引用文献数
37

一般にニューラルネットが大規模になると,結合数が急速に増加し,また学習の収束が困難になるなどさまざまな問題が生じる.これを改善するために我々は,ベクトル量子化ニューラルネットと階層型ニューラルネットを組み合せたCombNETと名づけたネットワークモデルを提案している.しかし,前段のベクトル量子化ニューラルネットにおけるカテゴリーの大分類が均等にならないという問題が生じた.本論文ではこの問題を解決する手法として,自己増殖型ニューラルネットと呼ぶベクトル量子化ニューラルネットを考案し,このネットワークを適用したCombNET- IIを提案する.このネットワークの利点は二つある.まず第1に,前段で各グループに属するカテゴリーがほぼ均等になるように分割されることである.また第2には,分類するカテゴリーの増減にニューロンの数を柔軟に対応させて変化する点にある.今回はこのCombNET-IIをJIS第1,2水準印刷漢字の識別に適用し,前段における大分類の様子,カテゴリー数の変動に対する能力および識別率の検証を行った.
著者
竹野内 紋子 中島 真人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.9, pp.2402-2410, 1997-09-25
参考文献数
7
被引用文献数
1

本論文では, 3次元物体を多方向からコード化する2色格子投影法と, それによって得られる情報を用いて, 3次元物体を識別する手法を提案する. 本法は, 3次元物体にしま模様を投影し, それを2次元にコード化する手法であるところのグリッドコーディング法を発展させたものである. これはオクルージョンの低減を目的として提案されたものであり, 多方向から観察した物体の情報を, 投影格子に色情報を付加することによって同時取得可能としている点が特長である. 更に3次元物体の識別過程では, コード化画像のパワースペクトルが対象物体の3次元形状を反映したパターンとなることを利用し, それから物体の平面内での回転や平行移動の影響を受けにくい特徴量を抽出している. そして, 特徴量の微妙な変化へ対応するため, ニューラルネットワークの汎化機能を利用して識別を行っている. 識別に用いる際の問題点を考察するために単純な形状の被験体を用いた識別実験を行ったところ, 識別率で約95%なる結果を得ることができた.