著者
馬場口 登 堀江 政彦 上田 俊弘 淡 誠一郎 北橋 忠宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.3, pp.791-800, 1997-03-25
被引用文献数
41

本論文では, ユーザが現在地から目的地までの経路を理解するための支援システムとして, 略地図とその案内文を生成するシステムSKETISTを提案する. SKETISTは, データベース部, インタフェース部, および処理モジュール部からなる. データベース部には, 原地図画像を表すベクトル地図画像ベースと構造化データである道路ネットワークの二つがある. 処理モジュール部は, 道路ネットワーク抽出, 経路探索, 略地図生成, 案内文生成から構成される. 経路理解に主たる役割を果たす略地図とその案内文は, ベクトル地図画像ペースから自動的に生成される道路ネットワークを基礎データとして作成される. SKETISTの特徴は, 種々の処理段階でユーザの要求を反映できる設計となっていること, および相対する情報伝達特性を有する画像・図形メディアと言語メディアの統合システムとなっていることである. 提案システムを実装して動作検証を行った結果, ユーザの要求を反映した経路を探索し, 図形情報, 記号情報の双方を操作することにより任意の複雑さの略地図と案内文が良好に生成されることを確認した.
著者
船田 哲男 続木 貴史
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.11, pp.2184-2187, 1999-11-25
被引用文献数
9

耐雑音性をもった特徴を音声から抽出することを目的とし,パワースペクトルの周波数軸に関する傾斜に着目した特徴量を提案した.この特徴抽出過程で行うスペクトル傾斜に対するしきい値操作が,耐雑音性に効果をもつことを,単語音声認識実験で確認した.
著者
森 敏生 甲斐 昌一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J85-D2, no.6, pp.1093-1100, 2002-06-01

本論文では人の脳の確率共鳴現象の存在を,脳波の雑音効果から研究した.ここでは α 波周波数(fα)に見られる引込み現象を利用し,α 波に近い周期刺激では引込み現象が被験者の感情や体調などの影響を受けやすいので,その影響の少ない倍周期引込みを対象とした.実験は,中枢神経系・脳内部で確率共鳴現象が起こることを明確に示すために,周期光刺激を右眼に雑音光を左眼に印加した.この際,右眼の弱い光刺激のみでは α 波の引込みを起こさない.この状態で左眼の雑音光強度を可変にすると,ある適度な強度で脳波は引込みを起こし,スペクトル中に刺激周波数(fs)の倍周波に鋭いピークが観測される.更に強い雑音を加えるとこの鋭いピークは消え,引込みからはずれることが観測された.各雑音光強度に対してこのスペクトル振幅をプロットすると確率共鳴現象で見られるベル型の変化を示した.この研究では周期及び雑音刺激が各々独立した入力点(左右眼)に印加されていることから,確率共鳴現象が視交差以降の視覚経路すなわち中枢神経系で起こっていると結論される.
著者
菅谷 史昭 竹澤 寿幸 横尾 昭男 山本 誠一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J84-D2, no.11, pp.2362-2370, 2001-11-01

音声翻訳システムの新たな評価手法として翻訳一対比較法を提案し,ATR音声翻訳通信研究所が研究開発した音声翻訳システムで評価した.言語翻訳部単体,音声認識部と言語翻訳部を結合した場合の翻訳一対比較法の評価結果を述べるとともに,音声認識誤りのシステム性能に与える影響を分析した.また,評価結果を文ごとの平均単語エントロピーを使い分析し,同システムで採用されたコーパスベース音声翻訳システム性能の特徴を明らかにした.また,翻訳一対比較法の誤差解析を行った.
著者
宮川 道夫 川田 洋平 Mario Bertero
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.7, pp.1512-1521, 2001-07-01
参考文献数
17
被引用文献数
10

チャープパルスと信号処理技術を用いて生体の内部構造及び温度変化量の分布を計測するチャープパルスマイクロ波CT(CP-MCT)によって獲得されるCT画像を数値計算により求める手法を開発した. ガウスパルスを用いて送受信アンテナ間の余効関数をFD-TD法により計算し, これに時間軸で入カチャープパルス信号を畳み込み, 実測と同様の信号処理を行って1点の計測信号を生成する. この計算を並進走査軸の各点で繰り返し, 投影データを得てCT画像を生成する. 余効関数法と名づけたこの計算手法の妥当性を, 分解能や温度変化量計測の実測結果とそれを模擬した計算結果とを比較することによって示した. 余効関数法を用いれば, 実測が困難な撮像系の点広がり関数を求めることも可能である. また, ヒト頭部の解析モデルを作成して減衰量分布や温度変化量分布のシミュレーションを行い, CP-MCTによる生体撮像の可能性について検討した.
著者
益子 貴史 徳田 恵一 宮崎 昇 小林 隆夫
出版者
Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.J83-D2, no.7, pp.1600-1609, 2000-07-20

隠れマルコフモデル(HMM)に基づいてピッチパターンとスペクトル系列を同時にモデル化及び生成する手法について述べる.ピッチパターンは,連続値をとる有声区間と値をもたない無声区間の時系列として表現されるため,通常のHMMではモデル化することができない.そこで本論文では,多空間上の確率分布に基づくHMM(multi-space probability distribution HMM: MSD-HMM)を適用し,ピッチパラメータとスペクトルパラメータを結合した特徴パラメータを用いてピッチとスペクトルを統一的にモデル化する手法を提案する.また,MSD-HMMにおける決定木に基づくコンテクストクラスタリング手法を導出し,ピッチやスペクトルの変動要因を考慮したモデルの構築手法について述べる.更に,ゆう度最大化基準に基づくパラメータ生成手法を用いることにより,実音声を近似したピッチパターン及びスペクトル系列を生成できることを示す.
著者
高橋 正樹 三須 俊彦 合志 清一 藤田 欣裕
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.8, pp.1672-1680, 2005-08-01
被引用文献数
22

画像内の物体(オブジェクト)抽出技術を用いて野球映像からボールを抽出し, その位置情報をもとに投球軌跡CGを作画する手法を考案した. 複数の画像間差分を利用して高速移動オブジェクトを抽出し, 様々な画像特徴のフィルタリングを行うことでボールオブジェクトのみをロバストに選定する. またカルマンフィルタと最小二乗法を併用したボールの位置予測処理を行い, 高速な自動追跡処理, 及び高輝度領域(打者のユニフォーム部分や白字広告部分等)での軌跡作画を実現した. 本手法を利用し, 投球軌跡作画装置(B-Motion)を開発した. 野球中継においては新たなカメラの設置やキャリブレーションの必要がないため, 運用が容易である. 2004年よりNHKプロ野球中継, スポーツ教育番組にて放送応用を実現している. 本論文ではまず高速なボール抽出・追跡手法について述べ, 続いて軌跡作画手法及び装置の構成や特徴について述べる. 最後に本装置を放送へ応用した結果を報告する.
著者
三浦 高志 熊岡 忍 松本 建太 下村 孝光
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.87, no.2, pp.608-618, 2004-02-01
参考文献数
11
被引用文献数
1

本論文は,適応的直交変換によるベクトル量子化において,ベクトル探索を高速化する方法を提案する.高速化の原理は,誤差ベクトルをより次元の低いベクトルに分割してから量子化を行う,積符号技術である.ベクトルの次元が低くなれば,同じ近似利得を与える辞書サイズが小さくなるので,候補ベクトル数が減少してベクトル探索が高速化される.また,辞書ベクトルを先頭要素の降順にソートしておき,誤差ベクトルの先頭要素値から直接的に候補ベクトルの範囲を限定して候補ベクトル数を削減する方法及び誤差ベクトルの画品質と目標画品質との差によって最適なサイズの辞書に切り換える方法を追加した.提案方式の有効性は数値実験により検証される.
著者
中島 淑貴 柏岡 秀紀 キャンベル ニック 鹿野 清宏
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J87-D2, no.9, pp.1757-1764, 2004-09-01

「非可聴つぶやき認識」という,新しいスタイルの実用的な入力インタフェースを提案する.これは音声認識の雑音に対する脆弱性,情報の周囲への漏えい性を克服するため,声帯の振動を伴う通常音声の空気伝搬ではなく,「非可聴つぶやき(Non-Audible Murmur: NAM)」,つまり第三者に聴取不能な声帯の振動を伴わない調音呼気音の体内伝導を,体表からサンプリングし,HMMを用いて認識するものである.これを実現するための基礎として,第一に医療用膜型聴診器の原理を応用した体表接着型マイクロホンを開発した.第二として体内を伝導するNAMを採取して認識するために最適な接着位置を発見した.第三としてNAMの音響学的性質を検討した.第四として,この部位から採取されたサンプルを用い,HMM音響モデルに追加学習してNAM音響モデルを作成した.これらをもとに,日本語ディクテーション基本ソフトウェアを評価に用い,認識エンジンJuliusを使用して大語い連続認識実験を行い,NAM認識の実用可能性を検討した.
著者
末永 貴俊 飯野 恵秋 黒田 知宏 大城 理 千原 國宏
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J83-D2, no.1, pp.324-332, 2000-01-25

超音波診断装置を用いて実時間で遠隔医療を行うためには,超音波診断動画像の伝送及び,計測用の超音波プローブを患者にあてる位置・角度などが リアルタイムで指示できる環境が必要である.特にプローブ操作については空間情報を直感的に伝える必要があり,既存の音声・画像通信技術だけでは伝達が困難である.そこで本論文では計測側の計測風景の上に超音波診断に用いられるプローブと同じ形のCG(CGプローブ)を重ね合わせ,診断側の専門医が遠隔地から計測者にプローブをあてる位置・角度などを教示するシステムを提案する.
著者
山口 高弘 坂野 寿和 藤井 竜也 安藤 裕 北村 正幸
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J84-D2, no.6, pp.1203-1212, 2001-06-01

遠隔医療コンサルテーションは,地方の診療所と中央の病院を結び,遠隔の医師に対して中央の専門医が診断支援を行うサービスである.本研究は,そうしたサービスを実現するために必要な機能を明らかにし,そうしたシステムを具現化することを目標としている.我々は,高速ネットワーク,医用画像データベース,超高精細画像読影ステーション,IPテレビ会議システムをベースとした遠隔医療システムを構築し,それをベースとして遠隔医療コンサルテーションシステムを開発した.開発したシステムを用いて,遠隔の2人の医師が同じ画像を参照しながら放射線治療に関して相談する遠隔医療コンサルテーション実験を行った.ネットワーク速度に依存しない高速な画像表示切換を実現する画像プリロード機能や,画像表示連携機能,共有ポインタ表示機能などシステム上に実装した連携機能の有効性を実験的に明らかにした.
著者
坂野 秀樹 陸 金林 中村 哲 鹿野 清宏 河原 英紀
出版者
電子情報通信学会
雑誌
電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.11, pp.2276-2282, 2000-11-25
参考文献数
8
被引用文献数
5

音声の位相情報を群遅延に基づいて表現することにより, 位相特性の制御を可能とする声質制御方式を提案する.提案方式は, 位相特性を群遅延領域で制御するため, 原音声の位相から零位相まで連続的に変化させることができる.また, 音声の特徴に基づき部分的に零位相化を行っているため, PSOLA法などの手法で見られる, ピッチ変換率を大きくしたときの劣化を軽減させることができる.ピッチ変換音声を作成して主観評価実験を行った結果, ピッチ変換率が1倍の場合に, 零位相合成, PSOLA法, 提案法のMOS値が, 男声の場合はそれぞれ3.6, 4.3, 4.3, 女声の場合はそれぞれ, 3.8, 4.2, 4.3であった.ピッチ変換率が3倍の場合には, それぞれの方式のMOS値が, 男声の場合に2.8, 2.4, 2.7, 女声の場合に1.6, 1.4, 1.7となった.これらの結果から, 提案方式は, ピッチ変換率が小さい場合には, PSOLA法に匹敵する高品質な音声が合成でき, ピッチ変換率を大きくした場合には, PSOLA法特有の劣化を減少させることができることがわかった.また, 本論文では, ピッチ変換を行った際にどのように位相特性を変化させるのが適当であるかについても検討し, ピッチを上昇させた際に位相特性を零位相に近づけると, 劣化が若干抑えられることがわかった.
著者
堀 智織 加藤 正治 伊藤 彰則 好田 正紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.11, pp.2407-2417, 2000-11-25
参考文献数
9
被引用文献数
9

本論文では, 確率文脈自由文法(Stochastic Context Free Grammar:SCFG)を大語彙連続音声認識に適用する手法として, 文節単位の係り受け制約をもつSCFGを提供する.SCFGは, N-gramのような局所的な制約だけでなく, 文全体にわたる大局的な制約をも記述できることから, 非常に表現力の高い言語モデルとして知られている.しかし, SCFGのパラメータ推定にはInside-Outsideアルゴリズムを用いる必要があり, 非終端記号数の3乗, かつ入力系列長の3乗に比例する莫大な計算量を要する.そのため, SCFGは大量のテキストコーパスから推定することが難しく, これまで大語彙連続音声認識用の言語モデルとして利用されることはほとんどなかった.提案する文節単位の係り受けSCFGは, Inside-Outsideアルゴリズムの計算量を係り受けの制約により非終端記号数の2乗に, 文節単位の導入により更にその約1/8に削減できる有効なモデルである.EDRコーパスを用いた実験では, 提案法を含む各種SCFGの性能とパラメータ推定に要する処理量を比較し, 提案法が計算量を大幅に削減しつつ, パープレキシティがほとんど増加しいことを示す.毎日新聞コーパスを用いた実験では, 大規模な文節単位の係り受けSCFGを構築し, 大語彙連続音声認識システムに実装する.そして, 語彙サイズ5000の音声認識実験を行い, SCFGによる認識性能はTrigramには及ばないものの, Trigramと併用した場合にはTrigram単独の場合に比べて約14%の単語誤りを削減できることを示す.
著者
森 敏生 甲斐 昌一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.85, no.6, pp.1093-1100, 2002-06-01
参考文献数
26
被引用文献数
1

本論文では人の脳の確率共鳴現象の存在を,脳波の雑音効果から研究した.ここではα波周波数(f_α)に見られる引込み現象を利用し,α波に近い周期刺激では引込み現象が被験者の感情や体調などの影響を受けやすいので,その影響の少ない倍周期引込みを対象とした.実験は,中枢神経系・脳内部で確率共鳴現象が起こることを明確に示すために,周期光刺激を右眼に雑音光を左眼に印加した.この際,右眼の弱い光刺激のみではα波の引込みを起こさない.この状態で左眼の雑音光強度を可変にすると,ある適度な強度で脳波は引込みを起こし,スペクトル中に刺激周波数(f_s)の倍周波に鋭いピークが観測される.更に強い雑音を加えるとこの鋭いピークは消え,引込みからはずれることが観測された.各雑音光強度に対してこのスペクトル振幅をプロットすると確率共鳴現象で見られるベル型の変化を示した.この研究では周期及び雑音刺激が各々独立した入力点(左右眼)に印加されていることから,確率共鳴現象が視交差以降の視覚経路すなわち中枢神経系で起こっていると結論される.
著者
山田 憲嗣 高橋 秀也 志水 英二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-2, 情報・システム 2-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.11, pp.2986-2994, 1997-11-25
参考文献数
8
被引用文献数
3

本論文では, 短波長域における結像法として利用されている符号化開口法を可視光域に適用し, 物体の位置と物体表面の3次元形状を検出する手法について述べる. 本手法は物体から開口面までの距離により, 投影面上に映る開口面の大きさが変化する特性を用い, 開口面から物体までの距離を検出する. この距離検出を対象物体の表面の各画素に拡張することで物体表面の3次元形状を検出する. 実際に, 短波長域で用いる符号化開口法を可視光域で用いることができる条件を考察し, 試作システムを構築して3次元物体の形状を検出した. 提案する検出法は, 両眼視法とは異なり, 物体の反射光だけを利用した単眼視法であるので, 簡単な測定システムで3次元形状検出を実現することができる. また, 光だけでなく波動の性質をもつものであれば可視でも不可視でも本手法を利用し, 3次元形状検出を行うことが可能である.
著者
日浦 慎作 松山 隆司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.11, pp.1912-1920, 1999-11-25
参考文献数
18
被引用文献数
13

有限の開口径をもつレンズで撮影した画像には,奥行に関する情報がぼけとして現れる.これを利用した距離計測はDepth from Defocusと呼ばれ多数の研究例があるが,高精度な距離計測と安定な完全合焦画像の復元はぼけの大きさに関するトレードオフの関係にあり両立は困難とされてきた.これはぼけの形態を決定する瞳(開口)形状を単なる円形としているからである.そこで我々は,先に提案した多重フォーカスカメラにテレセントリック光学系と構造化瞳マスクを組み合わせ,安定かつ高精度に距離画像と完全合焦画像を同時に求める手法を提案する.多重フォーカスカメラから得た複数の画像を用いることにより,表面テクスチャの種類に依存しない解析が可能となる.更にテレセントリック光学系を用いることで,ぼけ現象は位置不変な畳込み演算となり解析が容易となる.構造化された瞳形状により,ぼけによる情報損を最低限に抑え,高精度な距離計測と安定な合焦画像復元の両立が可能となる.結果として,ぼけを含んだ画像に含まれる距離とぼけのない原画像に関する情報をほぼ完全に分離し取り出すことが可能であることを示す.
著者
伊東 保志 赤滝 久美 三田 勝己 渡壁 誠 伊藤 晋彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J86-D2, no.1, pp.130-139, 2003-01-01

筋音図(Mechanomyogram; MMG)とは収縮筋上の体表面上に現れる微細な振動を記録した信号であり,筋線維の収縮に伴って発生する側方向への圧力波に起因し,筋の機械的な活動を反映する.本研究では,筋力低下に至るまでの持続性収縮時の非定常なMMGを時間-周波数解析し,筋疲労に伴う運動単位の活動様式の変化をMMGから推察することを目的とした.実験では,上腕二頭筋を最大随意筋力の20%と80%(20%と80% MVC)で等尺性に持続収縮させ,このとき記録されたMMGを短時間フーリエ変換法を用いて解析し,RMS 振幅と平均周波数を求めた.20% MVCでのMMGのRMS振幅は収縮開始時に若干減少した後に漸増した.平均周波数は当初増大したが,その後はほぼ一定値を保った.一方80% MVC の場合,RMS 振幅は連続的に減少し,平均周波数はいったん増大した後に減少した.このようなMMGのRMS振幅と平均周波数の経時的変化は筋疲労の発生に伴うMU 活動様式の変化を反映しており、MMGによる筋疲労のモニタリングの有用性が示唆された.
著者
石寺 永記 荒井 祐之 土屋 雅彦 宮内 裕子 高橋 信一 栗田 正一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J76-D2, no.4, pp.873-880, 1993-04-25

我々人間の視覚系は,点パターンのように離散的な対象でも仮想線を知覚でき,色や明るさの段差がなくてもそこに明りょうな主観的輪郭を知覚することがある.これは補間問題と考えることができる.そこで,本論文では生理学的データに基礎をおく階層的視覚情報処理モデルを提案し,仮想線と主観的輪郭の知覚といった補間問題に応用する.主観的輪郭を形成するためには,実際の輪郭,主観的輪郭の通る点,そしてその輪郭の伸びていく方向を決定することが重要であり,本モデルではこれらの処理を並列処理で実現する.このモデルは2種類のSimpleセル(StypeとLtype)の出力から,大域的処理により輪郭の検出と点パターンの補間を行うComplexセルと,主観的輪郭が通ると考えられるエッジの端点や曲率の高い点を検出するHypercomplexセルをモデル化する.この処理はすべて並列処理で行われる.またこれらの情報が伝達されるときに重み付けをすることによって主観的輪郭の伸びる方向を決定する.こうした階層的な処理によって得られた情報を統合することによって実際のエッジと主観的輪郭が同様に検出されるようなモデルを構成した.
著者
栗田 多喜夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J73-D2, no.11, pp.1872-1878, 1990-11-25

本論文では,情報量基準を評価基準として,3層のフィードフォーワード型のニューラルネットの隠れ層のユニット数を自動的に決定する試みについて報告する.情報量基準としては,赤池のAIC(A Information Theoretical Criterion)とRissanenのMDLP(Minimum Description Length Principle)を用いた.Fisherのアヤメのデータの識別のためのネットワークーとフーリエスペクトルに基づく話者識別のためのネットワークに対する実験結果を示す.