著者
梶本 裕之 川上 直樹 前田 太郎 舘 [ススム]
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.1, pp.120-128, 2001-01-01
被引用文献数
55

経皮電流刺激により皮膚感覚を提示する触覚ディスプレイを提案する.過去の多くの皮膚感覚ディスプレイでは言語報告によって表される種々の感覚(圧覚, 振動覚, 手触り等)を表現するTop-downの設計法がとられてきたが, それらの感覚は各種感覚受容器の活動を組み合せた結果であるため, こうして設計されたディスプレイはある限られた感覚を提示するにとどまっていた.これに対して我々の方針は, 感覚神経をその種類別に刺激するというものである.種類別刺激が可能であれば, それらを組み合せることであらゆる感覚を生成することができるだろう.これらの刺激を, 視覚との類似性から「触原色」と呼ぶことにする.刺激手段として皮膚表面からの電気刺激を用いる.電気刺激自体の歴史は古いが上記のような原色作成の試みはなく, 多くが単なる特殊感覚のad-hocな生成に終わっている.本論文では受容器選択的刺激のための二つの方法を提案する.一つはアレー状電極を用い, 各電極の重み付け変化で刺激深度を変化させる手法である.もう一つはこれまでの経皮電気刺激が陰極電流を刺激として用いていたのに対し, 陽極電流を使うことで神経軸索の方向に選択的な刺激を行う手法である.
著者
吉村 貴克 徳田 恵一 益子 貴史 小林 隆夫 北村 正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.11, pp.2099-2107, 2000-11-25
被引用文献数
92

本論文では, HMMに基づく音声合成において, スペクトル, ピッチ, 継続長をHMMの枠組みで統一的にモデル化する手法について述べる.本システムでは, スペクトル・ピッチ継続長モデルとして, それぞれ連続分布HMM, 多空間確率分布HMM(MSD-HMM), 多次元ガウス分布を用い, 音素環境, アクセント, 品調などのコンテクストを考慮したコンテクスト依存モデルを構築する.コンテクスト依存モデルは, 決定木に基づくコンテクストクラスタリング手法によりクラスタリングされる.決定木構築の際, 節分割はMDL基準により行う.このこめ, 新たにMSD-HMMに対するMDL基準によるコンテクストクラスタリング手法を導出している.音声合成実験において, 自然性の高い合成音声が得られること, 更に自動学習によりシステムを構築可能であることを認識した.
著者
中井 宏章 渡邉 睦 三宅 啓夫 高田 敬輔 山下 馨 新盛 英世 石原 謙
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.1, pp.280-288, 2000-01-25
被引用文献数
36

我々は, ビデオカメラで撮影した被験者の就寝時映像から, 動画像処理により呼吸を自動計測するシステムを試作している.本システムは, 完全に無拘束でリアルタイムに呼吸状態をモニタリングでき, 高齢者や乳児の睡眠中の突然死や無呼吸症候群の早期発見・診療補助に用いることができる.呼吸計測は被験者胸部の画像変化をフレーム間差分で検出することにより行い, 同時に統計的判別による就寝状態判定も行う.また, 呼吸計測に最適な関心領域(ROI)を自動設定することにより, オペレータの操作なしに長時間の呼吸計測が可能となった.本論文では, 本システムの詳細について述べるとともに, 特別養護老人ホームにおいてフィールドテストを行った結果について報告する.
著者
谷口 行信 南 憲一 佐藤 隆 桑野 秀豪 児島 治彦 外村 佳伸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.6, pp.1112-1121, 2001-06-01
被引用文献数
28

映像の効率的なブラウジングのためには, 映像にインデックスを付与する作業が必要である.本論文は5種類の映像解析技術-ショット切換検出, カメラワーク検出, テロップ検出, 音楽検出, 音声(人の声)検出-を統合した映像インデクシングシステムSceneCabinetについて述べる.映像解析技術に基づく自動インデクシングアプローチは従来から提案されているが, 自動付与できるインデックスは限られる上, その精度は100%でない.このような映像解析の不完全性を補うために, 本システムは自動付与されたインデックスを効率的に修正したり, 関連情報を人手で簡単に付与するためのユーザインタフェースを提供する.具体的には, タイムラインと代表画像一覧を組み合わせることで, 効率的にインデックスの修正や付与ができるようにする.本システムを用いると, 手作業の場合に比べて約半分の作業時間でインデックス付与できることを評価実験により示す.更に, 映像ストリーミング技術を統合したWebページ作成ツールについて述べ, その応用事例を挙げることで本システムの有効性を示す.
著者
丹野 義和 前原 文雄 関谷 里美 伊藤 学 露峰 浩 長谷川 文雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.6, pp.1102-1111, 2001-06-01
被引用文献数
9

放送のディジタル化に伴う大量のディジタル映像コンテンツを供給するためには, 大容量の映像蓄積方式と高速な検索が課題である.本論文では, このためのペタバイト級の大容量映像アーカイブシステムとその検索方式について述べる.アーカイブシステムは7,200巻(15,000時間)の容量を有するテープ装填(てん)ロボットを中心に, HDDサーバ, DVDサーバそれぞれを目的別に配置することによって, 蓄積及び配信の効率を向上させるとともに, 遠隔地からの検索, 映像伝達, 遠隔編集を可能とした.また, 一連画像データのシーン変化点検出方式と, 抽出したシーン変化点を基準とするブラウジング映像生成方式, それに基づく多画面動画同時再生表示による視覚検索方式の開発をした.ここでは自動装填ロボットを中心とした大容量アーカイブシステムと多画面動画同時再生表示での拘束でかつ効率的な検索方式について報告する
著者
佐藤 雄隆 金子 俊一 五十嵐 悟
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.12, pp.2585-2594, 2001-12-01
被引用文献数
28

近傍明度の符合変化を評価するための周辺増分符合相関画像を新たに提案し, これに基づいて, (1)出現物体の明度分布によらず, (2)背景の明度変化の影響を受けない, 画像時系列からの出現物体のロバストな検出・分離抽出手法を提案する.周辺増分符合相関画像は, 着目画像の近傍明度の増減傾向のみに基づくために, 系列にわたる明度変動に対して強いロバスト性をもち, 明度変化を伴っても本来のテクスチャパターンのみの類似を検出するという特性を実現している.また, 複雑な前処理やパラメータ設定などを必要とせず, 直接的に高密度の差分画像を得ることができる.いくつかの条件を想定した実画像を用いた実験により, 実際に明度変化に対してロバストな差分抽出が行えることを確認し, 有効性を示した.また, 情景中の出現物体領域を抽出する処理への応用実験を行い, 比較的単純なフィルタ系列を後処理として加えることにより, 良好な輪郭及び連続性を保った領域分割が可能であること確認した.
著者
籠嶋 岳彦 赤嶺 政巳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.6, pp.1405-1411, 2000-06-25
被引用文献数
18

本論文では, ピッチ周期の変更によるひずみを考慮して, 生成された合成音のひずみが最小になるような音声素片を解析的に生成する方法を提案する.本方式では, 音声素片を用いて合成された音声のひずみを表す評価関数を定義し, この評価関数を最小化するような音声素片を解析的に求めることによって音声素片を生成する.評価関数は, 合成音声と自然音声の波形の2乗誤差によって定義され, 音声データベースより切り出された, 様々な基本周波数の多数の音声セグメントを, 学習のトレーニングベクトルとして用いる.合成器による処理を経て得られる合成音声のひずみを評価し, 音声素片の生成にフィードバックすることから, ここでは本方式を閉ループ学習に基づく解析的生成法と呼ぶ.diphoneを合成単位とする合成器の音声素片を生成する実験を行い, 提案法によって合成音声のひずみが減少し, 合成音声の主観的な品質が向上することを示す.
著者
鮫島 和行 片桐 憲一 銅谷 賢治 川人 光男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.9, pp.2092-2106, 2001-09-01
被引用文献数
17

本研究では, 複数の予測モデルを用いた強化学習方式(MMRL)を提案する.MMRLでは, 制御対象の将来の状態を予測する予測モデルと, 制御出力を学習する強化学習コントローラを組としたモジュールが複数用意され, 各予測モデルの予測誤差のsoftmax関数により予測の正確なモジュールほど大きい値をもつ「責任信号」が算出される.各モジュールの学習と制御出力を責任信号によって重みづけることにより異なる状況に対応したモジュールが形成される.MMRLでのモジュール数や担当領域などの事前知識なしにロバストなモジュール化を実現するために, 空間・時間的な連続性の仮定による事前責任信号の定式化する.また, MMRLの効率的な実装法として複数の線形予測・2次報酬モデルによる最適コントローラ(MLQC)の定式化を行う.MLQCの性能の確認を行うため単振子を用いた振上げのシミュレーションを行う.単振子のつり下がり付近と倒立点付近の局所線形予測モデルとそれに対応するコントローラが学習により獲得され, 従来手法よりも高速にタスクが学習可能であり, またモジュールの冗長性にも対応可能なことを示す.
著者
松坂 要佐 東條 剛史 小林 哲則
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.6, pp.898-908, 2001-06-01
被引用文献数
56

グループ会話に参与できる対話ロボットを開発した.グループ会話とは, 会話の参加者同士が, 対等の関係で行う多人数会話である.人と機械が1対1で会話することを前提としていた従来の人・機械の対話システムと異なり, グループ会話においては、投げかけられた声が誰によって発せられ誰に向けられたものか, それぞれの会話参加者は誰に注目しているかなど, 会話の場に関する状況理解をするとともに, 自らも適切な場の形成に努める必要がある.本研究では, 画像処理, 音響処理などを併用することで状況理解を行うとともに, 身体表現によって会話状況への働きかけを行う機能を実現し, これらを音声認識と組み合わせることで, 複数の参加者を相手に会話できるロボットを作成した.
著者
小室 孝 石井 抱 石川 正俊 吉田 淳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.1, pp.75-82, 2001-01-01
被引用文献数
39

本論文では, 高速ビジョンの特性を生かしたアルゴリズムを専用ハードウェア化することで画素数や速度の向上を図った新しいビジョンチップのアーキテクスチャを示す.また, 同アーキテクスチャに基づき, 0.6μmCMOSプロセスを使用し, 64×64画素を集積したチップを試作した.その動作報告を行う.
著者
前田 英作 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.4, pp.600-612, 1999-04-25
被引用文献数
38

新しいパターン識別手法, カーネル非線形部分空間法(Kernel based Nonlinear Subspace method;KNS法)を提案する. 本手法はカーネル関数によって定義された非線形変換を利用して高次元非線形空間上での部分空間法を実現したものである. 近年研究が盛んなSupport Vector Machineはカーネル関数を利用した非線形識別手法であり高い識別性能を有するが, パターン数, クラス数の増加に伴い学習に要する計算量が爆発的に増えるという問題がある. 一方, 従来の部分空間法は多クラスの識別に有効でかつ高速な識別手法であるが, パターンの分布が非線形性をもつ場合やクラス数に比較して特徴空間の次元が小さい場合に十分な識別性能が得られない. 提案手法は, 両者の利点を組み合わせることにより, 互いの欠点を補完し高い識別性能を有する多クラスの非線形識別を少ない計算量で実現する. 本論文では, 非線形部分空間法がカーネル関数で定義される非線形変換を用いて定式化可能なことを示し, 非線形分布及び多クラス分布に対する識別性能, パラメータ変動に対する識別性能の安定性, 学習及び識別に要する計算コストなどの観点から提案手法を評価し, 従来手法に比べて優れていることを検証した.
著者
益満 健 越後 富夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.8, pp.1848-1855, 2001-08-01
被引用文献数
24

本研究では,ユーザの視聴行動をから好みを学習し,その人の好みを反映した要約映像作成手法を提案する.過去に見た映像と類似した映像の重要度は高く,早送りなどによりスキップした映像に類似した映像の重要度は低くなるように各フレームの重要度を推定し,この重要度をもとに要約映像を生成する.重要度の推定では,画像から得られる特徴量をそのまま使うのではなく,固有空間により得られる特徴ベクトルを用いることにより,様々な特徴量を効果的に扱う.更に,ユーザの嗜好を反映するために,ユーザの2種類の行動(視聴したか,早送りによりスキップしたか)から投票に基づく学習を用いたため,ユーザに意識させることなく学習が行える.本提案手法をサッカー映像に適用し,好みを反映した要約映像を生成し,本手法の有効性を確認した.
著者
森田 健夫 山口 満 田所 嘉昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.12, pp.2271-2279, 2004-12-01
被引用文献数
19

自動採譜の実現において,音楽信号の音高を推定する処理は最も重要であり,リアルタイムでの処 理が望まれている.本論文では,多重唱を対象とした計算量の少ない音高推定法を提案する.提案法は,1オクターブ12音名に対応するくし形フィルタを並列接続したシステムと,その出力値を利用することで音高を推定する.これは,くし形フィルタが対応する音の全周波成分を除去可能であること,更に,上述のシステムの最小出力を検出することで,入力中の1音を推定できることに基づいており,加減算主体の処理で簡単に実現される.実際の多重音を用いた評価実験を行った結果,従来法(トリー法,SVD法)より,約1/5から1/30の処理時間でほぼ同等の音高推定結果が得られた.
著者
河田 岳大 工藤 峰一 外山 淳 中村 篤祥
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.3, pp.629-635, 2005-03-01

OCRなどを通して得られる日本語文の認識結果において, N-gram確率を利用した高速な誤認識文字検出法を提案する.日本語のように単語が分かち書きされず大規模な語彙を対象とした場合, 誤り個所の指摘に文字N-gramは有効な方法である.本論文ではまず, 通常のN-gram確率の拡張として両方向N-gram確率を提案し, その有効性を情報量の点から考察する.次に, 両方向N-gram確率と文脈確率を用いて1文字の誤字を検出する方法を提案する.シミュレーション実験では, 適合率80%において従来法よりも10%以上高い約75%の再現率を達成できた.また, 誤り範囲の指摘という点では, 適合率80%で再現率90%が達成された.
著者
全 炳河 徳田 恵一 北村 正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.8, pp.1593-1602, 2004-08-01
被引用文献数
1

近年,連続音声認識システムにおける音響モデルとして,前後の音素環境を考慮した音素コンテクスト依存隠れマルコフモデルが広く利用されている.音素コンテクスト依存隠れマルコフモデルを利用する場合,総モデル数が増加し,システムが非常に多くの自由パラメータを含むことになるため,統計的に信頼できるパラメータを推定することが困難になる.このため,様々なパラメータ共有手法が提案されており,中でも音素決定木に基づく状態共有法は,優れた解決法の一つである.しかし,状態単位の共有構造では特徴ベクトルの全次元に同一の共有構造を構築するため,各特徴量に対し,異なる共有構造を構築できない,適切なパラメータ数を割当てることができない,といった問題点がある.本論文では,記述長最小化基準に基づく次元分割法を導入することにより音素決定木を拡張した,音素・次元決定木を提案する.更に,状態位置に関する分割条件を加え,音素コンテクスト・次元・状態位置を決定木に基づき同時にクラスタリングする手法を提案する.不特定話者連続音声認識実験の結果,提案法は従来の音素決定木に基づく状態共有法と比較して13〜15%誤り率を削減することが示された.
著者
安本 護 本郷 仁志 渡辺 博己 山本 和彦 輿水 大和
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.8, pp.1772-1780, 2001-08-01
被引用文献数
27

本論文では,複数方向の顔画像から抽出した4方向面特徴を用いて,顔向きによらない人物識別と人物によらない顔向き推定を実行する手法について述べる.また,複数のカメラで異なる方向から画像を取得し,各カメラの識別器出力を統合するマルチカメラ協調手法も提案する,人物識別実,験では,1台のカメラで296°の顔向き範囲に対して平均92.9%の認識率が得られた.顔向き推定実験からは,推定誤差の平均が4.5°以下,分散が11.0という結果を得た.また,8台のカメラから得た情報を統合する処理が,人物識別のオクルージョン耐性や顔向き推定の精度向上に効果的であることを示した.
著者
丸山 健一 小林 誠 山田 博文 中野 康明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.9, pp.1435-1443, 1999-09-25
被引用文献数
1

本研究の目的は筆記体で書かれた手書き英単語を認識することである.以前の研究では,文字認識部にある一つの手法を用い,その結果を用いて単語認識を行っていた.本研究では複数の文字認識を用い,そこから得られた結果を組み合わせることにより,単語認識率の向上をねらった.手書き英単語認識に適用した実験の結果,提案した手法による単語認識率は単独の認識アルゴリズムを用いたときよりも認識率が向上した.
著者
深谷 亮 山村 毅 工藤 博章 松本 哲也 竹内 義則 大西 昇
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.2, pp.661-672, 2004-02-01
被引用文献数
16

本研究では,他人の文章を真似して作成された文章を発見するための文章間類似度の計算法を提案する.真似した文章の多くは,もとの文章に含まれる文と類似した文から構成され,類義語・同義語へ言い換えることなどにより表層的な表現を変化させる.そこで,本手法では各文章を構成される文単位で照合し,表層的な表現の変化に対応するため単語の頻度と概念辞書を用いる.本手法による類似度により,同一テーマで記述された文章と真似して書かれた文章とを明確に区別することができることを示す.
著者
後藤 真孝 伊藤 克亘 速水 悟
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.11, pp.2330-2340, 2000-11-25
被引用文献数
29

本論文では, 代表的ないいよどみ現象である有声休止(音節の引き延ばしも含む)を自動的に検出する手法を提案する.有声休止は音声対話において発語権の保持等の大切な役割を果たしており, その検出は音声対話システムを実現する上で重要である.従来, サブワード単位に基づく連続音声認識やワードスポッティングの枠組みで有声休止に対処する研究事例はあったが, いいよどみ現象として個々に検出しておらず, その役割を把握して適切に扱うことはできなかった.本手法は, 有声休止中は調音器官の変化が小さいことに着目し, 音韻的に変化が少ない持続した有声音(有声休止音)を検出する.その際, ボトムアップな信号処理によって, 有声休止音がもつ二つの音響的特徴(基本周波数の変動が小さくスペクトル包絡の変形が小さい)を検出することで, トップダウン情報を使わない言語非依存な検出を可能とする.本手法をリアルタイムに実行するシステムを実装し, 有声休止箇所のマーク付け作業を施した日本語の音声対話コーパスを用意して, 評価実験を行った.その結果, 30名の話者の自然発話に対し, F値0.726の精度で有声休止を検出できることが確認された.
著者
船田 哲男 続木 貴史
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.11, pp.2184-2187, 1999-11-25
被引用文献数
9

耐雑音性をもった特徴を音声から抽出することを目的とし,パワースペクトルの周波数軸に関する傾斜に着目した特徴量を提案した.この特徴抽出過程で行うスペクトル傾斜に対するしきい値操作が,耐雑音性に効果をもつことを,単語音声認識実験で確認した.