著者
天野 敏之 佐藤 幸男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.3, pp.457-465, 2002-03-01
被引用文献数
58

本論文では,固有空間法を用いた画像補間法により,文字などのテロップを含む1枚の画像のみを用いて文字を補間により消去する手法を提案する.風景画などの画像はフラクタル的な性質があり,画像の自己相関性が仮定できる場合が多い.筆者らはこの点に着目し,欠損を含む1枚の画像のみから固有空間により画像を記述するルールを表現した.このように生成された固有空間は,画像の特徴を反映しており,この固有空間を用いることにより画像補間を実現した.本補間手法はオリジナル画像を復元するものではないが,実験の結果画像の自己相関性が成立する画像については違和感なく補間できることが確認された.
著者
田中 克己 福井 和広
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.9, pp.1464-1472, 2002-09-01
被引用文献数
11

エージェントとユーザ間のインタラクションを活用した視線入力インタフェースを提案し,実タスクに基づく評価を行った.このシステムにおいては,ユーザとのインタラクションの単位として複数の選択対象エージェントを設定する.各エージェントはユーザからの視線入力に基づいて自らに対する注目の度合を,ベイジアンネットワークを用いて確率的に学習する.いったん学習されたエージェントは,システムへの入力から自らへの注目確率を推定し,それに応じたアクションを行う.このアクションがユーザへのフィードバックとなり,ユーザに対し,自らの注視によりエージェントを活性化させることにより選択している感覚をもたせることになる.最終的にはエージェント活性化により,あらかじめ登録されたショートカットコマンドを起動し,ユーザの意図を実行する.今回は各エージェントにWindows上でのイベント登録・実行機能をリンクさせることにより,ユーザがエージェントを選択すると同時にコマンド選択・スクロール・IMEモード切換を実行させる機構を作成し,現行のインタフェースとの定量的.定性的比較を行った.その結果,コマンド選択機能については10%程度の効率向上が,他のタスクについては同等に近い効率を得ることができた.
著者
川村 正樹 岡田 真人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.10, pp.2302-2311, 2001-10-01
被引用文献数
8

系列想起モデルにおける想起過程の厳密解を議論する.連想記憶モデルの想起過程を解析するための理論として, 経路積分法や統計神経力学が提案されている.経路積分法は厳密解を与える理論であるが, 系列想起モデルでは, 定常状態しか議論されていない.我々は想起過程を議論するために, クロストークノイズの時間相関に注目し, 過渡状態を含むすべての場合に適応可能な厳密解を求めた.驚くべきことに, クロストークノイズがガウス分布に従うと仮定した統計神経力学の結果とこの厳密解は一致する.クロストークノイズの正規性を調べるために, クロストークノイズ分布のキュムラントの時間発展を調べた.その結果, パターンを想起することに失敗した場合においても, 3次と4次のキュムラントは0になっており, クロストークノイズが常にガウス分布に従っていることを確認した.また, 理論と計算機シミュレーションより得られる想起過程の結果は一致している.更に, 巨視的な不安定定常状態がセパラトリックスに完全に一致していることがわかった.
著者
津田 宏治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.4, pp.592-599, 1999-04-25
被引用文献数
29

部分空間法は, 通常, 特徴量を基底とする多次元数空間(i.e. 特徴空間)に適用される. しかし, 部分空間は任意の線形空間で定義できるので, 数空間だけでなく, 関数空間にも, 部分空間法は適用可能である. 本論文では, 特徴空間の各点を, その点を中心とするガウスカーネル関数に対応づけることにより, 特徴空間を, ヒルベルト関数空間に写像し, そこで, 部分空間法を用いて識別を行うことを提案する. 平仮名認識実験を行った結果, 従来の部分空間法よりも, 高い認識率を得ることができた. この認識率の向上は, ヒルベルト関数空間において, 各クラスの部分空間同士の共通部分の次元数が0になることに起因すると考えられる.
著者
木下 智義 坂井 修一 田中 英彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.4, pp.1073-1081, 2000-04-25
被引用文献数
19

音響信号により外界の事象を理解する聴覚的情景分析に関して, 従来多くの研究がなされてきた.特に対象を音楽に絞った場合, 自動採譜等の実現を目指し, いくつかの研究例がある.その一つとして, 筆者らはこれまでに音楽音響信号を対象とした聴覚的情景分析の処理モデルOPTIMAを提案し, その実験システムを構築した.しかしながら, その認識精度は実用上十分とはいえず, その改善が課題となっている.本論文では, 従来の処理の問題点である周波数成分の重なりに対する脆弱性を改善するための新たな処理を提案する.本手法では, 周波数成分が重なったときの特徴に合わせて特徴量を分類し, それに応じて重なりのある周波数成分の特徴量を適応的に変化させ, 音源同定処理を行う.また, 各特徴量の音源同定の際の手掛りとしての重要度を計算し, 同定処理に導入した.評価実験の結果, 処理精度の向上が認識され, 提案する処理の有効性が明らかになった.
著者
深津 真二 北村 喜文 正城 敏博 岸野 文郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.9, pp.1905-1915, 2000-09-25
被引用文献数
10

広大かつ複雑な仮想環境内において, 利用者に自己位置や方向, 仮想環境全体の構造などを正確に認識させるためには, 仮想環境内の任意の位置から仮想環境を大局的に眺めた鳥瞰(かん)画像を利用者の視点から見た等身大画像とともに提示することが有効である.本研究では, 利用者の通常の視点(利用者視点)に加え, この仮想環境を大局的にとらえるための視点(鳥瞰カメラ視点)を自らの身体運動に関連づけて直感的に制御する手法として, 座標系対連動法を提案する.これは, 利用者視点と鳥瞰カメラ視点の動きを連動させる手法であり, 利用者の空間構造を理解しようとする行動に合致した直感的な方法により, 鳥瞰カメラ視点を制御することを可能とする.そして, 座標系対の連動を用いた仮想環境内ナビゲーションシステムを実装し, 鳥瞰カメラ視点の制御手法として従来手法を用いたシステムを比較対象に評価実験を行い, 提案手法の操作性と制御の直感性を評価する.
著者
西村 雅史 伊東 伸泰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.11, pp.2473-2480, 2000-11-25
被引用文献数
26

ディクテーションシステムが実用となった今, 大語彙音声認識の研究対象は, 「読み上げ(read speech)」から自然で自由な発話(spontaneous speech)」へと移行しつつある.このような自由発話については過去に対話音声コーパスを利用して様々な観点からその性質が調べられてきた.しかし, 特に日本語に関してはそのデータ量が統計的手法に基づく大規模な音声認識システムを構築するには不十分であったこともあり, 自由発話の書き起こしを目的とするような大語彙音声認識システムの性能についてはあまり報告されていない.我々は自由発話の認識精度改善を目的として, 放送大学の講義音声を題材とした自由発話コーパスの整備を進めてきた.ここではこのコーパスの概要と, それを用いて作成した自由発話の大語彙音声認識システムの認識性能について報告する.実験の結果, 従来の読み上げを対象とするシステムでは51.5%であった講義音声の単語誤り率が, 16.4%にまで改善された.
著者
鄭 址旭 小林 哲生 李 玉文 栗城 眞也
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.6, pp.1084-1092, 2002-06-01
被引用文献数
5

本研究では,視覚刺激におけるテクスチャによるターゲットとグラウンドの分離・認知にかかわる脳内プロセスの解明を目指し,視野内におけるターゲットの呈示領域と分離・認知されるまでに要する反応時間との関係を調べた.また,課題遂行時の事象関連電位を頭皮上63箇所で同時計測し,更にスプライン・ラプラシアン解析を行い脳活動の検討を行った.その結果,ターゲットの呈示される領域によって反応時間に有意な差が生ずることが明らかとなった.また,課題遂行に伴い潜時の異なる四つの事象関連電位成分が観測された.事象関連電位のスプライン・ラプラシアン解析により,これらの成分の信号源は左右両半球の後頭葉,頭頂葉,前頭葉にあり,このうち反応時間との関連から,潜時約270ms以降の前頭葉の活動が主にターゲットの認知にかかわる脳内プロセスを反映していると推察された.
著者
青木 公也 金子 豊久
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.86, no.1, pp.72-83, 2003-01-01
被引用文献数
6

本研究では人間と共存するロボット(福祉・ホームロボット)の外界認識システムに焦点を当て,その導入研究として距離情報とカラー情報を利用した3次元物体の検出について検討を行った.ステレオビジョンが任意に移動していく過程で蓄積されていく外界情報を利用し,指定された物体の位置・姿勢を検出するアルゴリズムを提案する.3次元モデルベーストマッチングに改良した遺伝的アルゴリズム(GA)を適用する.視点移動は GA に動的環境をもたらすと考え,多峰性問題と評価関数の変化に対応するために「種族」と「競争的共存」の概念の導入を図った.また,ロバストなマッチングを行うために3次元モフォロジー演算を利用した評価空間の生成手法を提案した.距離画像の各画素に距離データだけでなく,HSV カラー情報を付加することによって形状情報とテクスチャ情報を同時に評価する手法も提案する.最後に提案手法についてシミュレーション及び実画像での実験を行いアルゴリズムの有効性を示す.本アルゴリズムは探索対象とする物体形状の複雑さに柔軟に対応できること,センサによる距離情報取得の際の外乱に対してロバストであるという特長をもつ.
著者
林 健太郎 橋本 学 鷲見 和彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.8, pp.1762-1771, 2001-08-01
被引用文献数
19

本論文では照明変化の多い半屋外環境下で,着座した人物の顔方向を単眼視により推定するために,顔上の特徴点を追跡する手法を提案する.本追跡手法では分離度フィルタ及び更新型テンプレートマッチの両方を用いて,それらのマッチ位置を重み付け統合する.この重み付けパラメータを適切に設定することにより頑健で高精度な追跡を実現できることを示す.更に,本追跡手法を用いて顔上の目と鼻の位置を追跡し,顔の3次元方向を推定するリアルタイムシステムの構成を示す.本システムを用いて正面から50度以上の横向き顔を検出した結果,87%の検出率を達成した.
著者
高橋 桂太 久保田 彰 苗村 健
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.3, pp.573-584, 2005-03-01
被引用文献数
25

Light field rendering (LFR)とは, あらかじめ取得された多視点画像から自由視点画像を合成する, イメージベーストレンダリングの基本的な手法である.この手法では, 合成画像において焦点ぼけのような現象が現れることが知られている.現実のシステムでは, この"焦点"が合う範囲が非常に狭い場合が多いという問題点がある.本論文では, LFRの合成画像における"合焦"の度合を, 安定に判定する新しい尺度を提案する.また, この尺度を用いて, "合焦"距離が異なる多数枚の画像から, "焦点"が合っている領域を統合することで, シーン全体を鮮明にとらえた"全焦点"画像を合成する手法を提案する.更に, 画像合成の実験を行い, 提案手法によって, 最終的な合成画像の品質が向上することを確認した.
著者
田村 正統 益子 貴史 徳田 恵一 小林 隆夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.4, pp.545-553, 2002-04-01
被引用文献数
19

本論文では,不特定話者の音声合成単位である"平均声"モデルから,任意話者の特徴をもつ音声を合成する手法を提案する.提案手法は,HMMに基づくテキスト音声合成システムに基づいている.HMMに基づく音声合成システムでは,多空間上の確率分布(MSD)に基づくHMMを用いてスペクトル及びピッチパラメータを同時にモデル化しており,HMMのパラメータを適切に変換することにより合成音声の声質や韻律特徴を変換できる.本論文では,MLLRアルゴリズムをMSD-HMMに拡張し,ピッチ及びスペクトルモデルの話者適応を行うことにより,目標話者の少量の文章を用いて,声質のみでなく韻律情報も適応できることを示す.主観評価試験により,ピッチ及びスペクトルを同時に話者適応することにより,平均声モデルを数文章で適応したモデルから,特定話者モデルからの合成音声に近い音声を合成できることを示した.
著者
財田 伸介 久保 満 河田 佳樹 仁木 登 大松 広伸 森山 紀之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.1, pp.134-145, 2004-01-01
被引用文献数
22

近年,マルヂスライスCTの開発により全肺野の3次元断層像を短時間,高精度に得ることが可能になった.特に体軸方向の分解能の飛躍的な向上により3次元的な画像解析に期待が寄せられている.本論文ではマルチスライスCT画像から肺の葉間数を抽出するアルゴリズムについて述べる.臨床において葉間数は肺区域の同定に重要とされる臓器である.葉間数は非常に薄い膜状の構造をしている.本手法は,葉間数の存在する領域の特定と葉間数の強調処理を行って抽出する.これらには葉単位に分類された肺血管からの3次元距離値を用いることで葉間数の存在する領域の特定を行う.次に強調された面陰影の法線ベクトルを用いた領域拡張処理を行い葉間数を抽出する.本手法を臨床画像20例に適用し,精度を評価して有効性を示す.
著者
小澤 憲秋 青木 俊徳 加藤 寧 根元 義章
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.8, pp.1608-1617, 2001-08-01
被引用文献数
7

本論文では,衛星画像における雲域自動分類手法を提案する.提案手法は可視画像と輝度温度画像を用いて,雲域とそれ以外の領域を自動的に分類する.画像を小さな領域(局所領域)に分割することにより,局所領域中での各カテゴリーの特徴ベクトル分布がガウス分布を用いて近似できると仮定し,分布を二つのクラスタに分割する.更に,各クラスタをその後のカテゴリー分類に利用するのに適当であるかどうかの判断を行うための「一致度」を導入し,それを満足するクラスタの平均ベクトルとEMアルゴリズムを用いて分類を行う.一致度を利用することによって特徴空間中のベクトル分布が明確になることを示すとともに,クラスタリングも適切に行えることを示す.提案手法の特徴は,特徴ベクトルが各カテゴリー間を結ぶように連続的に分布することに着目する点にある.各カテゴリー間を結ぶ直線を考え,その直線と各クラスタの平均ベクトルの距離が近いものだけを利用することによって,画像ごとに動的にしきい値を決定する.最後に,提案アルゴリズムををNOAAとひまわりの画像に適用する.専門家が手動で分類した結果等と比較し,良好な分類結果が得られることを示す.
著者
宮川 勲 若林 佳織 荒川 賢一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.5, pp.1120-1132, 2004-05-01
被引用文献数
14

本論文では,魚眼カメラが取得した画像系列から平面運動と3次元形状を同時に復元するための因子分解法を提案する.ただし,光軸を平面に垂直とした魚眼カメラが平面運動することを前提としている.本手法は,この平面運動で画像系列を獲得する魚眼投影モデルに基づいている.実験では,撮影ロボットを使って取得した室内画像に本手法を適用し,平面運動と3次元形状を同時に,かつ,高精度に復元する手法として有効であることを示す.更に,形状復元の精度評価から,形状復元の精度は仰角に依存することを確認し,本手法の適用範囲を明らかにする.
著者
田中 完爾 木室 義彦 山野 健太郎 平山 満 近藤 英二 松本 三千人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.9, pp.1759-1770, 2005-09-01
被引用文献数
20

ロボットが作業環境内における自己位置を推定するために, 安価かつロバストなランドマークが望まれる. 本論文では, このような要求を満たすものとして, RFIDタグを利用する自己位置推定法を提案する. 従来の位置推定用RFIDシステムでは, 空間配置が既知のタグを用いたり, 各タグに位置情報を記録したものが多い. これに対し, 本手法では, オフィスや家庭などでユーザが多目的に使用するタグを想定し, タグの配置が不規則かつ未知の場合を対象とする. タグの発信時刻や発信強度のばらつき, 障害物による電波遮へい, 不測のタグの配置変更などの不確かさのもとで, タグの信号と自己位置との関係をサポートベクタマシンを用いてロバストに学習する方法を示す. また, 提案した自己位置推定法を利用して, ユーザがタグに関する専門的な知識を必要とせずに, 最適なタグ配置作業を行うための方法を提案する.
著者
前田 茂則 椋木 雅之 美濃 導彦 池田 克夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.10, pp.1617-1625, 1999-10-25
被引用文献数
8

画像検索システムでは,利用者が頭にイメージした検索したい画像の内容をいかに的確に引き出せるかが重要である.そのため最近,概略画,類似画像等の画像を検索キーに採用し,利用者のイメージの表現の自由度を高める試みが多くなされているが,画像は多義性が大きいため,従来のキーワード等の言語を検索キーに用いる方式に比べて検索キー自体の示す内容のあいまいさが増大し,利用者の意図が適切にシステムに伝わらない場合がある.そこで本研究では,画像検索をシステムと利用者とのイメージコミュニケーションという観点から見直して問題点を検討し,これをもとに,画像を検索キーに用いながらもそのあいまいさの増大を抑える対話機構を提案する.この対話機構では,検索結果が得られた理由等を示す釈明情報をシステムから利用者に提示し,それに基づいて利用者が検索キーの修正をして再検索を行う.実際にこの対話機構を画像検索システムに実現し,実験によりその有効性を確認した.
著者
濱口 航介 岡田 真人 山名 美智子 合原 一幸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.8, pp.1689-1696, 2004-08-01
被引用文献数
1

神経細胞集団のスパイク同期による情報表現仮説が注目を集める中,フィードフォワード結合された神経層を同期発火が連鎖して伝搬する,Synfire Chainと呼ばれるモデルが提案されている.このモデルでは神経結合の一様性を仮定することで解析的な取扱いが容易になっている.しかし大脳皮質においては局所的な相互作用が存在し,近距離の興奮性,遠距離での抑制性の結合からなるメキシカンハット型と呼ばれる結合が確認されている.そこで我々はMcCulloch-Pitts型ニューロンモデルで構成された神経層の間の結合をメキシカンハット型の関数で与え,各層を伝搬する同期発火の発展を調べた.この系は発火パターンのフーリエ0次モードと2次モードの強度の発展方程式を用いて統計的に記述される.この系には非発火状態以外に,層状回路を伝搬する孤立局在興奮と一様興奮の二つのノントリビアルな安定状態が存在することが分かった.更に孤立局在興奮と一様興奮の共存相が存在することを明らかにした.
著者
井手 一郎 山本 晃司 浜田 玲子 田中 英彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.10, pp.1543-1551, 1999-10-25
参考文献数
24
被引用文献数
42

増大する量への対応及び利用価値の点から,ニュース映像への自動的索引付けの実現が期待されている.これを受けて様々な手法が提案され,なかでも映像に付随する言語情報を利用したものが活発に研究され,既に実用化の域に達しているものも存在する.しかし,それらの多くは言語情報主導であり,映像データベースにとって重要であるはずの,索引 (キーワード) と画像内容の一致を考慮したものは少ない.そこで本論文では,このような問題点を踏まえ,画像的に類似した映像は類似した内容を含む,というニュース映像特有の性質を利用し,画像的に典型的な映像に対し,内容を反映した語義をもつ字幕を選択的に付与する自動的索引付け手法を提案し,その有効性を評価する.提案手法を実際のニュース映像に適用したところ,いずれかの典型的映像に分類されたもののうち,全体の25∼93%,必要な情報が字幕に存在して索引付け可能であったもののうちの75∼100%に対して索引付けに成功し,一定の有効性を示した.