著者
藤村 光 杉原 厚吉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.87, no.3, pp.818-828, 2004-03-01
参考文献数
19
被引用文献数
12

本研究では,選手が特定のフィールド上を自由に動き回り,目標に対して競い合うチームスポーツを対象にして,チームワークの定量的評価を行う.この種のスポーツでは,各選手が支配するフィールドを把握することがチームワーク評価への道となる.そのため,フィールドを支配関係によって分割する優勢領域図の概念を応用し,それによるチームワークの定量的評価手法を提案する.また本研究においてはこの優勢領域図の作成にあたって,実験に基づいたより現実的な運動モデルを採用している.これにより,より経験者の直感に合うテームワーク評価を実現できた.
著者
西上 功一郎 渡辺 澄夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.86, no.1, pp.119-129, 2003-01-01
被引用文献数
17

情報システムの統計的学習においては,複数のモデルの候補から与えられた規準に対して最も適するモデルを選ぶ操作が必要になる.その規準として,真の分布を最大の確率で見出すための一致性の規準,及び予測誤差を最小にするための有効性の規準がある.正則な統計モデルにおいては,AICやBICなどの規準が提唱され,その性質が詳しく研究されているが,神経回路網や混合正規分布などの特異点をもつ学習モデルの選択のための規準については,不明なことが少なくない.本論文では,特異点をもつモデルのベイズ学習について考察し,確率的複雑さを最小にするモデル選択法において,常に正値の事前分布を用いる方法とジェフリーズの事前分布を用いる方法とを,一致性及び有効性に関する観点から比較する.既に知られている理論的な命題を基盤として,二つの分布の違いについて合理的な予想を行い,その予想を実験的に検証する.特に,学習モデル族が真の分布を含んでいる場合には,ジェフリーズの事前分布が一致性・有効性の両面で優れていること,反対に,学習モデル族が真の分布を含んでいない場合には,常に正値をとる事前分布が有効性において優れていることを実験的に明らかにする.
著者
中島 淑貴 柏岡 秀紀 キャンベル ニック 鹿野 清宏
出版者
電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.87, no.9, pp.1757-1764, 2004-09-01
参考文献数
11
被引用文献数
37

非可聴つぶやき認識」という,新しいスタイルの実用的な入力インタフェースを提案する.これは音声認識の雑音に対する脆弱性,情報の周囲への漏えい性を克服するため,声帯の振動を伴う通常音声の空気伝搬ではなく,「非可聴つぶやき(Non-Audible Murmur:NAM)」,つまり第三者に聴取不能な声帯の振動を伴わない調音呼気音の体内伝導を,体表からサンプリングし.HMMを用いて認識するものである,これを実現するための基礎として,第一に医療用膜型聴診器の原理を応用した体表接着型マイクロホンを開発した.第二として体内を伝導するNAMを採取して認識するために最適な接着位置を発見した.第三としてNAMの音響学的性質を検討した.第四として,この部位から採取されたサンプルを用い.HMM音響モデルに追加学習してNAM音響モデルを作成した.これらをもとに,日本語ディクテーション基本ソフトウェアを評価に用い,認識エンジンJuliusを使用して大語い連続認識実験を行い.NAM認識の実用可能性を検討した.
著者
徳元 大輔 池戸 丈太朗 金子 孝夫 片岡 章俊
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.87, no.9, pp.1870-1883, 2004-09-01
被引用文献数
1

今日,ネットワークの双方向性を活用し,情報を受信するだけではなく,ネットワークの情報発信性という特性を有効に活用するためのサービスやシステムが注目を集めている.本論文では,IPネットワークを介して演奏者間のインタラクションがない合奏(以降,遠隔地間の合奏と記述)を行い,更に遠隔地の聴衆に演奏音間の時間同期を確立して,聞かせることができる遠隔合奏システムヘの適用を目的に開発した同期再生技術について報告する.また,音響信号間の時間同期を確立するための同期情報の検出方法としては,帝域制限相関法を考案した.この帯域制限相関法により検出される同期情報の精度を評価した結果, RTP(Real-Time Transport Protocol)によるパケット単位の同期では,最大27msとなる同期ずれを解消することができ,0.1ms以下(サンプリング周波数44.1 kHz)の精度で演奏音間の同期再生を実現できることが分かった.また,開発した同期再生技術を評価するための同期再生実験評価システムを構築し,その性能についても評価を行った.
著者
佐藤 紀章 萩原 将文
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.85, no.4, pp.622-629, 2002-04-01
被引用文献数
1

本論文では視覚システムに基づく動物体認識ニューラルネットワークを提案する.提案ネットワークは,視覚情報処理の並列階層性に着目した構造となっており,動物体を認識することができる.提案ネットワークは運動認識モジュール,動物体推定モジュール,動物体認識モジュールから構成される.運動認識モジュールでは視覚において運動認識を行う部分をモデル化したニューラルネットワークを用いて運動の認識を行う.動物体推定モジュールではバックプロパゲーション(Back Propagation:BP)アルゴリズムによる階層型ニューラルネットワークを用いて運動の特徴から動物体の推定を行う.動物体認識モジュールでは抑制方法を改良した多重構造ニューラルネットワークを用いて動物体を形の特徴から認識する.運動認識モジュールから動物体推定モジュールを通して動物体認識モジュールへ情報を伝達することによって運動認識,パターン認識の統合を行い,動物体を認識することができる.歩行人物認識の計算機シミュレーションにより提案ネットワークの有効性が示されている.
著者
三浦 高志 熊岡 忍 松本 建太 下村 孝光
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.87, no.2, pp.608-618, 2004-02-01
参考文献数
11
被引用文献数
1

本論文は,適応的直交変換によるベクトル量子化において,ベクトル探索を高速化する方法を提案する.高速化の原理は,誤差ベクトルをより次元の低いベクトルに分割してから量子化を行う,積符号技術である.ベクトルの次元が低くなれば,同じ近似利得を与える辞書サイズが小さくなるので,候補ベクトル数が減少してベクトル探索が高速化される.また,辞書ベクトルを先頭要素の降順にソートしておき,誤差ベクトルの先頭要素値から直接的に候補ベクトルの範囲を限定して候補ベクトル数を削減する方法及び誤差ベクトルの画品質と目標画品質との差によって最適なサイズの辞書に切り換える方法を追加した.提案方式の有効性は数値実験により検証される.
著者
森 敏生 甲斐 昌一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.85, no.6, pp.1093-1100, 2002-06-01
参考文献数
26
被引用文献数
1

本論文では人の脳の確率共鳴現象の存在を,脳波の雑音効果から研究した.ここではα波周波数(f_α)に見られる引込み現象を利用し,α波に近い周期刺激では引込み現象が被験者の感情や体調などの影響を受けやすいので,その影響の少ない倍周期引込みを対象とした.実験は,中枢神経系・脳内部で確率共鳴現象が起こることを明確に示すために,周期光刺激を右眼に雑音光を左眼に印加した.この際,右眼の弱い光刺激のみではα波の引込みを起こさない.この状態で左眼の雑音光強度を可変にすると,ある適度な強度で脳波は引込みを起こし,スペクトル中に刺激周波数(f_s)の倍周波に鋭いピークが観測される.更に強い雑音を加えるとこの鋭いピークは消え,引込みからはずれることが観測された.各雑音光強度に対してこのスペクトル振幅をプロットすると確率共鳴現象で見られるベル型の変化を示した.この研究では周期及び雑音刺激が各々独立した入力点(左右眼)に印加されていることから,確率共鳴現象が視交差以降の視覚経路すなわち中枢神経系で起こっていると結論される.
著者
松下 康之 西野 恒 池内 克史 坂内 正夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.86, no.8, pp.1186-1195, 2003-08-01
参考文献数
16

天候の変化に伴う影の動き及び静的な影の影響は,ビデオ監視システムの物体追跡アルゴリズムや認識アルゴリズムの精度低下の要因として問題視されている.本論文では,このようなシーンの照明による影響を入力画像中から頑健に取り除くために,イントリンシック画像を用いた照度成分の正規化に関するフレームワークを提案する.これまでに提案された手法とは異なり,本手法ではシーンの照明変化に伴う反射成分の変化を考慮することにより,より正確な照明画像を推定することができる.この照明画像を用いた照明成分の正規化手法について述べると同時に,入力画像から直接的に照明成分を推定するために照明固有空間を用いる手法を提案する.最後に照明成分を正規化した画像において車両のトラッキング性能を評価することにより,本手法の有効性を確認した.
著者
青木 一真 黒柳 奨 クグレ マウリシオ ヌグロホ アント サトリヨ 岩田 彰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.88, no.12, pp.2291-2300, 2005-12-01
参考文献数
12
被引用文献数
4

本論文ではSVMにおけるマージンをベースとした特徴選択手法を提案する.しかし一般的なマージン(Normal Marginと呼ぶことにする)の場合,マージンの大きさとSVMの学習により得られる識別関数の良さが適切に対応しない場合があることが明らかとなった.すなわち,Normal Marginを評価値とした特徴選択を行って得られた特徴セットが,必ずしも最良の識別関数を与えるとは限らない.そこでこの問題を解決するために Confident Margin(CM)という新しい評価基準を導入し,それを用いた特徴選択アルゴリズム SBS-CM を提案する. SBS-CM による人工データや実データを用いた実験を行った結果,従来手法よりも良い結果を得ることができた.また評価値CMの値の変化から最適な特徴セットをおおよそ求めることが可能であった.
著者
疋田 真一 笠井 健
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.85, no.6, pp.1114-1123, 2002-06-01
参考文献数
16
被引用文献数
3

視覚目標注視中に頭部が左右に運動すると,前庭性の補償性眼球運動(LVOR)に続いて視覚による追従性眼球運動(パシュート)が起こり,視覚の安定化が図られる,これら二つの眼球運動系の相互干渉の機構を明らかにするため,頭を突然左右に加速する刺激を与え,視覚目標ありの場合と消えた目標を想起したときのLVORの速度,及び頭を静止させ目標のみを動かしたときのパシュート速度を調べた.LVORの潜時はパシュートに比べて有意に短く,目標の有無はLVORの潜時に影響を与えなかった.しかしながら,パシュート系が働き始める時刻以降は,視覚のフィードバックによりLVORの速度に大きな違い(視覚目標あり>目標想起)が現れた.並進運動中のゲイン(眼球速度/目標の相対速度)は,視覚目標ありのLVORが最も大きく,パシュート,目標想起のLVORの順に小さくなった一また,頭の運動開始直後の時間帯(〜216ms)について,目標を想起したときのLVORとパシュート速度の和は,目標ありのLVORの速度にほぼ一致した.これらの知見は,otolith系とパシュート系のそれぞれの中枢で生成された信号が重畳されて最終的な眼球運動指令がつくられていることを示唆する.
著者
野添 潤一 五味 裕章 党 建武 本多 清志
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.88, no.9, pp.1944-1953, 2005-09-01
参考文献数
21
被引用文献数
7

人は, 舌・顎・唇などの複数の調音器官を巧みに操ることで発話を行っている. 特に, 唇は舌と並んで, 柔軟な変形や微妙なせばめを実現し, 音声の共鳴を制御している. 本研究では, この発話時における口唇形状の形成メカニズムを構成的に探るため, MRIデータから唇, 上・下顎などの器官及び口唇周囲筋の構造データを抽出し, 3Dばね-ダンパ-マス系及び筋収縮ダイナミックスモデルを用いて口唇の力学モデルを構築した. 特に口輪筋は, 従来から知られている機能的4分割に加え, 口輪筋辺縁部と周辺部に分割し, それらの詳細な形状をモデルに反映させた. その結果, それらの筋の部分的収縮により, 唇の突出しやすぼめなどの様々な発声に必要な豊かな口唇形状形成が可能になることを示した.
著者
芦田 和毅 永井 弘樹 岡本 正行 宮尾 秀俊 山本 博章
出版者
社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.88, no.9, pp.1817-1824, 2005-09-01
参考文献数
20
被引用文献数
11

本論文では, カラー情景画像に現れる文字列を抽出する手法について提案する. ほとんどのカラー情景画像に現れる単語若しくは文字列は, 同じ色とフォントで印刷されている. そこで本手法では, まずエッジに基づき画像を大まかなブロックに分割する. 次にそれらのブロックをクラスタリング手法によって色の類似している領域に分割し, 各領域中に存在する外接最小方形について縦横比, ピッチなどの特徴を用いてそれらを統合し文字列パターンの候補を得る. 更にこれらの候補に対して幾何学的特徴を求めてSVMにより文字列パターンを識別する. ICDAR 2003 Text Locating Competitionで用いられた251枚のカラー情景画像について実験を行い, 本手法の有効性を確認した.
著者
莫 舸舸 青木 由直
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.87, no.12, pp.2124-2135, 2004-12-01
被引用文献数
29

道路標識は交通安全に対して大きな役割を担っている.本論文では,ドライバが標識を見落とすことを防ぐため,車内に設置されたカメラによって撮影した画像から道路標識を抽出し,道路標識の種類とタイプを認識する手法を提案する.本研究では,提案した輝度・彩度分布特徴パラメータ「輝彩度」(街値)を利用し,カラー画像から標識候補画素を抽出することにより,標識の抽出牢の向上を図っている.「シンメトリフレームワーク(symmetry framework)形状判別法」により,標識候補領域の5種類の形状を判断できることを示し,処理時間の大幅な軽減を図っている.シンボルと背景の輝度差と色度差を利用し,標識シンボル領域を抽出している.抽出した標識シンボル領域の形状判断により,標識のタイプを確定できる.また,3種類の色,5種類の形状,16タイプの標識が存在するカラー画像500枚を用いた評価実験の結果,96.2%の高抽出牢と93.3%の高認識牢を達成するとともに,平均処理時間が約0.1秒とほぼ実用的な処理時間を達成できることを示した.
著者
新田 直子 馬場口 登
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.86, no.8, pp.1222-1233, 2003-08-01
参考文献数
12
被引用文献数
21

本論文では,放送型スポーツ映像が本来もつ意味的構造を考慮し,映像に対してその構造,意味内容を十分に表現する意味内容記述モデルを提案する.更に,その記述にかかる労力を軽減するため,意味内容に関する情報を多く含むと考えられる映像内の発話に着目し,これをテキスト形式にしたものに対し,ベイジアンネットワークの利用により,意味内容に基づいたセグメントヘの分割を試みる.また,画像ストリーム上の特徴の利用により映像に対して同様の意味をもつセグメントヘの分割を行い,これらの結果を時間的に対応づけることによって,より正確な映像分割とともに,各映像セグメントヘの意味内容を含んだ発話部分の特定を実現し,意味内容獲得の自動化を目指す.本論文では実際に放送されたアメリカンフットボール,野球映像に対して提案手法を適用し,それぞれ再現率93%,93%,適合率89%,94%と良好な結果を得ており,提案手法の有効性を示している.
著者
和田山 正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.88, no.2, pp.170-187, 2005-02-01
被引用文献数
11

本論文は, 記憶性の通信路の一種であるバースト誤り通信路に適した反復復号法の原理, 並びにこの分野の研究動向に関する紹介を目指したものである.論文の前半では, バースト通信路モデル, 既存のバースト誤り訂正手法, LDPC符号の基礎などについて述べる.後半では, Belief Propagationに基づく記憶性の通信路に適した反復復号法の原理を紹介したのち, 具体例としてギルバート通信路, 二次元バースト通信路に適した反復復号法についてその詳細を示す.
著者
村上 仁一 水澤 紀子 東田 正信
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.85, no.7, pp.1157-1165, 2002-07-01
被引用文献数
15

録音編集方式による音声合成において,可変部の単語件数が多い場合,必要な音声をすべて同一話者の音声で録音するのは困難である.本論文では,必要な単語の一部を同一話者の声で録音し,その音声波形から切り出した音節波形を信号処理をしないで接続することで,録音していない単語音声を合成する方法を検討した.本方式は,各音節の韻律的な情報として単語のモーラ数と音節の単語内モーラ位置を使用し,ピッチ周波数やパワーの定量的な分析や予測を行わないのが特徴である.日本の地名を合成対象として必要録音件数の調査を行ったところ,1万7千件の録音音声から4,5,6モーラ語の地名10万5千件が合成できることがわかった.また,地名を合成して聴覚実験を行ったところ,合成音声の品質も十分実用的なものであることがわかった.
著者
相澤 清晴 石島 健一郎 椎名 誠
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II (ISSN:09151923)
巻号頁・発行日
vol.86, no.6, pp.807-815, 2003-06-01
参考文献数
14
被引用文献数
42

筆者らは,センシングデバイスと情報処理機器の小型化が進み,ウェアラブルなビデオ機器により個人の長期間の体験映像をそのまま映像として記録することが可能になると考えている.しかしながら,長期間の体験映像を取得記録できたとしても,その大量な映像データ中から個人にとって重要な部分をどのように選び出して見るかという問題が残る.個人にとって興味ある映像など重要な部分を選び出すためには,その個人の主観を反映させて映像を要約する手法が必要になる.本論文では,ウェアラブル機器で記録した個人体験映像の要約と構造化について論じ,主観を反映させた効率の良い映像要約のために,映像と同期記録した脳波による実験を示し,精度良く興味映像を抽出し得ることを示す.