著者
高橋 正樹 三須 俊彦 合志 清一 藤田 欣裕
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.8, pp.1672-1680, 2005-08-01
被引用文献数
22

画像内の物体(オブジェクト)抽出技術を用いて野球映像からボールを抽出し, その位置情報をもとに投球軌跡CGを作画する手法を考案した. 複数の画像間差分を利用して高速移動オブジェクトを抽出し, 様々な画像特徴のフィルタリングを行うことでボールオブジェクトのみをロバストに選定する. またカルマンフィルタと最小二乗法を併用したボールの位置予測処理を行い, 高速な自動追跡処理, 及び高輝度領域(打者のユニフォーム部分や白字広告部分等)での軌跡作画を実現した. 本手法を利用し, 投球軌跡作画装置(B-Motion)を開発した. 野球中継においては新たなカメラの設置やキャリブレーションの必要がないため, 運用が容易である. 2004年よりNHKプロ野球中継, スポーツ教育番組にて放送応用を実現している. 本論文ではまず高速なボール抽出・追跡手法について述べ, 続いて軌跡作画手法及び装置の構成や特徴について述べる. 最後に本装置を放送へ応用した結果を報告する.
著者
金子 拓也
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.4, pp.675-686, 2005-04-01
参考文献数
12

本論文は, データに含まれる欠損値の対処に際し, 有力な補完方法を提案するものである.この提案する補完方法は, 実際のデータを用いた数値実験から, いくつかの既存法よりも, 判定精度, 平均対数ゆう度の二つの観点から最も優れた対処法であることが確認された.理論的な背景は, この補完法が, 欠損ではないデータの内部的な構造に依存せずに処置を施すためである.これによって, 学習用データに対するオーバフィットを回避し, 結果として実証用データに対しても判定精度の高いモデルを構築することが可能となった.本論文の構成は, まず, 削除法, 平均値補完法, k-NN法, 重み付きk-NN法, の既存4手法と, 提案する新しい手法の概要を紹介する.次に欠損値をもたない実際の医療データに対し, 様々な割合で任意の位置に故意に欠損を発生させ, 先に紹介した5手法によりデータを整備する.そしてこれらのデータに基づいてモデルを構築し, 判定精度, 平均対数ゆう度の二つの観点から5手法の有効性を判定する.最後に, これらの結果が得られた理論背景について各手法の特性を比較しながら検討するという内容となっている.
著者
大西 正輝 泉 正夫 福永 邦雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.10, pp.1590-1597, 1999-10-25
被引用文献数
24

近年,ネットワーク技術の発展に伴い,映像情報などの大容量データ転送が可能となり,大学や各種の学校ではサテライトシステムなどを用いた遠隔講義が行われている.講義風景を撮影する方法として,1台の固定したカメラを用いる方法や,複数台のカメラをディレクタなどが各時点でスイッチングする方法が考えられる.しかし,前者では講義の臨場感が伝わらず,また板書が見にくいといった問題点があり,後者ではカメラを制御する人手が必要となる.本論文では,動画像処理により講義映像の撮影・編集を自動化する手法を提案する.まず,映像中に発生した画素ごとの情報量を定義する.次に,その情報の分布に基づいて複数台のカメラを制御し,あらかじめ生成したスイッチング規則に従い映像の選択を行うことで,受講者に必要な情報を多く含む臨場感のある講義映像をリアルタイムで生成する.また,受講者の視認テストにより本手法の有効性を確認した.
著者
内野 一 白井 諭 横尾 昭男 大山 芳史 古瀬 蔵
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.6, pp.1167-1174, 2001-06-01
被引用文献数
1

機械翻訳システムの有効な活用として, 市況速報記事を対象にした日英機械翻訳システムを開発した.システムは, ルール型翻訳とテンプレート型翻訳とのハイブリッド構成であり, 実験では, 文単位で90%, 記事単位で70%の高い翻訳正解率を得ることができた.この評価結果に基づき, 更に対象を決算速報記事に限定し, テンプレート型翻訳による自動翻訳システムALTFLASHを構築した.ALTFLASHは日本語の決算速報を英文で配信する実用システムとして導入され, 従来人手で行われていた翻訳作業に比べ, 処理時間, 翻訳品質, 費用などの面で大幅な改善効果を示した.
著者
丸山 一郎 阿部 芳春 江原 暉将 白井 克彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.2, pp.184-192, 2002-02-01
被引用文献数
9

本論文では,事前収録されたテレビ番組に対して番組VTRと事前電子化原稿から聴覚障害者向けの字幕を自動的に付与する技術の中で,音声と字幕の同期タイミングを検出する字幕提示タイミング検出手法について述べている.背景音が重畳している放送音声に対しては,音素HMMワードスポッターだけに基づいたタイミング検出手法では十分な検出精度が得られない.番組の原稿中の各文に対してワードスポッティングにより複数のタイミング候補を検出し,音響的なゆう度に加え三つのスコア(原稿の時間順序,原稿から推定される発声時間との比,音声らしさ)を用いた動的計画法を行い,番組全体として最適なタイミングを選択する手法を提案した.ドキュメンタリー番組10回分を対象とした評価実験において,許容検出誤差を1秒とした場合に検出率99.0%,3秒とした場合に99.7%の検出精度が得られ,実用的な方式であることが示された.
著者
今村 弘樹 剣持 雪子 小谷 一孔
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.1, pp.12-22, 2002-01-01
被引用文献数
6

動物体解析の有力な手法としてオプティカルフロー推定法がある.しかし, 照明条件の変化する状況下においてフローの推定精度が低下するという問題点がある.この問題点を解決するためにいくつかの手法が提案されている.これら従来手法はそれぞれ異なる特性を有している.本研究は, 従来手法の特性をすべて有する高精度なオプティカルフロー推定法の提案を目的とする.
著者
大淵 康成
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.5, pp.821-832, 2005-05-01

複数のマイクを使った音声認識において, 個々のマイクへの入力の品質が大きくばらついていることがある.そのような場合, それらの入力を重ね合わせることより, 最適なマイクを正しく選ぶことが重要である.本研究では, 同一発声に対する複数チャネルの音声データをもとに, 音声認識に最も適したチャネルを選択する手法として, デコーダに基づくチャネル選択(Decoder-based Channel Selection: DBCS)を提案する.各チャネルの評価には, 従来用いられていた信号対雑音比や音声認識ゆう度などに代わり, デルタケプストラム正規化方式による特徴補償前後の認識仮説の比較に基づく手法を導入する.また, この手法を様々なマイクの組合せからなる部分遅延和アレーと組み合わせることにより, 更に性能向上が得られることを示す.評価実験の結果, デルタケプストラム正規化, チャネル選択, 部分遅延和アレー利用の三つの方式が相補的に働き, 全体として従来の遅延和アレー方式に比べると, 二つの評価データセットに対してそれぞれ35.8%/26.8%の誤り削減率が得られた.
著者
三浦 高志 板垣 史彦 横山 昭彦 山口 百恵
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.11, pp.1672-1682, 2002-11-01
被引用文献数
2

本論文は,適応的直交変換によるベクトル量子化において,ベクトル探索を高速化する方法を提案する.高速化の原理は,符号化対象ベクトルの近似に適した辞書ベクトルの探索範囲を絞り込むことで比較回数を削減する方式である.絞込みは,辞書ベクトルを複数の基準ベクトルとの角度の昇順にあらかじめソートしておき,符号化対象ベクトルと基準ベクトルとの角度から近似に適したベクトルの位置を推定し,推定された位置周辺のベクトルだけを候補ベクトルとすることで行われる.また,提案方式の有効性は数値実験により検証される.
著者
坂野 鋭 武川 直樹 中村 太一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.8, pp.1549-1556, 2001-08-01
被引用文献数
36

本論文において我々は,新しい物体認識アルゴリズム,核非線形相互部分空間法を提案する.前田によって提案された相互部分空間法は複数の入力画像を主成分分析することにより,高度な物体認識を実現する優れた手法である.しかしながら,通常の部分空間法と同様,カテゴリーの分布が非線形構造をもつ場合には性能が低下するという問題がある.この問題を解決するために我々は強力な非線形主成分分析法として知られている核非線形主成分分析を相互部分空間法に適用し,新しい物体認識アルゴリズム,核非線形相互部分空間法を理論的に導出した.提案手法を顔画像による個人識別問題に適用したところ,最高精度では従来法と大きな差がつかなかったものの,提案手法を用いた実験では物体運動の自由度と高い認識率を示す部分空間次元数の関係が無矛盾に説明できることがわかった.また,提案手法では認識辞書がよりコンパクトな構造をとり,大規模認識問題に対して有効である可能性を示すことができた.
著者
清山 信正 今井 篤 三島 剛 都木 徹 宮坂 栄一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.6, pp.918-926, 2001-06-01
被引用文献数
11

一般に高齢者にとって, 早口で話された音声が聞き取りにくいと感じられる場合がある.これを補償するため, 発声者の声の特徴を残したまま「ゆっくり」した音声に変換する話速変換技術の開発が進められている.一方, ビデオの早見や音声内容の検索を目的に早口に変換する試みもあり, それらの話速変換技術の一部は既に実用に供されている.また, マルチメディアの発展により, ハードディスク上に記録された映像・音声を可変速で再生する環境も整いつつある.同時にテキスト音声合成の高品質化に伴い, 音声波形の継続時間長を直接制御する技術としても, 高品質な話速変換技術が不可欠である.本論文では, 話速変換技術の広範な応用とその品質の自然性向上を目的として, 無声区間も含めた伸縮による話速変換方式を提案するとともに, 高齢者に対する音声放送サービス向上を目指した小型の話速変換器の開発について報告する.
著者
橘 高志 藤吉 正明 貴家 仁志
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.3, pp.850-859, 2004-03-01
被引用文献数
14

動画像へリアルタイムで透かしを埋め込むことを目的に,埋込みに伴う画質劣化を自動的に制限する画質保証型の電子透かし法を提案している.この提案法は,画像に依存せず常に所望の画質(PSNR)をもつ透かし画像の生成を可能とする.更に,透かし抽出時に原画像を必要としない非参照型電子透かし法の特徴も有する.従来の画質保証型電子透かし法では,透かし系列要素は実数値でありかつ正規分布に限定されるが,提案法ではこれらの制約は解除され,種々の統計分布をもつ透かし系列に適用可能である.また,提案法は,透かし系列を抽出することなく,埋め込んだ透かし系列の消去が可能であり,消去することによって画質を向上できる.シミュレーションでは,一様分布の2値系列を透かし系列として埋め込み,画質が保証されること,透かし系列の消去により画質が向上することを確認している.
著者
長谷山 美紀 金子 千晶 北島 秀夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.3, pp.661-664, 2005-03-01
被引用文献数
1

リング周波数フィルタは, 高速かつ高精度に眉間の位置を検出できるが, 前髪を眉の近くまでおろしている人の顔に対しては, 適用ができない.本論文では, このような場合にも, 適用を可能とするためにフィルタの適用領域を限定する前処理を提案する.
著者
吉村 ミツ 村里 英樹 甲斐 民子 黒宮 明 横山 清子 八村 広三郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.3, pp.779-788, 2004-03-01
被引用文献数
24

本研究では,日本舞踊動作を解析して,舞踊家が師匠の技を模倣している程度,すなわち上達度を評価している.利用データは,赤外線追跡装置で取得した日本舞踊動作の3次元時系列である.筆者らの以前の研究では,このデータから注目動作部分を抽出するために,移動と回転に応じて動く3種類の動座標系を用いた.本研究ではその動座標系を改善した上で,移動,回転,向き補正,腰部揺動を同時に考慮した動座標系を考え,それを1回の変換で実現するアルゴリズムを考案している.筆者らは以前の研究で,舞踊家の上達度を客観的・定量的に表す指標として,動作の安定度と周波数特性に関する指標を定義した.本研究ではこれとは別の側面として,移動量に関する指標とガボール変換を利用したスペクトル成分の指標を定義している.ある流派の師匠と,その師匠から学んだ経験年数,性別が異なる4人の舞踊家,合わせて5人に舞踊実験を行ってもらい,注目動作の抽出と,その抽出結果を用いた指標の測定を行い,提案指標に基づいて上達度の評価を試みている.抽出が十分な精度で実現していて,指標が上達度や性による違いを表していることを確かめている.
著者
ツァガーン バイガルマ 清水 昭伸 小畑 秀文 宮川 国久
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.1, pp.140-148, 2002-01-01
被引用文献数
16

本論文では, 3次元可変形状モデルを用いた腹部CT像からの腎臓領域の抽出法を提案する.この方法は, 適当な位置に配置した初期モデルを連続的に変形させて目的の輪郭面を抽出するが, 今回は特に輪郭形状の平均やばらつき, 及び, 近傍の輪郭曲面との相関を考慮して変形を行う手法を提案する.具体的には, モデル曲面上の主曲率に注目し, その平均値と分散, 更に, 近傍の曲面との共分散を用いて変形する手法を開発した.本文では, 提案手法を実際の3次元腹部CT像からの腎臓領域抽出問題に適用した結果を示し, 本手法の有効性について議論する.
著者
田中 正行 奥富 正敏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.11, pp.2200-2209, 2005-11-01
被引用文献数
21

複数の低解像度画像より一つの高解像度画像を復元する方法として超解像処理がある. 再構成型と分類される方法が広く利用されている. この再構成型超解像処理では, まず初期の高解像度画像を設定し, そこからカメラモデルに基づき観測画像である低解像度画像の各画素値を推定する. 推定された画素値と実際の観測画素値の誤差を最小にするように高解像度画像を更新する. 収束するまで更新処理を繰り返すことにより, 高解像度画像を求める手法が再構成型超解像処理である. 再構成型超解像処理は, 高解像度画像の画素の数だけの未知数があることや, 1回の更新につき複数の低解像度画像の総画素数分の画素値推定計算が必要であることなどから, 計算コストが大きい. 本論文では, 更新ごとに必要な計算コストを低減させることを目的とした高速化アルゴリズムを提案する. 提案手法は, 高解像度画像空間に離散化点とそれに対応する近傍領域を設定し, その近傍領域内に含まれる複数の観測画素値の平均値を利用し, その平均値と離散化点に対する推定画素値の誤差を最小にする方法である. ある近傍領域に対して, 従来法では近傍領域に含まれる観測画素の数の推定計算が必要であるが, 提案手法では1回の推定計算で済む. 合成画像及び実画像を使用した実験から, 提案手法は従来法と比較して約1.4〜8.5倍の高速化が確認できた. また, 推定精度は従来法とほぼ同程度であることも確認できた.
著者
大西 正輝 村上 昌史 福永 邦雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.4, pp.594-603, 2002-04-01
被引用文献数
42

本論文では,人手を介さずに板書主体の講義を自動的に撮影する手法として,講義の状況を理解することで撮影領域を決定し,得られた複数の映像を評価することで講義映像として最も適している映像にスイッチングを行う知的自動撮影手法を提案する.まず,講義の状況を理解するために,固定カメラによって撮影した講義映像から講義者と黒板の板書に関する情報を抽出し,それらの情報を用いて講義者の行動推定を行う.次に,講義者の行動に基づいて各カメラにおいて撮影領域を決定し,複数のカメラ位置から映像を取得する.最後に,得られた複数の映像をそれぞれ評価することにより,現在の講義状況を最も効果的に表している映像を選択する.実際に講義の自動撮影を行い,本手法の有効性を確認した.
著者
北岡 教英 赤堀 一郎 中川 聖一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.2, pp.500-508, 2000-02-25
被引用文献数
37

雑音環境下の音声認識の前処理として用いられる, パワースペクトル領域でのスペクトルサブトラクションでは, 音声と雑音の間の相関の影響で雑音除去が十分でないことが指摘されている.本論文では, 相関の影響を抑えるための方法として時間方向スムージングを提案する.これは, パワースペクトルの各成分ごとにスムージングを行うものであり, 統計的に相関の影響を小さく抑えることができる.更に, スムージングによる時間分解能の低下を防いでスムージングをより効果的に実現するために, 短い分析窓長で分析を行う方法を提案する.大語彙(い)単語認識実験により, 時間方向スムージング, 特に短い分析窓を用いた場合に有効であることを示す.また, 時間方向スムージングを用いたスペクトルサブトラクションに, 音響モデルを雑音付加音声で学習する雑音付加学習を併用した場合に, 更に認識率が向上することも示す.
著者
入江 友紀 松原 茂樹 河口 信夫 山口 由紀子 稲垣 康善
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.10, pp.2169-2173, 2005-10-01
被引用文献数
6

発話意図タグの設計と評価について述べる. 設計した意図タグは, 詳細度に応じて階層化している. 名古屋大学CIAIR車内音声対話コーパスの約35, 000発話に意図タグを付与した. 信頼性を評価するため, コーパスの一部を用いてタグ付与実験を実施した.
著者
貞光 九月 三品 拓也 山本 幹雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.9, pp.1771-1779, 2005-09-01
被引用文献数
6

混合ディリクレ分布を多項分布パラメータの事前分布とした(合成分布は混合Polya分布), 生成文書モデルを提案し, 統計的言語モデルへの応用という面で高い性能をもつことを示す. 本論文では, 混合ディリクレ分布のパラメータ推定法及び適応時に必要な事後分布の期待値推定法をいくつか述べた後に, 二つの代表的な従来の文書モデルと比較する. 一つ目の従来モデルは, 統計的言語モデルにトピックを取り込むときによく使われるMixture of Unigramsである. 二つ目は代表的な生成文書モデルであるLDA(Latent Dirichlet Allocation)である. 新聞記事を用いた文書確率及び動的に適応するngramモデルを用いた実験で, 提案モデルは従来の二つのモデルと比べて低い混合数で低いパープレキシティを達成できることを示す.
著者
川上 進 松岡 雅裕 岡本 浩明 細木 信也
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.12, pp.2786-2797, 2000-12-25
被引用文献数
3

歩行や車の運転に不可欠な空間視は, 網膜に映るオプティカルフローに基づいて行われることを, 心理学者のGibsonが50年ほど前に見出している.この空間視には, 「自己移動方向の検出」と「環境を構成する平面の空間認識(平面の3次元方位と奥行)」がある.神経生理学が進展し, 自己移動方向をオプティカルフローから検出する細胞が大脳の運動視中枢(MST野)で見出されている.しかし, オプティカルフローに基づいて平面の空間認識を行う細胞は, Gibsonの心理学的発見にかかわらず報告されておらず, またモデルの報告もない.本論文では, 3種類の平面パラメータ(平面の3次元方位, 平面に到達するまでの時間, 平面までの最短距離)を, オプティカルフローを統合して検出するアルゴリズムを報告する.到達時間と方位は複比変換と極変換を用いて, また最短距離と方位は小円変換を用いて検出される.次に, これらアルゴリズムと前報の「大脳MT野で局所運動を検出する神経網モデル(Vision Research, 1996, 1999)」に基づいて, 網膜からMT野を経てMST野までの神経網をモデル化する.また, そのモデル神経網(0.16億個の細胞とそれを結ぶ4.6億本の神経網で構成される)をコンピュータ上に構築して, 到達時間と方位を正しく検出できることを示す.