著者
山添隆文 栄藤稔 吉村健 辻野孝輔
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.409-415, 2011-07-20

本稿では,重みつき有限状態トランスデューサ(WFST)を用い,ノイズ領域が文字列として誤検出されることが課題となる情景画像からの日本語語彙検出手法を提案する.提案手法では,情景画像から網羅的な文字候補を抽出し,それらすべての組み合わせを表現したWFST と,大規模な語彙データセットから辞書を構成するWFSTとを合成することより,最終的な語彙検出結果を得る.これにより,辞書に含まれない文字候補の組み合わせとなるノイズ領域を除去することが可能となる.また,情景画像からの文字候補の抽出において,画像における位置情報を保持したままWFST を生成するため,同一の画像領域から最適な語彙を検出することができる.日本語を含む情景画像のデータセットにより検証を行い,ノイズ領域を除去しつつ日本語の語彙を検出できることを確認した.
著者
辻野 孝輔 鴫谷 篤人 小林 亙 泉 知論 尾上 孝雄 中村 行宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CAS, 回路とシステム (ISSN:09135685)
巻号頁・発行日
vol.103, no.333, pp.55-60, 2003-09-22

近年、2チャンネル・ステレオを用いた三次元音響効果システムが研究、開発されている。こうしたシステムにおいては、頭部伝達関数(HRTF: Head Related Transfer Function)を用いて音源の立体感を表現することが一般的であるが、従来の手法には、演算量が大きくリアルタイム実装に適さないという問題点があった。これに対し、頭部伝達関数の特徴が周波数帯域によって異なることを利用した、組み込み実装に適した低演算量のアルゴリズムが提案されている。我々は、このアルゴリズムを利用した音像定位処理の高精度実装を行い、また、実装したシステム上で移動音を自然に表現するための音像位置の補間手法の検討および評価を行ったので、これを報告する。