著者
中川 聖一 神谷 伸 坂井 利之
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09135713)
巻号頁・発行日
vol.J64-D, no.2, pp.116-123, 1981-02-25

本論文は,不特定話者の音声自動認識のための個人差,特に年齢・性別が同一層である話者間の個人差の正規化法について述べる.まず,パターンマッチング法で,個人差によるパターン変動に対処するためには,個人差に関する何んらかのモデル・構造を導入する必要のあることを述べる.これに基づいて,音声スペクトルの周波数軸上とスペクトル強度軸上での非線形なマッチングによる正規化法を提案し,この手法を10数字音声の認識に適用する.更に,この手法は,キーワードを用いた話者適応化にも有効であることを示す.最後に,標準パターンの選択法について述べ,これにより不特定話者に対して安定な認識率を得ることができることを示す.本手法により,不特定男性話者30名の10数字音声に対して,約97.6%の認識率を得ることができた.
著者
美濃導彦 坂井利之 金井武雄 美濃導彦
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2013, no.1, pp.1-8, 2013-03-07

様々な環境に設置された防犯カメラで観測された人物画像の特徴量は被写体の姿勢,照明などの撮影条件によって大きく変化する.そのため,人物照合には撮影条件によって(1)同一人物の人物画像の特徴量間の距離が大きい,(2)別人同士の人物画像の特徴量間の距離が小さい,という2つの問題がある.特定人物画像検索において,従来提案されてきた適合性フィードバックでは,問題(1)には対応できるが,問題(2)には対処できない.本稿で提案する条件分割型適合性フィードバックでは,各防犯カメラでの人物迫跡で得られる情報をもとに,撮影条件を分類してフィードバックすることで,各撮影条件の画像特徴量が混合されることを回避し,問題(1)(2)の両方に対処する.複数の防犯カメラ映像に対して人物画像を検索し,通常の適合性フィードバックと比較することで本手法の有効性を確認した.
著者
美濃導彦 岡崎 洋 坂井 利之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.32, no.4, pp.513-522, 1991-04-15
被引用文献数
18

画像データベースにおいて 各画像に検索のためのインデックスを自動的に付ける方法は 検索方法と関わる重要な問題である我々は 人間に親和性のある検索方法を実現するためには画像を認識することが必要であるとの立場から 画像を認識し その属性特徴をキーとして 画像を検索できるシステムを風景画像中の山を対象として作成したまず 入力された画像に存在する山は 前処理 領域分割処理などの構造化処理を経て認識されるこれにより システムは山の領域を判別できるので 山の属性特徴としての 色 形 大きさ 頂上の位置の4つの属性特徴を計興し これを画像検索のためのインデックスとする検索方法は システム主導型の検索方法であるすなわち システムが山の属性特徴をメニュ形式で提示し 利用者はそれを対話的に選択していくことにより検索をすすめるこの方法は 他の方法(スケッチによる類似検索法など)よりも柔軟性にかける場合もあるが 記憶が暖昧なときでも画像が検索できるという大きな利点がある実際にシステムを作成し デモンストレーションにより評価した結果 対象物の属性特徴を用いた画像検索法の有効性が確認できた