著者
波多野 裕 穗刈 治英 島田 正治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EA, 応用音響 (ISSN:09135685)
巻号頁・発行日
vol.107, no.269, pp.43-48, 2007-10-12
被引用文献数
1

DVDや地上波ディジタル放送などにおいて3/2スピーカ配置が推奨されている.しかし3/2スピーカ配置は前方の音像定位に着目したスピーカ配置であり,側方音像定位については困難であることが指摘されている.本研究は3/2スピーカ配置において側方に安定して音像を定位させることを目的としている.本報告ではまずマルチチャネルトランスオーラル技術を用いて音像を再生する伝達関数を導出する.次に側方の定位制御を単純化するためスピーカ数の削減を検討する.このとき安定した側方静止音像定位を得るスピーカ配置を正規化二乗誤差とシステム評価値の両面から検討し,スピーカ数とスピーカ配置の関係を見出した.この条件のもとで受聴評価試験を行い,側方音像定位の有効性を確認した.その結果5chでは前後の誤判定が多く,安定して音像を定位させることは難しいことがわかった.
著者
西村 明 佐々木 實
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EA, 応用音響
巻号頁・発行日
vol.93, no.186, pp.23-30, 1993-08-20
被引用文献数
1

被験者をスピーカ距離毎に別個のグループに分けて実験を行う手法を用いて、無響室内の実音源によって生ずる音像の距離を被験者に判断させ、正面方向と左側方60゜において音像距離の絶対判断の手がかりについて考察を行った。また、音源の種類、スペクトル、提示音圧レベルを変えて、続けて被験者に音を提示する実験によって、音像距離の相対判断の手がかりについて考察を行った。その結果、以下の結論を得た。1)側方では両耳間差が音像距離の絶対判断の手がかりとなっている。2)音源の種類は音像距離の相対判伴の手がかりとなっている。3)スペクトルの変化は音圧レベルとほぼ独立した音像距離の相対判伴の手がかりとなっている。
著者
伊藤 彰則 王 欽悦 鈴木 基之 牧野 正三
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.50, pp.41-46, 2005-05-26
参考文献数
9

自然な対話の映像の中から笑いを検出するための手法について述べる。笑いは対話中の表情としてもっとも多く見られるものであり、これを検出することはユーザの心的状態の推定にとって有用であると考えられる。また、笑い声を高精度に検出できれば、対話音声の認識誤り削減に有効である。本稿では、カメラで撮影したユーザの顔から表情を認識する手法と、マイクで収録したユーザの音声から笑い声を検出する手法を組み合わせることで、笑いの検出精度を向上させる方法を検討する。顔画像による表情認識では、顔の特徴点検出に基づく特徴量を用い、特定話者の場合で再現率・適合率とも80%以上の精度で自然な対話映像から笑いの表情を認識することが可能になった。また、GMMによる音声の識別と画像情報を組み合わせた笑い声の検出手法を提案した。実験結果より、音声と画像の統合により適合率が向上することが示され、最終的には再現率・適合率とも70%以上の値が得られた。This paper describes a method to detect smiles and laughters from the video of natural dialogue. A smile is the most common facial expression observed in a dialogue. Detecting a user's smiles and laughters can be useful for estimating the mental state of the user of a spoken-dialogue-based user interface. In addition, detecting laughter sound can be utilized to prevent the speech recognizer from wrongly recognizing the laughter sound as meaningful words. In this paper, a method to detect smile facial expression and laughter sound robustly by combining a image-based facial expression recognition method and an audio-based laughter sound recognition method. The image-based method uses a feature vector based on feature point detection from face images. The method could detect smile faces by more than 80% recall and precision rate. A method to combine a GMM-based laughter sound recognizer and the image-based method could improve the accuracy of detection of laghter sounds compared with methods that use image or s und only. As a result, more than 70% recall and precision rate of laughter sound detection was obtained from the natural conversation videos.
著者
滝本 清仁 廣瀬 英雄
出版者
日本計算機統計学会
雑誌
日本計算機統計学会大会論文集
巻号頁・発行日
no.22, pp.17-20, 2008-05-22

インターネットアクセスなどにより蓄積された多大な顧客情報データベースを用いて,特定の顧客の潜在ニーズを探索しながら行動パターン予測し,顧客が嗜好する商品を薦める推薦システムが最近よく用いられている.システムのアルゴリズムとして協調フィルタリングが用いられる場合があるが,ここでは協調フィルタリングにマトリックス分解法を組み込んだときの予測精度について述べる.
著者
水口充
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.110, pp.23-28, 2007-11-12

文字の位置や大きさなどの属性を時間的に変化させる,動的な文字情報表現がコンピュータによって可能になり,映画やテレビやビデオゲームなどの映像表現として日常的に目にするようになってきた.本稿では,このような文字のアニメーション表現を記述するための XML 言語とその処理系の開発の取り組み,および応用について紹介し,情報表現手法としての可能性について議論する.Animated text, also known as kinetic typography, is the visual expression method that temporally changes displaying attributes such as position and size. As computer has put it to practical use, we can see many works in films, TV programs, and video games today. We report our efforts to make animated text widely applicable, including an XML language for description of animated text, processing modules for the language, and applications. We also discuss its possibility for information visualization.
著者
林 純一郎 村上 和人 輿水 大和
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.8, pp.2102-2109, 1997-08-25
被引用文献数
10

横顔似顔絵生成では, 顔部品の輪郭認識が最も重要である. 特に, 平均顔と中割り法を用いて個人性特徴の抽出と誇張を行う場合には, 二つの顔の輪郭点の対応付けの自動化が似顔絵生成上, 重要かつ最も大きい課題となる. 筆者らは, 顔画像からの簡易な輪郭抽出法, 輪郭の階層的再標本化法, および中割り法と部分領域のアフィン変換の組合せによる輪郭と顔の内部部品デフォルメ法を組み合わせることにより横顔似顔絵生成法を構築した. そして, 正規化のための2点の手入力を除いて自動生成を実現した. 本論文では横顔似顔絵生成の完全自動化のための諸課題および改善手法について整理・検討する.
著者
田中 奈々絵 奥平 雅士
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会技術報告 (ISSN:13426893)
巻号頁・発行日
vol.33, no.6, pp.173-176, 2009-02-04

本稿では,携帯電話のカメラで撮像された画像から点字ブロックを検知し案内するための画像処理技術を用いた支援方式について述べる.携帯電話の処理能力を考慮した画像処理手法と案内内容を絞ったわかりやすい音声ガイダンスについて検討した.様々な状況下の点字ブロック画像を学習データとしてSupport Vector Machineであらかじめ識別平面を求める.携帯電話上ではまず点字ブロック画素をこの平面で分離し,次に画像を3×3に区切った各領域の点字ブロックの有無パターンから案内内容を決定する.最新の携帯端末上で90枚の画像を用いて実験を行った結果,撮像後約3秒の処理時間で標準的な画像に対し有効な結果を得た.