著者
武田 昌一 杤谷 綾香 橋澤 保輝 加藤 修一 大山 玄
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.60, no.11, pp.629-638, 2004-11-01
被引用文献数
4

4名の声優が発声した銀行端末(ATM)案内文音声を対象として,感情を合めた場合と含めない場合の韻律的特徴の差異を解析した。更に分散分析により,話者・文依存性の有無を調べた。分散分析の結果から,韻律的特徴は全体的に話者や文に依存する傾向が大きいことが示された。反面,共通の特徴として(1)「喜び」は主として声を高くすることで,(2)「悲しみ」と「感謝」は主として基本周波数パターンを平坦化することで,表現していることを示す結果を得た。更に,話者自身が最も好ましいと考えた感情で発声した場合,共通のATM案内文音声の特徴は,早口で声を高くすることであることが分かった。
著者
武田 昌一 大山 玄 朽谷 綾香 西澤 良博
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.58, no.9, pp.561-568, 2002-09-01
被引用文献数
9

筆者らは,より詳細なニュアンスの感情を表現する規則合成音声を実現することを究極目的として,感情を数段階に分けて韻律的特徴の解析を行っている。本論文では「怒り」を取り上げ,怒りの度合いを平常,軽い怒り,怒り,激怒の4段階に分けて段階に応じた単語音声の韻律的特徴の違いを調べた。今回は韻律的特徴として,単語内の最高音声パワー,平均発話速度,最高基本周波数を測定した。実験の結果,怒りの度合いが大きくなるにつれて(1)最高音声パワーは増大すること,(2)発話速度は増大傾向にあるが激怒になると逆に遅くなる傾向が見られること,(3)最高基本周波数は高くなる傾向が見られること,などが分かった。
著者
竹上 健 後藤 敏行 大山 玄
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J86-D2, no.2, pp.252-261, 2003-02-01

赤外線眼球運動観測装置などで観測された,頭部とカメラの相対位置が変化しない眼球画像において,瞳孔像を高精度に検出する手法について提案する.眼球の形状を球,瞳孔の輪郭を円とみなすと,瞳孔は眼球の動きに伴って見えの形状が楕円となる.この楕円形状をした瞳孔像の検出精度を高めることで安定した視線方向検出が可能となる.楕円を検出するには様々な手法が提案されており,その一つとしてハフ変換がある.ハフ変換は雑音や隠蔽などの影響を受けにくいという特徴を有しているが,一般の楕円検出では,決定すべきパラメータの自由度は5次元となるために,演算量やメモリ要求量が問題となる.一方,瞳孔は眼球中心を基準として回転するために,観測される瞳孔像は一般の楕円形状とならずに,眼球中心からの位置と方向に依存する.本論文では,この拘束条件を利用して,高精度に瞳孔を検出するための眼球モデルをベースとしたアルゴリズムについて述べる.そのアルゴリズムでは,システム全体の処理効率を考慮して,まず複数の観測画像からエッジに基づく楕円フィットによる瞳孔の初期検出を行い,それらの結果に基づいて眼球モデルのパラメータを推定する.その後,その眼球パラメータに基づいてハフ変換を行うことにより,瞳孔輪郭を高精度に再検出する.実験の結果,瞳孔輪郭検出の精度と安定性が向上しており,提案手法が有効であることが確認できた.
著者
竹上 健 後藤 敏行 大山 玄
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J84-D2, no.8, pp.1580-1588, 2001-08-01

赤外線眼球運動観測装置などで観測した頭部とカメラの相対位置が変化しない眼球画像を対象として,被験者に特定の指標を固視させるキャリブレーションを回避し,入力の時系列画像だけを用いて自動的にキャリブレーションを進める簡便かつ高精度な視線方向検出法を提案する.カメラとの相対位置が変化しない眼球画像には,瞳孔の中心座標と扁平率という視線方向を推定するための二つのキューがある.本手法は,絶対方向の推定が可能であるが検出精度や安定性に問題がある扁平率の情報を複数の画像フレームにわたって観測することにより,眼球の回転半径や回転中心などの眼球パラメータを校正することで,安定な視線方向検出を可能にするものである.実際の眼球画像を用いて評価実験を行った結果,偏平率に基づく視線方向の推定と比較して高精度な計測が可能になり,本手法の有効性を確認した.
著者
河野 守夫 牟田 弘 三浦 一朗 中嶋 鴻毅 杉戸 清樹 大山 玄
出版者
神戸市外国語大学
雑誌
重点領域研究
巻号頁・発行日
1992

1.聞き取り(listening)のメカニズムについて(1)聞き取りを行う際に、発話の流れを聞き手は一定の単位で区切って極く短い期間一時的に記憶する(echoic memory)と考えられている。この単位をperceptual sense unit(PSU)と名付ける。これについて脳梁損傷者、1才6ケ月から9才0ケ月の幼児、健常な成人を含む、1000名以上の被験者を動員して20回以上の実験を繰り返した結果、perceptual sense unitとは「聞き手が一気に(holistically)に知覚することが出来る7つ(±2)以内の長さを基準の長さとする音節群が伝える1つの意味単位」であることがつきとめられた。(2)人間はある音節群をholisticallyに知覚するためには各音節が互いに300ms以内の短い間隔で結ばれていなくてはならない。Holisticallyに一気に知覚できる音節の数は大体7±2が限度である。一方、500ms以上間隔があくと各刺激を予想と検証の作業によって追跡する分析的知覚に切り替わる。両者は神経心理学に異質だが、listeningにはともに必要で、前者はPSUの形成に、後者はいくつかのPSU間の文法的意味関係を探る作業に深くかかわるuniversalな現象である。(3)Hosticallyに知覚された音節群は、分析的に知覚された音節群よりも有意に長く、echoic memoryに格納される。2.Productive sense unitについてPSUと同類とみられる単位が、吃および発話失行症患者の発話に、一定のprosody上の特徴を伴って、観察される。特に、後者の発話にはPSUに見合うproductive sense unitが存在する確たる証拠がある。3.拍・音節と言語のリズムについて(1)1才6ケ月の幼児の発話にみられるリズム現象を規定する要因は、拍ではなくて音節である。(2)言葉のリズムのlanguage specificな現象は各言語の音節構造と深い関係がある。4.ジェスチャ-と言葉の知覚・認識について(1)lconixから談話の意味をとる作業は言語能力と高い相関関係がある。(2)ジェスチャ-の単位は上記のPSUとほぼ、一致する。(3)ジェスチャ-は発話と同期するか、それより早い目に生起する。この順を機械的に逆にして、ジェスチャ-を発話より1秒遅らせると、発話を理解する作業は有意に阻害される。(4)母国語よりも外国語の発話でジェスチャ-が多用される。(5)英米人は所作がおおげさだが、ジェスチャ-の使用率は日本人と変わらない。