著者
津崎 実 入野 俊夫 堀川 順生 宮崎 謙一 牧 勝弘 竹島 千尋 大串 健吾 加藤 宏明 倉片 憲治 松井 淑恵
出版者
京都市立芸術大学
雑誌
基盤研究(A)
巻号頁・発行日
2012-05-31

本研究は加齢による「聴力」の変化について知覚・生理現象観察と計算モデルを構築を目的とした。従来ほとんど関心を集めていなかった加齢性ピッチ・シフト現象について,十分な数の幅広い年齢層の聴取者を用いて,その現象が確実に生じることを突きとめ,さらに同じ聴取者に対する聴力検査,耳音響放射検査,脳波の周波数追随反応との相関分析を実施した。並行実施した非線形圧縮特性,聴神経の位相固定性などへの加齢による変容の基礎検討を通して,ピッチ・シフトはこれらの要因の変容によっては説明困難であること示し,新規の聴覚モデルの提案に至った。
著者
加藤 宏明 津崎 実 匂坂 芳典
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.587, pp.15-22, 1998-03-06

聴取実験により, 促音, 撥音, 無声化母音, 長母音などいわゆる特殊拍を含むセグメントの時間長変動に伴う知覚的な歪みがどの程度許容されるかを調べた.特殊拍を特徴付ける2つの要因, つまり母音・子音などセグメントのタイプと, 拍数の違いなどによるセグメント持続長のバリエーションに着目し, 通常拍との比較を行なった.その結果, 前者の要因の効果が, 母音, 鼻音, 摩擦音と無音の順に許容される変動の範囲が広がるという傾向で, 後者は, 短い持続長より長い持続長の方が許容範囲が広いという傾向として現れた.さらに, セグメントタイプと持続長の要因の交互作用も見られた.母音タイプの方が摩擦音タイプよりも持続長の効果が大きかった.以上の結果に介在する知覚メカニズムを, 音韻固有のラウドネスや持続長の違いに基づく時間長弁別能の違いと, 拍数など音韻論上の構造の内的処理との関係において論じる.
著者
津崎 実
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.102, no.247, pp.19-24, 2002-07-18

このチュートリアルではBregmanの研究とその発想を軸として聴覚による情景分析について概説をします。聴覚情景分析には音源定位以外の側面があること,さらにBregmanの研究の中では音源定位の話題が中心的な位置を占めないことの背景について説明し,いわゆる音源分離と音脈分凝の間の相違点について述べます。次に音環境に備わる4つの規則性と,それぞれに基づいた聴覚的情景分析の特徴について概説し,音声信号を扱う上で重要な要因となるトップダウンな情報処理が音脈分凝の研究の枠組みの中でどのように扱われているかについて説明します。
著者
入野 俊夫 河原 英紀 津崎 実 西村 竜一
出版者
和歌山大学
雑誌
基盤研究(B)
巻号頁・発行日
2009

音声知覚の基盤となる聴知覚特性を明確にし、数理的な理論の構築/検証を行った。1)寸法・形状知覚:発声方法による寸法弁別閾の違いが無いことや時間特性を明確にした。2)聴覚フィルタ特性/難聴者・健聴者の聴知覚特性:聴覚フィルタの周波数選択性や圧縮特性の同時測定と、模擬難聴を実現できる枠組みを世界に先駆けて開発した。3)機能的磁気共鳴像(fMRI)実験:音声からの寸法知覚の情報処理の座に関して知見を得た。4)音声知覚モデル化/音声・音響処理:理論的な背景をもとに話者の声道長推定が精度良くできることを示した。また、知覚的音響処理の改善も行った。
著者
津崎 実 川上 央
出版者
京都市立芸術大学
雑誌
挑戦的萌芽研究
巻号頁・発行日
2016-04-01

次元コンピュータ・グラフィックスでの人体モデルに人間らしい動作をつける際に,モーションキャプチャーシステムを使う場合には測定上の誤差に対する後処理的な修正が必要となることが多い。本報告ではダンス動作をキャプチャーした際の誤差修正の手段として,足先の接地状態を補助的な視覚映像に基づいて施すことの効果について,バイオロジカル・モーション刺激を用いた対比較による強制選択法による知覚評価実験と,fMRIによる脳活動計測を実施した。その結果として,修正による変化は確実に存在し,修正版を良いと判断した評価者がいる一方で,修正版は躍動感という点においては無修正版よりも低下することを示唆する結果を得た。
著者
津崎 実
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2018-SLP-122, no.12, pp.1-6, 2018-06-09

ピッチは音の重要な知覚属性であり,ヒトがどのようにしてピッチを知覚するかに関するモデルについては古くから研究がされている.ピッチ現象を説明するための聴覚理論として有名な場所説と時間説の間の論争は 19 世紀に今日の原形が形成され,その後修正を加えながら,今日でも引き継がれてきている.時間説の流れを汲む近年の機能モデルでは基底膜フィルターバンク処理と半波整流の後段に自己相関演算による周期性検出を想定するものが多い.著者の研究グループでは,加齢に伴う絶対音感判断の上方へのシフトという現象をここ数年研究してきている.この現象は知覚レベルでのピッチが加齢に伴って変容する可能性を強く示唆する.ピッチが音響信号に備わる周期性に基づいた知覚属性であることは否定しがたいが,単にその周期性を時間の関数としての自己相関演算で求める以上,このような加齢効果が入り込む余地はない.加齢効果を説明するためには自励発振する内部参照を想定し,その自励発振周波数が加齢によって変化することを想定する必要がある.発振回路を使用したピッチ検出機構の提唱は先例があるものの,従来はその想定を必要とする現象が観察されずに来た.加齢性のピッチ ・ シフト現象はピッチ知覚に関する研究に新たな局面を切り開く可能性がある.
著者
津崎 実
出版者
公益社団法人 日本心理学会
雑誌
心理学研究 (ISSN:00215236)
巻号頁・発行日
vol.59, no.3, pp.176-190, 1988-08-30 (Released:2010-07-16)
参考文献数
79

In this article some of the recent researches on music perception are reviewed, with a special emphasis upon those that concern melody organization and musical pitch. Lerdahl and Jackendoff (1983) pointed out that there is a grammatical parallel between music and language, and presented some grammatical rules for the tonal music. Serafine (1983) cautioned us not to confuse the “style principles” with the “musical cognitive process”. The recent experiments on musical pitch and melody has reinforced the psychological validity of musical segmentation, tonality, pitch chroma, scale, and key. Theoretical approaches to the relations in the scale systems gave the possibility of a “new scale system” for use in psychological experiments, while the recent pitch models has made it possible for us to control tonality and to generate tones never used before in playing music. The need for a greater cross-stylistic generality of psychological concepts in music and the farther clarification of the “musical cognitive process” through experiments utilizing the “new scale system” and the “new tones” are indicated.
著者
河井 恒 戸田 智基 山岸 順一 平井 俊男 倪 晋富 西澤 信行 津崎 実 徳田 恵一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) (ISSN:18804535)
巻号頁・発行日
vol.89, no.12, pp.2688-2698, 2006-12-01
参考文献数
43
被引用文献数
15

本論文では,ATR音声言語コミュニケーション研究所が開発した新しい音声合成システムXIMERAについて述べる.XIMERAは,これまでATRで開発された音声合成システムυ-Talk及びCHATRと同様,コーパスベース方式を採用している.XIMERAの特長は,(1)大規模な音声コーパス(日本語男声110時間,日本語女声59時間,中国語女声20時間,それぞれ単一話者),(2)HMMを用いた韻律パラメータのモデル化及び生成,(3)知覚実験に基づく素片選択コスト関数の最適化,である.XIMERAの性能を評価するため,市販の音声合成システム10製品と合成音声の自然性を比較したところ,XIMERAが他のシステムより優れていることが示された.
著者
グリーンバーグ 陽子 加藤 宏明 津崎 実 匂坂 芳典
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.67, no.2, pp.65-74, 2011-02-01 (Released:2017-06-02)
参考文献数
15

対話音声の合成を目指して,対話韻律生成の方法を提案した。対話場面において出現する発話内容自体が,その取り得る対話韻律を限定することに着目し,提案方法では,入力となる語彙が与える印象によって制約される韻律特徴量を用いて,従来の読み上げ韻律を修正する対話韻律生成を行う。これまでに行った一語発話「ん」のパラ言語分析が示した,3次元の知覚的印象空間(確信-疑念,肯定-否定,好印象-悪印象)と韻律制御(基本周波数の平均値と時間変化形状,発話時間長)の関係を用いて,同じ印象空間で典型的な座標を持つ語彙に対して,対応する対話韻律を付与した。得られた合成音声に対する自然性評価実験により,提案した方法の妥当性を確認した。
著者
グリーンバーグ 陽子 加藤 宏明 津崎 実 匂坂 芳典
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.67, no.2, pp.65-74, 2011-02-01
参考文献数
15
被引用文献数
1

対話音声の合成を目指して,対話韻律生成の方法を提案した。対話場面において出現する発話内容自体が,その取り得る対話韻律を限定することに着目し,提案方法では,入力となる語彙が与える印象によって制約される韻律特徴量を用いて,従来の読み上げ韻律を修正する対話韻律生成を行う。これまでに行った一語発話「ん」のパラ言語分析が示した,3次元の知覚的印象空間(確信-疑念,肯定-否定,好印象-悪印象)と韻律制御(基本周波数の平均値と時間変化形状,発話時間長)の関係を用いて,同じ印象空間で典型的な座標を持つ語彙に対して,対応する対話韻律を付与した。得られた合成音声に対する自然性評価実験により,提案した方法の妥当性を確認した。
著者
倪 晋富 河井 恒 津崎 実
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.103, no.263, pp.19-24, 2003-08-14

波形素片接続型音声合成の音質を向上させようとすると,大規模な音声コーパスが必要となり,結果的に音声収録に数ヶ月〜数年という長期間を要する。録音セッションが異なると録音系の特性が変化する可能性があり,その結果多少とも声質が変化する。本稿では,1名の男性話者が2年間に677回発声した同一の日本語文の音声データを試料として用い,長時間平均パワースペクトルの等価に関する実験を行った結果について報告する。まず,フレーム長の設定など,長時間平均パワースペクトル推定の最適条件について検討する。さらに,4種類のフィルタ,すなわちLPC係数を介して設計されたIIRフィルタ,MLSAフィルタ,ケプストラムにもとづく平滑化を伴うFIR,メルケプストラムにもとづく平滑化を伴うFIR,を等価フィルタとして取り上げ,それぞれの最適な設計条件を検討する。各フィルタの等価効果の比較は,等価対象音声の音響的特微量のガウス分布に関する尤度にもとづいて行う。予備的な主観評価実験の結果,提案手法が録音系周波数特性の等価に有効であり,かつ音質劣化を生じないことが示唆された。
著者
戸田 智基 河井 恒 津崎 実 鹿野 清宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.102, no.291, pp.19-24, 2002-08-22
被引用文献数
2

素片選択に基づく波形接続型テキスト音声合成において自然性の高い合成音声を得るためには,知覚特性に一致したコストを用いることが重要である.本稿では知覚実験により求めた知覚スコアを用いることにより,コストの知覚特性に基づく評価を行う.その際に,コストと知覚スコア間の対応関係を明らかにするだけでなく,素片系列のコストを求めるために必要な各素片におけるコストを統合する関数についても検討する.実験結果から,合成音声全体における平均的な自然性劣化を表す平均コストは,局所的な自然性劣化を表す最大コストよりも知覚スコアとの対応が良いことを示す.また,平均的な自然性劣化と局所的な自然性劣化の両方を考慮するコストであるRMSコストを用いた際に,最も知覚スコアとの対応が良いことも示す.さらに,RMSコストによる素片選択に関しての検討を行うことにより,RMSコスト使用時には局所的な大きな自然性劣化を防ぐために,より短い単位の素片が多く用いられる傾向があることを示す.
著者
戸田 智基 河井 恒 津崎 実 鹿野 清宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.101, no.603, pp.45-52, 2002-01-17
被引用文献数
2

本稿では, 日本語テキスト音声合成(TTS : Text-to-Speech)における新たな単位選択法を提案する.日本語では, 母音の無声化を除くとCV(C : 子音, V : 母音)とVから音節が構成されるため, 合成単位としてCV単位がよく用いられる.しかし, 波形接続型のTTSにおいてCV単位を用いて音声を合成すると, VからVへの接続によりしばしば不連続感が生じる.V-V接続を防ぐためにより長い単位(CV^*単位や可変長単位)がこれまでに提案されているが, V-V接続の問題はまだ解決されていない.そこで, V-V接続により生じる不連続感を低減する手法として, 音素単位とダイフォン単位に基づいた新たな単位選択法を提案する.提案法では, 音素境界における接続だけでなく, 母音中心における接続も考慮して単位選択が行われる.評価実験結果から, 提案法は音素単位に基づいた従来法と比較し, よりよい性能をもっことが明らかになった.
著者
入野 俊夫 河原 英紀 西村 竜一 高橋 徹 津崎 実 津崎 実 高橋 徹 ロイD. パターソン
出版者
和歌山大学
雑誌
基盤研究(B)
巻号頁・発行日
2006

初期聴覚系における「寸法・形状知覚理論」の検証とその応用を行った。そのための心理実験を実施し、理論を支持する実験結果を数多く得た。fMRI実験によって、音節情報処理の脳内部位を推定し、寸法・形状情報処理の部位特定のための制約条件を与えた。「ガンマチャープ聴覚フィルタ」等のモデルをさらに洗練化した。 高品質音声分析合成法STRAIGHTの性能改善や、劣化音声の知覚実験と自動音声認識実験の対比も行い、音声知覚の計算理論構築の足がかりを得た。