著者
河原 英紀
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.76, no.3, pp.148-155, 2020-03-01 (Released:2020-09-01)
参考文献数
30
著者
羽石 英里 河原 英紀 岸本 宏子 竹本 浩典 細川 久美子 榊原 健一 新美 成二 萩原 かおり 齋藤 毅 藤村 靖 本多 清志 城本 修 北村 達也 八尋 久仁代 中巻 寛子 エリクソン ドナ
出版者
昭和音楽大学
雑誌
基盤研究(C)
巻号頁・発行日
2013-04-01

歌手は自らの身体が楽器であるため、歌唱にかかわる諸器官の動きを視認することができない。本研究では、歌手の身体感覚と実際の現象との対応関係を検証することを目的として、歌手へのインタビューを行い、歌唱技術の要とされる横隔膜の動きを実時間での磁気共鳴画像法(MRI動画)を用いて可視化した。その結果、プロ歌手の制御された横隔膜の動きが観察され、その現象が歌手の主観的な身体感覚の説明とも一致することが明らかになった。また、声道や舌の形状、ヴィブラートにも歌唱技術を反映すると思われる特性がみられた。本研究で提案されたMRIによる撮像法と分析法は、歌唱技術を解明する上で有用な手段のひとつとなりうるであろう。
著者
河原 英紀
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2018-SLP-125, no.18, pp.1-5, 2018-12-03

新しいスペクトル包絡計算法,新しい瞬時周波数および群遅延計算法,周波数領域 velvet noise による新しい混合音源に基づいて,20 年前に構想された音声分析変換合成法 STRAIGHT を再構築する.本報告では,背景とそれらの構成要素を紹介し,検討課題と今後の進め方について議論する.
著者
高橋 徹 入野 俊夫 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.571, pp.31-36, 2006-01-19
被引用文献数
1

多様な発話変換・合成を記述できる音声テクスチャマッピングモデルを提案する. 提案するモデルは, 音声を特徴づける骨格となるワイヤフレームに発話スタイルや話者性を表わすテクスチャをマッピングする枠組みによって音声を表わす. ワイヤフレームやテクスチャは, 統計的にあるいは, 発話事例から求めることができる. このモデルは, 画像分野で用いられるテクスチャマッピングを音声に適用したモデルである. 一般に, 発話変換は, スペクトルに対する演算と変形によって実現される. テクスチャマッピングの枠組みを用いて演算と変形を取り扱う仕組みについて述べる. ワイヤフレームにどのようなテクスチャをマッピングするかによって多様な発話スタイルを表現できることを示す. また, 様々な発話スタイルの音声を合成できることを示す. 最後に, ある発話に基づいてワイヤフレームを生成し, テクスチャをマッピングすることで発話変換を行うことができることを示す.
著者
溝渕 翔平 西村 竜一 入野 俊夫 河原 英紀
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2015-MUS-107, no.60, pp.1-6, 2015-05-16

本研究では提案法を用いて通常歌唱音声にグロウル系歌唱の特徴を付与した際の印象を評価した.これまでの研究よりグロウル系歌唱音声特有の物理的特徴として 「1k~4kHz の帯域強調」,「基本周波数の振動」 及び,「スペクトル形状の高速な時間変動」 が確認された.従来法である 「スペクトル形状の高速な変動」 を付与したモデルは,観察された現象を表面的に模擬するために 4 個のガウス関数を組み合わせたものであり,声質の表現や発声の機構を考慮したものでは無かった.本研究では 「スペクトル形状の高速な時間変動」 を披裂喉頭蓋の形状変化と声帯音源波形の時間変化の相互作用としてモデル化することで,グロウル系歌唱音声の特徴を付与する手法をこれまでに提案した.本稿では,従来法と提案法を変換後の歌唱音声の一対比較実験により評価した.結果をサーストンの一対比較法により分析した結果,提案法がグロウル系歌唱音声の印象を付与するのに効果的であることが示唆された.
著者
萩原 かおり 羽石 英里 河原 英紀 岸本 宏子 下倉 結衣 本多 清志
出版者
昭和音楽大学
雑誌
基盤研究(C)
巻号頁・発行日
2015-04-01

ミュージカル俳優は声を酷使することが多いが、未だ彼らの喉の健康を守る効果的な発声・訓練法が確立されているとは言い難い。本研究では、歌手の多くが体感している「喉・胸が開く」という感覚を手掛りに手技を用いての発声実験、アンケート、聴覚印象評価、MRI動画の撮像を行うことで、健康的な発声法を構築するための方法を探った。その結果、体感・評価スコア・音圧レベルの好変化、声帯位置の下制が観察される等「喉・胸が開く」という感覚に対する科学的根拠を得ることができたと考えられる。またそのMRI動画を用いての視覚による発声への影響についても良い結果が得られ、健康的な発声法訓練のための道筋を見つけることができた。
著者
貫名 真澄 河原 英紀
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.59, no.5, pp.256-260, 2003-05-01 (Released:2017-06-02)
参考文献数
8

発話時には,唇の開口面積が変動すると共に唇や鼻孔以外からも音が放射される。しかし,音声を収録する場合にそれらがどのような影響を与えているかについては,ほとんど報告されていない。本報告では,発話された音声を測定用の信号としてクロススペクトル法を用いて頭部周辺での伝達特性を測定した。また,音声を音源として用いた場合のクロススペクトル法の測定精度について,ダミーヘッドとM系列信号を用いた測定により検証すると共に,実測されたデータの信頼幅を併せて求めた。男女各2名が5母音を発話している状態で測定した結果は,同一測定位置での母音間の伝達特性に,信頼幅を大きく超える系統的な差異が存在していることを示した。
著者
小林 真優子 西村 竜一 入野 俊夫 河原 英紀
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013-MUS-99, no.47, pp.1-6, 2013-05-04

声を聴くと,何となくその人の体型が分かる.ここでは,母音だけを用いて相対的な声道長を推定する方法を提案する.この方法では,声道長以外の要因によるスペクトル形状変化の影響を軽減するために,スペクトル距離の計算に用いる帯域を制限し,スペクトルの大局的な平坦化と形状の過度な詳細の平滑化とを組合せている.6歳から56歳までの284名の男女が発声した母音と身体情報からなるデータベースを用いることで,これらの処理に用いるパラメタを決定した.母音だけを用いた簡易な方法にも関わらず,以前報告した聴覚モデルを用いた方法を凌駕する精度での声道長推定が可能であることを確認した.また,このデータベースに付与された身体情報を母音だけから推定できることを示した.
著者
河原 英紀 栃内 香次 永田 邦一
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.33, no.9, pp.470-479, 1977-09-01 (Released:2017-06-02)

This paper describes a speech analysis method for linear predictor coefficients and formant frequencies and bandwidths estimation using a portion of one pitch period of speech waveform. This method is based on the fact that estimation errors together with prediction errors vanish when excitation-free segments are utilized (Eq. 6). In the case of actual speech analysis, however, prediction errors may remain, even if they are minimum (Fig. 1). Therefore, it is necessary to formulate estimation errors in order to evaluate the performance of the proposed method. Theoretical studies on estimation errors are carried out. Estimation errors in linear predictor coefficients are dependent on the unknown component of excitation (see Eqs. 7 through 11). Expected values of estimation errors are derived, based on the assumption of the statistical property of excitation (see Eqs. 13 through 15) . A similar expression of estimation errors in formant frequencies and bandwidths is derived in the same manner (see Eqs. 16 through 18). Finally, two kinds of error estimates represented in terms of observed values are introduced as criteria for the determination of analysis conditions of our method and for the experimental comparison between the proposed method and the usual linear predictive analysis (Eq. 19). Simulation studies on these error estimates are performed using several kinds of synthetic speech. Their formant frequencies and bandwidths are given in Table 1. The relevance of these error estimates is indicated in the case of our method and in the case of usual linear predictive analysis (Figs. 2 through 5 and Tables 2 and 3). The length of the analysis segment must be properly chosen when these error estimates are employed in the error evaluation of the usual linear predictive analysis of periodic speech (Eq. 20 and Fig. 6). The results of simulation studies indicate both adequacy and validity of these error estimates. Experimental studies have been done to evaluate the performance of our method in the case of actual speech analysis. The minimum values of these error estimates of our method are as small as one half to one eighth of those of usual linear predictive analysis (Figs. 7 through 9 and Tables 4 and 5). In addition, the glottal source waveform estimated by using the result of our method seems more plausible than that obtained by using the result of the usual linear predictive analysis (Fig. 10). The results of these studies indicate that the proposed method yields more accurate estimates of parameters than those obtained by the usual linear predictive analysis, especially in the case of low-pitched speech.
著者
河原 英紀 Cheveigne Alain de
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.449, pp.9-18, 1997-01-17
参考文献数
18
被引用文献数
33

基本波成分の瞬時周波数の計算に基づく音声の基本周波数の新しい抽出方法を提案し、発声と同時に記録したEGG信号との相互比較と人工的信号を用いたシミュレーションにより、性能の評価を行なった。基本周波数および基本周期に対して等方的なGabor関数から導かれるanalyzing waveletを用い、基本周波数の探索範囲を40Hz〜800Hzとした場合、後処理無しの状態で既に本方法の性能は、従来の方法の性能を凌駕している。因に、女性の発声した100文章音声の分析結果は、全分析結果の50%以上が、EGGの分析結果の±0.3%以内に入っていることを示した。wavelet分析に基づいて新たに「基本波らしさ」の指標を定義することにより、基本周波数を抽出せずに基本波成分を選択できるようにしたことが本方法の鍵となっている。
著者
河原 英紀 森勢 将雅 西村 竜一 入野 俊夫
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012-MUS-95, no.4, pp.1-6, 2012-05-26

シャウトやデスボイスなどの激しい表現は、ポピュラー歌唱で広く用いられている。これらを適切に分析、再現、制御する方法を明らかにすることは、歌唱合成システムに豊かな表現力を与えるために解決すべき重要な課題である。本報告では、まず、新たに開発した高い時間分解能を有する基本周波数抽出法とそれに基づく TANDEM-STRAIGHT により、様々な歌唱音声を分析した結果について報告する。分析結果は、激しい表現にいおいて、70 Hz付近に 20 dB程度の高さのピークを有する高速の (基本周波数の) 周波数変調と、同様に、高速の (スペクトル包絡の) 振幅変調が存在することを示した。このような高速の変調の存在は、これまでにはっきりとは報告されていない。予備的な実験により、それらの高速の変調を加工することにより、発声の声区と努力の印象を保ったまま、シャウトなどの歌唱表現の強さ (生々しさ) を制御できる可能性が示された。
著者
榊原 健一 林 良子 後藤 多嘉緒 河原 英紀 牧 勝弘 齋藤 毅 山川 仁子 天野 成昭 山内 彰人
出版者
北海道医療大学
雑誌
基盤研究(B)
巻号頁・発行日
2015-04-01

喉頭音源に関連する声質の客観的表記に関し、生理学的、物理学的視点から、音源となる振動体の分類により(i) 声帯発声 ; (ii) 声帯-仮声帯発声; (iii) 声帯-披裂部発声; の3種類の有声音と,無声音である声門乱流雑音発声と分類が可能であり、有声音源に関しては、物理的・音響的特徴から周期的、準周期的、非周期的の3つの振動への分類を提案した。また、声質表現として緊張-弛緩と声門開放時間率との関係を明らかにし、声質の客観的な表現語として適切であることを明らかにした。声門開放時間率の分析方法として、余弦級数包絡の複素wavelet分析に基づく簡易なGCI, GOIの検出方法を考案した。
著者
河原 英紀
出版者
日本音声言語医学会
雑誌
音声言語医学 (ISSN:00302813)
巻号頁・発行日
vol.50, no.2, pp.131-135, 2009 (Released:2010-03-24)
参考文献数
7

本稿では, 音声モーフィングと呼ばれる技術が, 声の分析と臨床においてどのような可能性をもつかについて紹介する. 音声モーフィングは, 新しい音声分析変換合成法であるTANDEM-STRAIGHTに基づいている. ここで用いられている分析法は, 病的音声に見られるような複雑な声帯振動にも対応可能であると考えられる. このような分析方法としての可能性に加え, 音声モーフィングとして用いることにより, 治療目標とする声を, 本人の声を用いて事前にシミュレーションできる可能性を有している.