著者
河原 英紀
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2018-SLP-125, no.18, pp.1-5, 2018-12-03

新しいスペクトル包絡計算法,新しい瞬時周波数および群遅延計算法,周波数領域 velvet noise による新しい混合音源に基づいて,20 年前に構想された音声分析変換合成法 STRAIGHT を再構築する.本報告では,背景とそれらの構成要素を紹介し,検討課題と今後の進め方について議論する.
著者
高橋 徹 入野 俊夫 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.571, pp.31-36, 2006-01-19
被引用文献数
1

多様な発話変換・合成を記述できる音声テクスチャマッピングモデルを提案する. 提案するモデルは, 音声を特徴づける骨格となるワイヤフレームに発話スタイルや話者性を表わすテクスチャをマッピングする枠組みによって音声を表わす. ワイヤフレームやテクスチャは, 統計的にあるいは, 発話事例から求めることができる. このモデルは, 画像分野で用いられるテクスチャマッピングを音声に適用したモデルである. 一般に, 発話変換は, スペクトルに対する演算と変形によって実現される. テクスチャマッピングの枠組みを用いて演算と変形を取り扱う仕組みについて述べる. ワイヤフレームにどのようなテクスチャをマッピングするかによって多様な発話スタイルを表現できることを示す. また, 様々な発話スタイルの音声を合成できることを示す. 最後に, ある発話に基づいてワイヤフレームを生成し, テクスチャをマッピングすることで発話変換を行うことができることを示す.
著者
貫名 真澄 河原 英紀
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.59, no.5, pp.256-260, 2003-05-01 (Released:2017-06-02)
参考文献数
8

発話時には,唇の開口面積が変動すると共に唇や鼻孔以外からも音が放射される。しかし,音声を収録する場合にそれらがどのような影響を与えているかについては,ほとんど報告されていない。本報告では,発話された音声を測定用の信号としてクロススペクトル法を用いて頭部周辺での伝達特性を測定した。また,音声を音源として用いた場合のクロススペクトル法の測定精度について,ダミーヘッドとM系列信号を用いた測定により検証すると共に,実測されたデータの信頼幅を併せて求めた。男女各2名が5母音を発話している状態で測定した結果は,同一測定位置での母音間の伝達特性に,信頼幅を大きく超える系統的な差異が存在していることを示した。
著者
羽石 英里 河原 英紀 岸本 宏子 竹本 浩典 細川 久美子 榊原 健一 新美 成二 萩原 かおり 齋藤 毅 藤村 靖 本多 清志 城本 修 北村 達也 八尋 久仁代 中巻 寛子 エリクソン ドナ
出版者
昭和音楽大学
雑誌
基盤研究(C)
巻号頁・発行日
2013-04-01

歌手は自らの身体が楽器であるため、歌唱にかかわる諸器官の動きを視認することができない。本研究では、歌手の身体感覚と実際の現象との対応関係を検証することを目的として、歌手へのインタビューを行い、歌唱技術の要とされる横隔膜の動きを実時間での磁気共鳴画像法(MRI動画)を用いて可視化した。その結果、プロ歌手の制御された横隔膜の動きが観察され、その現象が歌手の主観的な身体感覚の説明とも一致することが明らかになった。また、声道や舌の形状、ヴィブラートにも歌唱技術を反映すると思われる特性がみられた。本研究で提案されたMRIによる撮像法と分析法は、歌唱技術を解明する上で有用な手段のひとつとなりうるであろう。
著者
萩原 かおり 羽石 英里 河原 英紀 岸本 宏子 下倉 結衣 本多 清志
出版者
昭和音楽大学
雑誌
基盤研究(C)
巻号頁・発行日
2015-04-01

ミュージカル俳優は声を酷使することが多いが、未だ彼らの喉の健康を守る効果的な発声・訓練法が確立されているとは言い難い。本研究では、歌手の多くが体感している「喉・胸が開く」という感覚を手掛りに手技を用いての発声実験、アンケート、聴覚印象評価、MRI動画の撮像を行うことで、健康的な発声法を構築するための方法を探った。その結果、体感・評価スコア・音圧レベルの好変化、声帯位置の下制が観察される等「喉・胸が開く」という感覚に対する科学的根拠を得ることができたと考えられる。またそのMRI動画を用いての視覚による発声への影響についても良い結果が得られ、健康的な発声法訓練のための道筋を見つけることができた。
著者
溝渕 翔平 西村 竜一 入野 俊夫 河原 英紀
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2015-MUS-107, no.60, pp.1-6, 2015-05-16

本研究では提案法を用いて通常歌唱音声にグロウル系歌唱の特徴を付与した際の印象を評価した.これまでの研究よりグロウル系歌唱音声特有の物理的特徴として 「1k~4kHz の帯域強調」,「基本周波数の振動」 及び,「スペクトル形状の高速な時間変動」 が確認された.従来法である 「スペクトル形状の高速な変動」 を付与したモデルは,観察された現象を表面的に模擬するために 4 個のガウス関数を組み合わせたものであり,声質の表現や発声の機構を考慮したものでは無かった.本研究では 「スペクトル形状の高速な時間変動」 を披裂喉頭蓋の形状変化と声帯音源波形の時間変化の相互作用としてモデル化することで,グロウル系歌唱音声の特徴を付与する手法をこれまでに提案した.本稿では,従来法と提案法を変換後の歌唱音声の一対比較実験により評価した.結果をサーストンの一対比較法により分析した結果,提案法がグロウル系歌唱音声の印象を付与するのに効果的であることが示唆された.
著者
河原 英紀 Cheveigne Alain de
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.449, pp.9-18, 1997-01-17
参考文献数
18
被引用文献数
33

基本波成分の瞬時周波数の計算に基づく音声の基本周波数の新しい抽出方法を提案し、発声と同時に記録したEGG信号との相互比較と人工的信号を用いたシミュレーションにより、性能の評価を行なった。基本周波数および基本周期に対して等方的なGabor関数から導かれるanalyzing waveletを用い、基本周波数の探索範囲を40Hz〜800Hzとした場合、後処理無しの状態で既に本方法の性能は、従来の方法の性能を凌駕している。因に、女性の発声した100文章音声の分析結果は、全分析結果の50%以上が、EGGの分析結果の±0.3%以内に入っていることを示した。wavelet分析に基づいて新たに「基本波らしさ」の指標を定義することにより、基本周波数を抽出せずに基本波成分を選択できるようにしたことが本方法の鍵となっている。
著者
河原 英紀 森勢 将雅 西村 竜一 入野 俊夫
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012-MUS-95, no.4, pp.1-6, 2012-05-26

シャウトやデスボイスなどの激しい表現は、ポピュラー歌唱で広く用いられている。これらを適切に分析、再現、制御する方法を明らかにすることは、歌唱合成システムに豊かな表現力を与えるために解決すべき重要な課題である。本報告では、まず、新たに開発した高い時間分解能を有する基本周波数抽出法とそれに基づく TANDEM-STRAIGHT により、様々な歌唱音声を分析した結果について報告する。分析結果は、激しい表現にいおいて、70 Hz付近に 20 dB程度の高さのピークを有する高速の (基本周波数の) 周波数変調と、同様に、高速の (スペクトル包絡の) 振幅変調が存在することを示した。このような高速の変調の存在は、これまでにはっきりとは報告されていない。予備的な実験により、それらの高速の変調を加工することにより、発声の声区と努力の印象を保ったまま、シャウトなどの歌唱表現の強さ (生々しさ) を制御できる可能性が示された。
著者
小林 真優子 西村 竜一 入野 俊夫 河原 英紀
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013-MUS-99, no.47, pp.1-6, 2013-05-04

声を聴くと,何となくその人の体型が分かる.ここでは,母音だけを用いて相対的な声道長を推定する方法を提案する.この方法では,声道長以外の要因によるスペクトル形状変化の影響を軽減するために,スペクトル距離の計算に用いる帯域を制限し,スペクトルの大局的な平坦化と形状の過度な詳細の平滑化とを組合せている.6歳から56歳までの284名の男女が発声した母音と身体情報からなるデータベースを用いることで,これらの処理に用いるパラメタを決定した.母音だけを用いた簡易な方法にも関わらず,以前報告した聴覚モデルを用いた方法を凌駕する精度での声道長推定が可能であることを確認した.また,このデータベースに付与された身体情報を母音だけから推定できることを示した.
著者
河原 英紀
出版者
日本音声言語医学会
雑誌
音声言語医学 (ISSN:00302813)
巻号頁・発行日
vol.50, no.2, pp.131-135, 2009 (Released:2010-03-24)
参考文献数
7

本稿では, 音声モーフィングと呼ばれる技術が, 声の分析と臨床においてどのような可能性をもつかについて紹介する. 音声モーフィングは, 新しい音声分析変換合成法であるTANDEM-STRAIGHTに基づいている. ここで用いられている分析法は, 病的音声に見られるような複雑な声帯振動にも対応可能であると考えられる. このような分析方法としての可能性に加え, 音声モーフィングとして用いることにより, 治療目標とする声を, 本人の声を用いて事前にシミュレーションできる可能性を有している.
著者
河原英紀
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014, no.7, pp.1-6, 2014-05-17

「音声の多くの部分を占める有声音は、なぜ、ほぼ周期的なのか?音声の大部分が周期的であることは、聴覚にとって良いことなのか?」 という素朴な疑問から始まった STRAIGHT は、音声研究のためのツールとして広く用いられるに至っている。ここでは、STRAIGHT の基礎となっている 「ピッチマークへの同期を必要としないピッチ同期分析」 によるパワースペクトルと瞬時周波数の表現を簡単に振り返り、最近発見された、周期性による干渉を排除した群遅延の新しい表現を紹介する。
著者
河原 英紀 片寄 晴弘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.560, pp.43-44, 1998-02-19

本デモンストレーションでは、筆者らが提案した音声分析・変換・合成方法STRAIGHT(Speech/sound Transformation and Representation using Adaptive Interpolation of weiGHTed spectrogram)を楽器音の変換に用いた場合の例を示す。尺八は、非常に生々しく再現されており、本方式が音楽の分野への応用においても高い潜在能力を持つことが示唆された。しかし、ピアノ音などでは音源情報のモデル化と抽出方法に更に工夫が必要であることが明らかとなった。
著者
溝渕 翔平 西村 竜一 入野 俊夫 河原 英紀
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2014-MUS-103, no.55, pp.1-6, 2014-05-17

本研究では通常歌唱をグロウル系統の歌唱音声の印象をもつ音声に変換するシステムの検討を行っている.先行研究では簡単な信号処理で歌唱音声にグロウルらしさを付与する方法が提案された.本報告では提案手法で用いる特徴付与のパラメタを対話的に操作し,歌唱音声にグロウルらしさを付与する GUI について紹介する.提案手法は時間変調による基本周波数の高速な時間振動の付与,FIR フィルタによる処理範囲に共通した帯域強調処理,及び近似時変フィルタによる第 3 フォルマント周辺の高速な時間変調の付与の 3 つより構成されている.提案手法は変換処理に分析・合成を必要としないためリアルタイム処理を可能とし,ライブで一種のエフェクターとして用いることが出来る.GUI の開発は主にデモやポスターセッションの場で本手法による処理内容と処理の影響について直感的理解を促すことを目的としている.開発した GUI は実際にポスターセッションの場で操作し,操作性やデザイン性についてコメントを頂きたい.
著者
河原 英紀 片寄 晴弘
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.2, pp.208-218, 2002-02-15
参考文献数
40
被引用文献数
12

音楽としての歌唱の魅力は,歌詞をともなうことに多くを負っているといわれる.しかし,歌詞の理解できない外国語の歌唱であっても,楽器としての人間の声の魅力を楽しむことができることも事実である.ここでは,楽器としての声そのものの魅力を楽しむスキャット,ヴォーカリーズ,口三味線,鼻歌等を対象として取り上げ,音声処理技術を用いて,その魅力の分析,再合成,加工を行うシステムの開発を狙う一連の研究構想を提案し,実現技術の予備検討結果を紹介する.具体的には著者らが開発している高品質音声分析変換合成システムSTRAIGHTをエンジンとして利用し,基本的な反射弓を修飾する発声制御モジュール,韻律制御モジュール,音楽情報処理モジュール,インタラクション制御モジュール等を逐次更新していく生態学的枠組みに基づく開発戦略を提案する.様々な研究者が,このようなシステムの実現を意識して研究を進めることは,計算機音楽の範囲を拡大するだけではなく,音声に含まれる非言語情報やパラ言語情報の処理技術に対する有力なベンチマークの機会を提供するものと考えられる."A research program to develop a versatile system for analysis, manipulation and generation of a specific vocal music genre;scat, vocalease, {\it kuchi-jamisen} and humming, is introduced.One of the major aim of the program is to explore why vocal music is still attractive,even if their lyrics are not intelligible when they are sung in a foreign language.This may sound peripheral to the usual belief that lyrics is the centralcharm point of vocal music.However, we argue that this type of research is indispensable forunderstanding roles of non-linguistic andpara-linguistic components in speech and vocal music.The proposed program uses STRAIGHT as its central analysis, modification andsynthesis engine, and will refine its constituent modules like voicing control,prosodic control, musical information processing, interaction control, and so on,organized as modifiers of the basic reflex arc,in an evolutional and developmental process.This research program,that can be understood as a global load-map for various individual research projects,provides a unique common ground for benchmarking non-linguistic and para-linguisticprocessing algorithms as well as a wide variety of opportunities in computer music applications.
著者
溝渕 翔平 西村 竜一 入野 俊夫 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.114, no.52, pp.279-284, 2014-05-17

本研究では通常歌唱をグロウル系統の歌唱音声の印象をもつ音声に変換するシステムの検討を行っている.先行研究では簡単な信号処理で歌唱音声にグロウルらしさを付与する方法が提案された.本報告では提案手法で用いる特徴付与のパラメタを対話的に操作し,歌唱音声にグロウルらしさを付与するGUIについて紹介する.提案手法は時間変調による基本周波数の高速な時間振動の付与,FIRフィルタによる処理範囲に共通した帯域強調処理,及び近似時変フィルタによる第3フォルマント周辺の高速な時間変調の付与の3つより構成されている.提案手法は変換処理に分析・合成を必要としないためリアルタイム処理を可能とし,ライブで一種のエフェクターとして用いることが出来る.GUIの開発は主にデモやポスターセッションの場で本手法による処理内容と処理の影響について直感的理解を促すことを目的としている.開発したGUIは実際にポスターセッションの場で操作し,操作性やデザイン性についてコメントを頂きたい.
著者
河原 英紀 増田 郁代
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EA, 応用音響
巻号頁・発行日
vol.96, no.235, pp.9-16, 1996-08-29
被引用文献数
50

基本周波数の情報を利用したスペクトログラムの適応的補間とオールパスフィルタ特性の組織的設計に基づく音声変換方法STRAIGHT (Speech Transformation and Representation using Adaptive Interpolation of weiGHTed spectrum) を提案する. 本方法では, 音声の基本周波数に適応した時間窓を用いて分析したスペクトログラムに対して, 双一次曲面を保存しかつ時間周波数方向での広がりが最小となる補間関数を用いた補間操作を行なうことで音源の周期性の影響の除去と分解能の確保を両立させている. その結果, 話速, 基本周波数, 声道長等のパラメタの600%に及ぶ変換に対しても自然な音質での再生が可能となった. また, ヘッドフォン受聴の場合に問題となるパルス駆動音源特有の音色を除去するためのオールパス特性を有する音源波形の構成方法についても論ずる.