著者
櫻庭 京子 峯松 信明 広瀬 啓吉 坂野 秀樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.104, no.630, pp.25-29, 2005-01-20

男性から女性へ性別の移行を希望する性同一性障害者(Male to Female transgender/transsexual=MtF)に対する音声治療・訓練を筆頭著者が中心となって行なっている。今回, 本訓練の客観的及び主観的有効性を検証するために, 訓練前後の音声に対する第三者による評価実験を行なうと共に, 訓練効果に対する患者本人の満足度について調査した。さらに話声位のF0(基本周波数)の変化を調べた。その結果, 第三者の聴取実験において訓練前は全ての聴者から男性と判定されていた患者が, 二ヶ月の訓練後では, 聴者の約九割に女性と判定されるに至った。患者自身も凡そ声の変化の様子に満足しているとの結果が得られている。F0は成人男性の平均値から成人女性の平均値に移行した。
著者
牧野 奨平 坂野 秀樹 旭 健作
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 (ISSN:09135685)
巻号頁・発行日
vol.113, no.404, pp.61-66, 2014-01-23

音声分析合成による鼻声の声質改善を目的とし,鼻声発声の分析を行っている.なお,本研究において,鼻声発声をノーズクリップを装着した状態での発声とし,異なるノーズクリップの装着位置で鼻声発声1・2とした.発声継続時間長が長めの鼻子音を収録し,鼻子音の発声区間での長時間平均スペクトルと,帯域分割した長時間平均スペクトルのパワーの時系列を観察・比較した.その結果,鼻声発声における鼻子音の発声区間は,通常発声に比べ630Hz以上の帯域でパワーが減衰すること,その帯域において,時間経過に伴いパワーが減衰することがわかった.また,鼻声発声することによって,通常発声で見られる400Hz付近の山が100〜200Hzに移動することがわかった.これらの結果から,鼻声発声1の周波数特性の傾向が通常発声と鼻声発声2のものの間にあると考えられる.
著者
佐藤 奨 坂野 秀樹 板倉 文忠
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.111, no.97, pp.41-46, 2011-06-16

本研究は,楽曲推薦の特徴量に利用出来るような音響特徴量,特にラウドロック系の楽曲を特徴付ける音響特徴量の提案をする.ラウドロック系の楽曲は,歪んだ音を出すエレキギター及びベース,激しく叩くドラムの音が特徴的であり,上記の楽曲と,それ以外の楽曲とを混在させた曲順で聴くことはほとんどない.よって,両者を分類できる特徴量は,有用な特徴量となることが期待できる.本稿では,提案した音響特徴量を用いて,ラウドロック系,J-pop,ニューエイジ系の自動ジャンル分類実験により客観評価を行った.最も良い条件の場合,ラウドロック系の楽曲とそれ以外の楽曲とを区別する2ジャンルの識別率が97%,3ジャンルの識別率が87%となった.さらに,この音響特徴量が楽曲の印象とどのような対応があるのか,印象尺度を用いた主観評価実験を行った.その結果,音響特徴量と「激しい」「騒々しい」「優しい」といった印象との間に,強い相関があることが確認され,提案する音響特徴量が,主観的尺度と対応することが明らかになった.
著者
田原 佳代子 高橋 徹 森勢 将雅 坂野 秀樹 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.198, pp.19-24, 2005-07-14

歌唱音声のパラメタ(ピッチ, 音量, 音色)には, ランダムな揺らぎと系統的な変化が含まれている.本報告では音量により系統的に変化する音色の成分を明らかにすることを狙い, RWC研究用音楽データベース中の歌唱音声と新たに録音した男性歌手による歌唱音声素材の分析を行った.新たな録音では, RWC研究用音楽データベースに収録されていない連続的な音量変化の影響を調べるため, 一定音量の歌唱に加え, クレッシェンドとデクレッシェンド歌唱を収録した.これらの素材は, STRAIGHTにより分析された後, 1/3オクターブ毎のレベルに変換され主成分分析により直交する成分に分解された.音量を独立変数, 主成分得点を従属変数とする回帰分析の結果は, 第一主成分と音量との高い相関を示した.この結果に基づき, 本報告では, 第一主成分に対応する固有ベクトルを用いた音色制御法を提案した.予備実験の結果は, 合成歌唱によるクレッシェンドおよびデクレッシェンドの自然性が, 提案した方法を用いることにより改善されることを示した.
著者
坂野 秀樹 森勢 将雅 高橋 徹 西村 竜一 入野 俊夫 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.107, no.551, pp.157-162, 2008-03-13
被引用文献数
2

実時間動作するSTRAIGHT,リアルタイムSTRAIGHTの改良を行ったので,その詳細について報告する.高品質音声分析変換合成法STRAIGHTは極めて高品質であり,合成システムや聴覚実,験用のツールとして広く利用されるようになってきている.STRAIGHTは,MATLABによって実装されており,オフラインでの処理にはこれが広く用いられているが,実時間で動作するものではない.そこで,我々は,実時間で動作するリアルタイムSTRAIGHTをC言語による実装で構築してきた.今回は,まず,C言語によるSTRAIGHTの実装であるC言語版を,MATLAB版STRAIGHTの最新版と同等のものに更新した.そして,このC言語版の関数の一部を利用し,リアルタイムSTRAIGHTのスペクトル抽出部分を改良した.改良したリアルタイムSTRAIGHTを用いて主観評価実験を行った所,MOS値が3.4となり,これまでのリアルタイムSTRAIGHTに比べ0.7程度改善したことが分かった.また,C言語版STRAIGHTにおいては,バージョンによるAPIの違いが大きいという問題があった.今回,このような問題を解決したC言語版STRAIGHTのAPIを策定し,STRAIGHTライブラリとして実装した.
著者
坂野 秀樹 武田 一哉 鹿野 清宏 板倉 文忠
出版者
電子情報通信学会
雑誌
電子情報通信学会論文誌A (ISSN:09135707)
巻号頁・発行日
vol.J81-A, no.2, pp.261-268, 1998-02

スペクトル包絡と音源の独立操作により, ある話者の音声を別の話者へと連続的に変化させる音声モーフィングを提案する.本手法では次の手順で音声モーフィングを実現する.1)時間領域におけるDPマッチングにより単位波形の対応をとる.2)単位波形をスペクトル包絡と音源に分離する.3)周波数領域のDPマッチングにより周波数軸を非線形に伸縮し, スペクトル包絡間の対応付けを行う.4)スペクトル包絡および音源の補間を行う.5)位相情報を付与し, 単位波形を得る.6)PSOLA法により合成する.この手法を用いることによって自然音声の時間的変化に比較的近い補間が可能となり, 音声の調音結合部分をモーフィングにより生成する実験を行った結果, ケプストラム距離において従来法に比べ1.9dBひずみを減少させることができた.また, 対比較試験では男性から女性へのモーフィングにおいて89%, 女性から男性へのモーフィングでは93%の割合で本手法の方が品質が良いと判断されており, 本手法の有効性が示された.
著者
坂野 秀樹 陸 金林 中村 哲 鹿野 清宏 河原 英紀
出版者
電子情報通信学会
雑誌
電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.11, pp.2276-2282, 2000-11-25
参考文献数
8
被引用文献数
5

音声の位相情報を群遅延に基づいて表現することにより, 位相特性の制御を可能とする声質制御方式を提案する.提案方式は, 位相特性を群遅延領域で制御するため, 原音声の位相から零位相まで連続的に変化させることができる.また, 音声の特徴に基づき部分的に零位相化を行っているため, PSOLA法などの手法で見られる, ピッチ変換率を大きくしたときの劣化を軽減させることができる.ピッチ変換音声を作成して主観評価実験を行った結果, ピッチ変換率が1倍の場合に, 零位相合成, PSOLA法, 提案法のMOS値が, 男声の場合はそれぞれ3.6, 4.3, 4.3, 女声の場合はそれぞれ, 3.8, 4.2, 4.3であった.ピッチ変換率が3倍の場合には, それぞれの方式のMOS値が, 男声の場合に2.8, 2.4, 2.7, 女声の場合に1.6, 1.4, 1.7となった.これらの結果から, 提案方式は, ピッチ変換率が小さい場合には, PSOLA法に匹敵する高品質な音声が合成でき, ピッチ変換率を大きくした場合には, PSOLA法特有の劣化を減少させることができることがわかった.また, 本論文では, ピッチ変換を行った際にどのように位相特性を変化させるのが適当であるかについても検討し, ピッチを上昇させた際に位相特性を零位相に近づけると, 劣化が若干抑えられることがわかった.
著者
河原 英紀 榊原 健一 坂野 秀樹 森勢 将雅
雑誌
研究報告音楽情報科学(MUS) (ISSN:21888752)
巻号頁・発行日
vol.2018-MUS-121, no.1, pp.1-5, 2018-11-14

瞬時周波数と群遅延は,それぞれ位相の時間微分と周波数微分として定義されており,そのままでは,逆三角関数や位相の unwrap という脆弱で効率の悪い演算を必要としていた.Flanagan によって 1966 年に紹介された信号の瞬時周波数を求める式は,これらを必要とせず,群遅延の計算にも応用できることから広く用いられてきた.しかし,マルチメディア処理の普及により,最近の処理系では逆三角関数の計算を高速に実行することができるため,明示的に位相を経由することなく瞬時周波数と群遅延の計算を実装することができようになった.ここでは,サイドローブの減衰が急峻な余弦級数を時間領域の振幅包絡とする解析信号をインパルス応答とするフィルタを用いて有声音の音源を分析する方法を提案する.
著者
坂野 秀樹 陸 金林 中村 哲 鹿野 清宏 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.177, pp.15-20, 1997-07-17
被引用文献数
9

これまで音声の短時間位相は振幅情報に比べると聴覚的に重要でないという理由でなおざりにされてきた. しかし, 高品質な音声合成や符号化を考えた場合, それは必ずしもあてはまる訳ではなく, 短時間位相も合成音の品質に大きく関わってくる. ところが, 振幅スペクトルにはいくつかのパラメータ化法が確立されており効率的な表現が可能なのに対し, 短時間位相にはそのような方法は確立されていない. そこで, 短時間位相を効率良く表現する方法を提案し, 主観評価及び客観評価の両方から提案手法の有効性を示す.
著者
坂野 秀樹
出版者
名城大学
雑誌
若手研究(B)
巻号頁・発行日
2004

1.補間方法の評価・検証音声補間の応用の一つである音声モーフィングは、通常、異なる話者間の補間を行うが、話者間の音声特徴量の違いが大きいため、劣化も大きい上、劣化の原因も特定しづらい。そこで、本研究では、異なる話者間に比べて難易度の低い、同一話者・同一発声におけるモーフィングについて検討し、問題点を明らかにしてきた。特に、同じ発声内容でもスペクトルや基本周波数の変化に富む感情音声並びに、テンポや音程が保たれているため話声よりも扱いの容易な歌唱音声の補間・モーフィングについて検討している。今年度は、より広範なデータを用いての補間方法の検討・評価を行った。特徴点の設定方法を検討する中で、我々は声道断面積関数を利用したスペクトルの補間方法に関する手法を開発した。更なる高品質化のためには、より詳細な検討が必要であるが、極めて柔軟な補間が可能な手法となり得ることが確認されている。2.音声補間を利用したシステムの構築デモシステムの構築及び評価を行った。感情モーフィングを利用した中間的な感情を生成するシステム、入力歌唱音声のテンポを変更して合成するシステム、入力した音声のスペクトル及び基本周波数を実時間で変換して高品質な合成を行う実時間声質変換システムなどを構築した。特に、実時間声質変換システムについては、主観評価実験等による評価を行った結果を論文として投稿し、採録が決定している。このシステムに用いられている分析合成部分では、高品質音声分析合成方式であるSTRAIGHTをベースとしたものを用いているが、高速化や様々な工夫の導入により、実時間処理が難しいと言われていたSTRAIGHTの実時間処理を可能としている。この分析合成部分の評価を行った所、元のSTRAIGHTに比べれば劣化するものの、既存の分析合成であるケプストラムボコーダに比べて主観評価値のMOSにおいて1程度の品質向上が見られている。