著者
佐々木 星太朗 白木 善尚
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013-MUS-99, no.36, pp.1-6, 2013-05-04

歌唱合成音声とは,音声合成・デスクトップミュージック(DTM)ソフトウェア等を用いて,コンピュータ上で生成された歌唱音声である.本研究では,歌唱合成音声のハスキーボイス化の方法を提案する.ハスキーボイス化の基本的な手法は,音声信号の声帯情報である残差信号に処理を加える「残差変換」である.この「残差変換」について本研究では二種類の方法を提案している.さらに「残差変換」処理後の音質向上を図るためイコライザーの応用を試みる.また残差信号の振幅情報から「残差変換」処理のレヴェルを決定することによって,ハスキーボイスの自動生成を行なう.提案した二種類の「残差変換」法,イコライザ一応用法,自動生成法,の4つの手法を用いて合成した音声の聴取実験を行い,魅力的なハスキーボイス化のためにはどのような手法や指標に有用性があるのかについて,検証する.
著者
古市 朝美 白木 善尚
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2013-MUS-99, no.59, pp.1-6, 2013-05-04

今日,楽曲製作に用いられる音源の多くは,楽器音の波形をサンプリングしたPCM音源が使われている.一方,偏微分方程式を用いて楽器の音響特性を表現し,その偏微分方程式の解に基づく物理モデル音源も実用化されている.物理モデル音源は音高,音色,音程などの操作が容易であり,音の立ちあがりや連続した音の生成等,PCM音源と比べて自然な楽器音作りが可能である.本報告では,代表的な撥弦楽器であるギター音の生成法,特にグリッサンド音の物理モデル音源の生成法を提案する.更に生成した音源の聴取実験を通して,提案した方法の妥当性の検証を行う.
著者
白木 善尚
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.100, no.97, pp.63-68, 2000-05-19
被引用文献数
2

単位円内|z|<1の複素数値解析関数(正則関数)は線型時不変系の伝達関数H(z)として良く使われる。例えば、音声波の線型予測分析(LPC)は一変数の有理関数を用いる。この際、鼻音を除く音声の多くの特徴は有理関数の極に現れる。合成の際には、極の情報を与えて有理関数を作り、声道のフィルターとして用いる。「音声の特徴と極とのうまい対応」が正当化される一変数複素解析の側面からの根拠は、正則関数の極が孤立点であること、による。これらのことから、2人の話者の音声を分析する場合、二変数の有理関数を用いることが考えられる。しかし、多変数の場合、極は孤立点とは限らない。解析接続の状況が一変数の場合とは異なるためである。したがって、極の情報を与えて正則関数を作れるか、どのような条件のときにそれが可能なのか、それ自体が難しい問題となる。この問題はクザン(Cousin)の問題と呼ばれ、Hartogsの逆問題などともに、岡潔が解決した。岡による一連の解決の核心は『上空移行の原理』にある:考えている空間の次元を適当に上げることによって問題の困難さがときとして緩和される。本稿では、『上空移行の原理』に習った音声特徴の多重構造の調べ方について報告する。音声特徴の多重性は、種々の「複雑な領域」に現れる。「複雑な領域」における音声の多重性の問題を『上空移行の原理』を用いて、「簡明な凸性」の組み合わせ問題へと帰着させる。L^2空間との関連も述べる。
著者
河野 泰人 白木 善尚
雑誌
情報処理
巻号頁・発行日
vol.47, no.12, pp.1309-1310, 2006-12-15
著者
白木 善尚
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.99, no.73, pp.53-60, 1999-05-20
被引用文献数
1

我々は音声信号のスペクトルに関する2話者間の補間の取り扱い方を調べた。その結果、自然性を保持可能な空間の構造に関して以下を主張する:(1)滑らかな補間という側面からヤン-ミルズ方程式の解空間(モジュライ:幾何学的な対象をパラメータづけている多様体)が利用できる。すなわち「接続のエネルギー最小化問題」として扱うことが可能である。(2)具体的な解のひとつとして平坦接続がある。(3)この平坦接続から時間軸方向の区分線形補間が導出される。(4)区分線形補間からスペクトルの動的尺度の相似変換が導出される。(5)平坦接続から周波数方向の尺度Laplacian Spectral Distance(LSD)が導出される。(6)区分線形補間の設計アルゴリズムを考案した。(7)LSDとIFISを(局所周波数領域で)組み合わせたアルゴリズムを考案した。(8)聴取実験の結果、考案アルゴリズムによる補間合成音声は比較的良好な自然性が確認された。
著者
白木 善尚
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IT, 情報理論 (ISSN:09135685)
巻号頁・発行日
vol.99, no.55, pp.1-6, 1999-05-17
被引用文献数
2

我々は音声信号のスペクトルに関する話者情報の取り扱い方を調べた。その結果、話者情報に関する空間の構造(話者構造)に関して以下を主張する : (1)話者情報と音韻情報を扱うためには、その空間に局所的な「計量の伸縮機構」が必要である。(2)計量を伸縮することが可能な枠組みは、接続の量子化を考察可能な空間である。このような空間の候補にはディラック作用素が作用する空間がある。従って、この空間が話者情報にとって適切な空間のひとつと考えられる。(3)ディラック作用素の二乗はラプラシアンである。従って、話者情報はラプラシアンで記述できるものと考えられる。(4)以上により、話者構造は統計構造(情報幾何 : 双対接続に沿って計量固定)とは異なる。
著者
白木 善尚
出版者
湘南工科大学
雑誌
湘南工科大学紀要 (ISSN:09192549)
巻号頁・発行日
vol.40, no.1, pp.53-64, 2006-03-18

We investigate some geometrical strucutures of stochastic processes through large deviation theory. Some applications,such as Wiener functional space, nonlinear filtering theory and Malliavin calculus, are also examined.We investigate some geometrical strucutures of stochastic processes through large deviation theory. Some applications,such as Wiener functional space, nonlinear filtering theory and Malliavin calculus, are also examined.