著者
櫻庭 京子 今泉 敏 広瀬 啓吉 新美 成二 筧 一彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.102, no.749, pp.49-52, 2003-03-20
参考文献数
7
被引用文献数
3

本研究では、男性から女性へ性転換を希望する性同一性障害者(Male to Female transsexuals=MtF)のために音声訓練(ボイス・セラピー)法を確立するために、日本文化圏で女声と判定される基本周波数(F0)の範囲を検討した。その結果80%以上女性と判定されたMtFのF0は180〜214Hzで、平均F0は193Hzとなり、欧米の先行研究より若干値が高くなった。180Hz以下では男声と判定される率が高くなる一方、平均値以上でも「男子の裏声」と判定される場合があり、高さだけでなく声の質も女声と判定されるためには重要であることが示唆された。
著者
櫻庭 京子 丸山 和孝 峯松 信明 広瀬 啓吉 田山 二朗 今泉 敏 山内 俊雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.106, no.613, pp.1-5, 2007-03-19
参考文献数
7

著者らは男性から女性へ性別の移行を希望する性同一性障害者(Male-to-Female transgenderd/transsexual=MtF)に対して、声を女性化させるためのtranssexual voice therapy(TVT)を行っている。今回の発表では、MtFの発話音声の分類を試みたので、その分類結果について報告する。今回の分類では、その一試案として発話者MtFの性的指向、男性から女性へ性別を移行したいと考える理由、現在の生活の実態など、音声の音響的な側面のみでなく、発話者の生き様も考慮した。このような分類法は、MtFの生き方の多様性と声の関係を把握するのに有効と考えられ、この研究の本来の目的であるTVTの方法論の確立のためにも必要であると考える。
著者
峯松 信明 西村 多寿子 櫻庭 京子 朝川 智 齋藤 大輔
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.107, no.165, pp.37-42, 2007-07-19
被引用文献数
3

発達心理学では幼児の言語獲得を「音声模倣」という言葉で表現するが,通常,声(音)を模倣しようとする幼児はいない。一方,九官鳥の「音声模倣」では彼等は声(音)を模倣する。何故,幼児は声(音)を模倣しようとしないのか?音の音色は共鳴特性に支配されるため,音を模倣する場合,親が持つ声道と同様の形状を有する声道が必要となり,結局,親と同じ体格が要求される。よって,物理的に声模倣は不可能である。では,何故,模倣しようと努力しないのか。そもそも,物理的に異なる二つの音ストリーム(例えば,父・母の「おはよう」)を何故「同一である」と感覚するのだろうか?「聞こえた音を音韻(仮名)表象に変換し,音韻列としての同一性を認知する」との仮説も可能であるが,発達心理学はこれを否定する。何故なら,分節音及び音韻意識は「後天的に学習されるもの」だからである。本研究は,上記問いを数学及び物理の問題として捉え,「音色の相対音感」という新概念を提案することで解く。提案する枠組みは,一つの帰結として「孤立音を音韻として同定する能力は音声言語運用の必要条件ではない」という命題を主張するが,欧米圏に数多く存在する発達性ディスレクシアが該当する症状を呈している。
著者
櫻庭 京子 今泉 敏 筧 一彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.99, no.393, pp.1-8, 1999-10-28
被引用文献数
3

本研究では音声による感情表現の発達的変化を解折した。3 ∼ 10歳の幼児・児童46名から、喜び、悲しみ、怒り、驚き、平静の5感情を「ピカチュウ」という単語音声で表現した音声を録音した。それらの内から、10名の成人聴取者による感情同定結果と話者の意図した感情が100%一致した132発話を選択して、基本周波数や時間構造を分析した。その結果、感情の主効果は多くのパラメータで有意であったものの、年齢の主効果は基本周波数と少数の時間的特性においてのみ有意であった。成人話者による感情表現と共通の音響的特性も多い反面、「怒り」などでは成人と異なる傾向も観測された。これらの結果は音声による感情表現の多くの特性がこの年代にすでに完成しているものの、感情によってはなお発達・変化していることを示唆している。
著者
櫻庭 京子 丸山 和孝 峯松 信明 広瀬 啓吉 田山 二朗 今泉 敏 山内 俊雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.686, pp.29-34, 2006-03-21
被引用文献数
1

著者らは男性から女性へ性別の移行を希望する性同一性障害者(Male-to-Female transgendered/transsexual=MtF)に対して、声を女性化させるためのtranssexual voice therapyを行っており、今回の発表では話者認識技術を用いて知覚的女性度を推定するシステムの臨床応用について検討する。このシステムは、声道特性と音源特性それぞれについて、男声モデル・女声モデルを持ち、各特性別に入力音声の女声度を推定、聴取実験により女性と判定される率(知覚的女声度)の予測値を算出する。上記のシステムを実際の臨床で用いた結果、声道形状を変えながらピッチをあげて女声をつくる方略の完成度を知ることはできるが、発話スタイルの動的制御に基づく女声の生成方略には対応できておらず、今後の検討の課題であることがわかった。
著者
能勢 隆 山岸 順一 小林 隆夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.572, pp.61-66, 2006-01-20
参考文献数
8

本論文では, 隠れマルコフモデル(HMM)に基づく音声合成システムにおいて, 複数の発話様式または感情表現の表出や強調の度合を制御することを目的に, 重回帰モデルを用いた音声のスタイル制御法を提案する. 従来の重回帰HMMを用いた手法では, 音声の重要な特徴の一つである音韻継続長を担う明示的なパラメータが存在しないため, 各発話様式・感情表現を個別にモデル化した場合に比べ, 再現性が低下するという問題があった. そこで提案法では, HMMに状態継続長分布を組み込んだ隠れマルコフモデル(HSMM)を用いることで音韻継続長を明示的な制御の対象としている. 主観評価試験により, 提案法は各発話様式・感情表現の再現性だけでなく, これらの表出・強調度合の制御においても, 従来の重回帰HMMを用いた手法より優れていることを示す. また, 発話様式・感情表現の制御法の一つである補間手法との比較や, 重回帰HSMMで用いるスタイル空間の違いが合成音声に与える影響についても検討を行っている.
著者
林 康子
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.98, no.177, pp.65-72, 1998-07-16
被引用文献数
6

感動詞「ええ」を含む7つの文脈{聞き返し, 驚き, 肯定, 時間稼ぎ, 疑い, 落胆, 迷い}の対話文を男女それぞれ2名の話者が読んだ音声を録音した.録音した音声のうち「ええ」の部分のピッチ曲線を抽出し, その発生時間・勾配が文脈で異なるかを検定した.{時間稼ぎ}{疑い}{迷い}は互いに差がみられなっかたが, それ以外ではどの文脈の対比も全て発生時間と勾配で弁別できた.次にこれらの7種類の「ええ」を, 新たな67名の被験者に聞かせ, 同定課題を行った.音声分析で弁別性が高かった「ええ」は, 回答と文脈との一致率が高かった.また, 特異な回答パターンが見られた「ええ」については, ピッチ曲線の形状を比較することによって説明できた.これらの結果は, ピッチ曲線がかなりの感性的情報を伝えていることを示している.
著者
高橋 徹 入野 俊夫 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.571, pp.31-36, 2006-01-19
被引用文献数
1

多様な発話変換・合成を記述できる音声テクスチャマッピングモデルを提案する. 提案するモデルは, 音声を特徴づける骨格となるワイヤフレームに発話スタイルや話者性を表わすテクスチャをマッピングする枠組みによって音声を表わす. ワイヤフレームやテクスチャは, 統計的にあるいは, 発話事例から求めることができる. このモデルは, 画像分野で用いられるテクスチャマッピングを音声に適用したモデルである. 一般に, 発話変換は, スペクトルに対する演算と変形によって実現される. テクスチャマッピングの枠組みを用いて演算と変形を取り扱う仕組みについて述べる. ワイヤフレームにどのようなテクスチャをマッピングするかによって多様な発話スタイルを表現できることを示す. また, 様々な発話スタイルの音声を合成できることを示す. 最後に, ある発話に基づいてワイヤフレームを生成し, テクスチャをマッピングすることで発話変換を行うことができることを示す.
著者
櫻庭 京子 峯松 信明 広瀬 啓吉 坂野 秀樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.104, no.630, pp.25-29, 2005-01-20

男性から女性へ性別の移行を希望する性同一性障害者(Male to Female transgender/transsexual=MtF)に対する音声治療・訓練を筆頭著者が中心となって行なっている。今回, 本訓練の客観的及び主観的有効性を検証するために, 訓練前後の音声に対する第三者による評価実験を行なうと共に, 訓練効果に対する患者本人の満足度について調査した。さらに話声位のF0(基本周波数)の変化を調べた。その結果, 第三者の聴取実験において訓練前は全ての聴者から男性と判定されていた患者が, 二ヶ月の訓練後では, 聴者の約九割に女性と判定されるに至った。患者自身も凡そ声の変化の様子に満足しているとの結果が得られている。F0は成人男性の平均値から成人女性の平均値に移行した。
著者
赤嶺 政巳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.113, no.366, pp.115-118, 2013-12-12

本稿では、東芝の音声合成技術について、閉ループ学習に基づく音声素片生成から最近の取り組みまでを紹介する。初期の開発では、カーナビなどの情報機器における音声による情報伝達を目的に、高音質、自然性の実現に注力してきた。最近では、インターネット上の音声コンテンツ作成や音声対話インターフェースへの適用に向けて、特定の話者の声や話し方に合成音をカスタマイズする技術、感情的な音声の合成を実現する技術、および応用システムの開発に取り組んでいる。
著者
田中 宏季 柏岡 秀紀 キャンベル ニック
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.111, no.225, pp.49-54, 2011-09-29

我々は相手のパラ言語や笑いなど声によって変わる情報から,Engagementという次元で対話相手の興味レベルをセンシングし,自閉症児に視覚情報を含み伝達するシステムの開発を最終目標とする.コンピュータを用いたEngagement Sensingの初期段階として,人間の気持ちや意図が表出されやすいと考えられる笑い声に注目する.本稿では,笑いが4種類に分類されることを示し,その「笑い分類」を自閉症児がどの程度識別できるのか,また実際に自閉症児を指導している先生の笑いアノテーション結果を分析し,その音響特徴量について議論する.最後にSVMによるcloseでの自動識別を行い,58%の正解率を得た.
著者
櫻庭 京子 今泉 敏 筧 一彦 Erickson Donna
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.100, no.726, pp.47-54, 2001-03-23
被引用文献数
2

本研究では日米の幼児・児童を対象に、母語の音声的制約が感情表現に及ぼす影響の言語間差異を、日米同一の発話内容を用いて検討した。その結果、平静発話では母語の音声的制約を反映した特性が多くみられたものの、感情をこめることにより、FOピークの移行、音節長の延長なとの共通した傾向がみられた。しかしながら、母音の無声化率や音節長の制御の方略などは感情発話においても言語固有の特性を示した。
著者
藤芳 衛 石田 透 澤崎 陽彦 大武 信之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.101, no.352, pp.1-8, 2001-10-11

最近コンピュータの世界共通コード体系としてWindows等で使用されているUnicodeの図形文字に点字記号を割り付け, 日本語と英語の共通の点字記号体系として統一日本語点字記号の開発を進めている.1996年に情報交換用符号JIS X-0201及びJIS X-0208に対応した「統一日本語点字記号」第1版を拡張してUnicodeに対応した第2版の開発を行った.本点字記号は日本と英語の一般文書から情報科学や数学等, 専門分野の文書までを統一された一通りの点字記号で表記することができる.小学生から専門家までの視覚障害者が学校や職場で共通に使用することができる.
著者
峯松 信明 中村 新芽 橋本 浩弥 広瀬 啓吉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.113, no.366, pp.129-134, 2013-12-12

日本語の韻律教育を支援すべく,自然言語処理技術,音声言語処理技術を用いたオンラィンアクセント辞書(Online Japanese Accent Dictionary, OJAD)を構築,運用している。日本語は前後のコンテキストによって単語のアクセントが頻繁に変化する特徴を有するが,アクセント変形に十分対応した日本語教育史上初の教材として,世界中の教育現場で利用されるに至っている。またこれまで,約4時間に渡るOJAD講習会を,国内10都市,海外17都市で開催しており,どの講習会も好評を博している。OJAD開発を技術的観点から見ると,アクセント句境界推定,アクセント核位置推定,F_0パターン生成など,音声合成の裏方として機能していた技術を表舞台に出しているに過ぎない。これは音声合成技術の一部を,音声を合成する目的以外に応用している例として考えることができる。本稿では,音声合成技術の応用可能性を考える一つの例としてOJAD開発・運用を捉え,検討する。
著者
河原 英紀 Cheveigne Alain de
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.449, pp.9-18, 1997-01-17
参考文献数
18
被引用文献数
33

基本波成分の瞬時周波数の計算に基づく音声の基本周波数の新しい抽出方法を提案し、発声と同時に記録したEGG信号との相互比較と人工的信号を用いたシミュレーションにより、性能の評価を行なった。基本周波数および基本周期に対して等方的なGabor関数から導かれるanalyzing waveletを用い、基本周波数の探索範囲を40Hz〜800Hzとした場合、後処理無しの状態で既に本方法の性能は、従来の方法の性能を凌駕している。因に、女性の発声した100文章音声の分析結果は、全分析結果の50%以上が、EGGの分析結果の±0.3%以内に入っていることを示した。wavelet分析に基づいて新たに「基本波らしさ」の指標を定義することにより、基本周波数を抽出せずに基本波成分を選択できるようにしたことが本方法の鍵となっている。
著者
伊田 政樹 中川 聖一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.92, pp.1-8, 1996-06-13
参考文献数
15
被引用文献数
4

音声認識システムの実用化には高精度認識と実時間処理という2つの課題がある。近年、より大規模な連続音声認識システムが求められており、全ての候補との照合を行なうことなく高精度かつ効率的な探索処理が必要となってきている。ここでは、ビームサーチ法とA^*探索法による認識性能の評価について述べる。認識実験より、ビームサーチ法は最適性が保証されていないが、適当なビーム幅と枝刈りのしきい値を与えることで、最適解を失う可能性は非常に小さくなり、枝刈りによって探索空間を大幅に削減できるために高速処理が可能となる。さらにここでは、ビーム幅の範囲内に最適バスが存在していることから、A^*探索法の探索空間をビーム幅で制限する方法について提案する。
著者
齋藤 大輔 山本 敬介 峯松 信明 広瀬 啓吉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.111, no.322, pp.7-12, 2011-11-21

本稿では,話者空間をテンソル形式によって表現することにより,柔軟に話者性を制御することが可能となる新しい手法を提案する.声質変換の研究において,任意話者の音声を入力または出力として,変換を実現する手法はアプリケーション応用の観点からも非常に重要な技術であるといえる.任意話者声質変換を目的とする技術として,固有声混合正規分布モデル(EV-GMM)に基づく固有声変換法(EVC)が提案されている.EVCにおいては,話者認識でよく用いられるアプローチと同様に,各話者GMMの正規分布の平均ベクトルを連結して得られるGMMスーパーベクトルをもとに話者空間が構築される.構築された話者空間上において,個々の話者は固有スーパーベクトルに対する少数の重みパラメータによって表現することが可能となる.本稿では,話者空間を構築するための事前学習話者データに対して,テンソル解析を導入することによって話者空間を構築することを検討する.本研究における提案手法では,個々の話者はスーパーベクトルではなく行列によって表現される.この話者を表す行列の行及び列は,それぞれ音響特徴量の平均ベクトルの次元及びガウス分布の要素に対応する.ここで,これらの行列のセットに対してテンソル解析を導入することで話者空間が構築される.提案法は,話者情報のスーパーベクトル表現に内在する問題点に対する解法となっており,任意話者声質変換の性能向上が期待できる.本稿では,一対多声質変換において,提案する話者空間表現を導入することで,その有効性を示す.
著者
中山 一郎 岡田 稔枝 中川 みかほ
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.98, no.610, pp.5-8, 1999-02-18
被引用文献数
1

これまで筆者らは、発声時に発声者自身が聴取する音声(自己聴取音)の音色を、自己聴取音に相当する音声を発声者がイコライザとアッテネータを操作して、自己聴取音と出来るだけ似かよった音声(シミュレート音)を作成する方法(遅延音帰還法)を用いて、周波数軸上で定量化してきた。しかしながら、自己聴取音は発声者本人しか聴取できないが故に、シミュレート音との類似性を客観的には評価できなかった。そこで本研究では、男性の話し声の母音/a/を対象に、1)自己聴取音とシミュレート音、及び、2)シミュレート音とその音色を実験者が意図的に変化させて作成した音声(加工音)、との2種類の類似度評価実験を行うことによって、自己聴取音とシミュレート音の類似性が原理的には客観的に評価できること、及びその類似性が十分に高いことを明らかにした。
著者
ポンキッティパン ティーラポン 齋藤 大輔 峯松 信明 広瀬 啓吉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.112, no.81, pp.7-12, 2012-06-07

本稿ではeigenvoiceに基づくキャラクター変換の一手法を提案する。273名の話者から構築したeigenvoice話者空間と,セミプロの声優から収録した三種類のキャラクタ声を用いて,キャラクター変換を実装する。ここでは任意の入力話者に対して,その話者の個人性を保存しつつ,声のキャラクターのみを変換する。母語話者及び非母語話者を対象に,キャラクター変換前後の合成音声を用いた聴取実験を行なった。その結果,意図されたキャラクター差異が十分に知覚されることが示された。更に,セミプロの声優による二キャラクターにおいて基本周波数差異が小さい場合でも,対応する合成音声から,十分にキャラクター差異を知覚できることが示された。これは,キャラクター変換の場合,スペクトルに基づく変換が不可欠であることを意味している。また,セミプロによる三キャラクタ声と提案手法による三キャラクタ声との音響分析により,本提案手法が適切な変換を実装できていることも確認できた。
著者
安藤 彰男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.102, no.417, pp.37-38, 2002-10-23
被引用文献数
2 1

本稿では、音声認識を利用した2つのリアルタイム字幕制作システムを紹介する。1つは、ニュース番組を対象とした字幕制作システムである。このシステムでは、番組中のアナウンサーの声をリアルタイムで認識し、認識結果中の認識誤りを即座に人手で修正して、字幕原稿を制作する。もう1つは、バラエティ番組やスポーツ中継を対象とした字幕制作システムである。こちらでは、番組中の音声を直接認識するのではなく、リスピークと呼ばれる方式をベースとしている。NHKでは、ニュース用字幕制作システムを利用して、2000年3月27日から、毎日ニュース番組の字幕放送を実施している。また、リスピークに基づくシステムを用いて、2001年12月31日の紅白歌合戦、2002年2月のソルトレークシティオリンピックなどの字幕放送を実施した。