著者
櫻庭 京子 今泉 敏 広瀬 啓吉 新美 成二 筧 一彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.102, no.749, pp.49-52, 2003-03-20
参考文献数
7
被引用文献数
3

本研究では、男性から女性へ性転換を希望する性同一性障害者(Male to Female transsexuals=MtF)のために音声訓練(ボイス・セラピー)法を確立するために、日本文化圏で女声と判定される基本周波数(F0)の範囲を検討した。その結果80%以上女性と判定されたMtFのF0は180〜214Hzで、平均F0は193Hzとなり、欧米の先行研究より若干値が高くなった。180Hz以下では男声と判定される率が高くなる一方、平均値以上でも「男子の裏声」と判定される場合があり、高さだけでなく声の質も女声と判定されるためには重要であることが示唆された。
著者
櫻庭 京子 丸山 和孝 峯松 信明 広瀬 啓吉 田山 二朗 今泉 敏 山内 俊雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.106, no.613, pp.1-5, 2007-03-19
参考文献数
7

著者らは男性から女性へ性別の移行を希望する性同一性障害者(Male-to-Female transgenderd/transsexual=MtF)に対して、声を女性化させるためのtranssexual voice therapy(TVT)を行っている。今回の発表では、MtFの発話音声の分類を試みたので、その分類結果について報告する。今回の分類では、その一試案として発話者MtFの性的指向、男性から女性へ性別を移行したいと考える理由、現在の生活の実態など、音声の音響的な側面のみでなく、発話者の生き様も考慮した。このような分類法は、MtFの生き方の多様性と声の関係を把握するのに有効と考えられ、この研究の本来の目的であるTVTの方法論の確立のためにも必要であると考える。
著者
峯松 信明 西村 多寿子 櫻庭 京子 朝川 智 齋藤 大輔
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.107, no.165, pp.37-42, 2007-07-19
被引用文献数
3

発達心理学では幼児の言語獲得を「音声模倣」という言葉で表現するが,通常,声(音)を模倣しようとする幼児はいない。一方,九官鳥の「音声模倣」では彼等は声(音)を模倣する。何故,幼児は声(音)を模倣しようとしないのか?音の音色は共鳴特性に支配されるため,音を模倣する場合,親が持つ声道と同様の形状を有する声道が必要となり,結局,親と同じ体格が要求される。よって,物理的に声模倣は不可能である。では,何故,模倣しようと努力しないのか。そもそも,物理的に異なる二つの音ストリーム(例えば,父・母の「おはよう」)を何故「同一である」と感覚するのだろうか?「聞こえた音を音韻(仮名)表象に変換し,音韻列としての同一性を認知する」との仮説も可能であるが,発達心理学はこれを否定する。何故なら,分節音及び音韻意識は「後天的に学習されるもの」だからである。本研究は,上記問いを数学及び物理の問題として捉え,「音色の相対音感」という新概念を提案することで解く。提案する枠組みは,一つの帰結として「孤立音を音韻として同定する能力は音声言語運用の必要条件ではない」という命題を主張するが,欧米圏に数多く存在する発達性ディスレクシアが該当する症状を呈している。
著者
櫻庭 京子 今泉 敏 筧 一彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.99, no.393, pp.1-8, 1999-10-28
被引用文献数
3

本研究では音声による感情表現の発達的変化を解折した。3 ∼ 10歳の幼児・児童46名から、喜び、悲しみ、怒り、驚き、平静の5感情を「ピカチュウ」という単語音声で表現した音声を録音した。それらの内から、10名の成人聴取者による感情同定結果と話者の意図した感情が100%一致した132発話を選択して、基本周波数や時間構造を分析した。その結果、感情の主効果は多くのパラメータで有意であったものの、年齢の主効果は基本周波数と少数の時間的特性においてのみ有意であった。成人話者による感情表現と共通の音響的特性も多い反面、「怒り」などでは成人と異なる傾向も観測された。これらの結果は音声による感情表現の多くの特性がこの年代にすでに完成しているものの、感情によってはなお発達・変化していることを示唆している。
著者
櫻庭 京子 丸山 和孝 峯松 信明 広瀬 啓吉 田山 二朗 今泉 敏 山内 俊雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.686, pp.29-34, 2006-03-21
被引用文献数
1

著者らは男性から女性へ性別の移行を希望する性同一性障害者(Male-to-Female transgendered/transsexual=MtF)に対して、声を女性化させるためのtranssexual voice therapyを行っており、今回の発表では話者認識技術を用いて知覚的女性度を推定するシステムの臨床応用について検討する。このシステムは、声道特性と音源特性それぞれについて、男声モデル・女声モデルを持ち、各特性別に入力音声の女声度を推定、聴取実験により女性と判定される率(知覚的女声度)の予測値を算出する。上記のシステムを実際の臨床で用いた結果、声道形状を変えながらピッチをあげて女声をつくる方略の完成度を知ることはできるが、発話スタイルの動的制御に基づく女声の生成方略には対応できておらず、今後の検討の課題であることがわかった。
著者
能勢 隆 山岸 順一 小林 隆夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.572, pp.61-66, 2006-01-20
参考文献数
8

本論文では, 隠れマルコフモデル(HMM)に基づく音声合成システムにおいて, 複数の発話様式または感情表現の表出や強調の度合を制御することを目的に, 重回帰モデルを用いた音声のスタイル制御法を提案する. 従来の重回帰HMMを用いた手法では, 音声の重要な特徴の一つである音韻継続長を担う明示的なパラメータが存在しないため, 各発話様式・感情表現を個別にモデル化した場合に比べ, 再現性が低下するという問題があった. そこで提案法では, HMMに状態継続長分布を組み込んだ隠れマルコフモデル(HSMM)を用いることで音韻継続長を明示的な制御の対象としている. 主観評価試験により, 提案法は各発話様式・感情表現の再現性だけでなく, これらの表出・強調度合の制御においても, 従来の重回帰HMMを用いた手法より優れていることを示す. また, 発話様式・感情表現の制御法の一つである補間手法との比較や, 重回帰HSMMで用いるスタイル空間の違いが合成音声に与える影響についても検討を行っている.
著者
林 康子
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.98, no.177, pp.65-72, 1998-07-16
被引用文献数
6

感動詞「ええ」を含む7つの文脈{聞き返し, 驚き, 肯定, 時間稼ぎ, 疑い, 落胆, 迷い}の対話文を男女それぞれ2名の話者が読んだ音声を録音した.録音した音声のうち「ええ」の部分のピッチ曲線を抽出し, その発生時間・勾配が文脈で異なるかを検定した.{時間稼ぎ}{疑い}{迷い}は互いに差がみられなっかたが, それ以外ではどの文脈の対比も全て発生時間と勾配で弁別できた.次にこれらの7種類の「ええ」を, 新たな67名の被験者に聞かせ, 同定課題を行った.音声分析で弁別性が高かった「ええ」は, 回答と文脈との一致率が高かった.また, 特異な回答パターンが見られた「ええ」については, ピッチ曲線の形状を比較することによって説明できた.これらの結果は, ピッチ曲線がかなりの感性的情報を伝えていることを示している.
著者
高橋 徹 入野 俊夫 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.571, pp.31-36, 2006-01-19
被引用文献数
1

多様な発話変換・合成を記述できる音声テクスチャマッピングモデルを提案する. 提案するモデルは, 音声を特徴づける骨格となるワイヤフレームに発話スタイルや話者性を表わすテクスチャをマッピングする枠組みによって音声を表わす. ワイヤフレームやテクスチャは, 統計的にあるいは, 発話事例から求めることができる. このモデルは, 画像分野で用いられるテクスチャマッピングを音声に適用したモデルである. 一般に, 発話変換は, スペクトルに対する演算と変形によって実現される. テクスチャマッピングの枠組みを用いて演算と変形を取り扱う仕組みについて述べる. ワイヤフレームにどのようなテクスチャをマッピングするかによって多様な発話スタイルを表現できることを示す. また, 様々な発話スタイルの音声を合成できることを示す. 最後に, ある発話に基づいてワイヤフレームを生成し, テクスチャをマッピングすることで発話変換を行うことができることを示す.
著者
櫻庭 京子 峯松 信明 広瀬 啓吉 坂野 秀樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.104, no.630, pp.25-29, 2005-01-20

男性から女性へ性別の移行を希望する性同一性障害者(Male to Female transgender/transsexual=MtF)に対する音声治療・訓練を筆頭著者が中心となって行なっている。今回, 本訓練の客観的及び主観的有効性を検証するために, 訓練前後の音声に対する第三者による評価実験を行なうと共に, 訓練効果に対する患者本人の満足度について調査した。さらに話声位のF0(基本周波数)の変化を調べた。その結果, 第三者の聴取実験において訓練前は全ての聴者から男性と判定されていた患者が, 二ヶ月の訓練後では, 聴者の約九割に女性と判定されるに至った。患者自身も凡そ声の変化の様子に満足しているとの結果が得られている。F0は成人男性の平均値から成人女性の平均値に移行した。
著者
赤嶺 政巳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.113, no.366, pp.115-118, 2013-12-12

本稿では、東芝の音声合成技術について、閉ループ学習に基づく音声素片生成から最近の取り組みまでを紹介する。初期の開発では、カーナビなどの情報機器における音声による情報伝達を目的に、高音質、自然性の実現に注力してきた。最近では、インターネット上の音声コンテンツ作成や音声対話インターフェースへの適用に向けて、特定の話者の声や話し方に合成音をカスタマイズする技術、感情的な音声の合成を実現する技術、および応用システムの開発に取り組んでいる。
著者
田中 宏季 柏岡 秀紀 キャンベル ニック
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.111, no.225, pp.49-54, 2011-09-29

我々は相手のパラ言語や笑いなど声によって変わる情報から,Engagementという次元で対話相手の興味レベルをセンシングし,自閉症児に視覚情報を含み伝達するシステムの開発を最終目標とする.コンピュータを用いたEngagement Sensingの初期段階として,人間の気持ちや意図が表出されやすいと考えられる笑い声に注目する.本稿では,笑いが4種類に分類されることを示し,その「笑い分類」を自閉症児がどの程度識別できるのか,また実際に自閉症児を指導している先生の笑いアノテーション結果を分析し,その音響特徴量について議論する.最後にSVMによるcloseでの自動識別を行い,58%の正解率を得た.
著者
櫻庭 京子 今泉 敏 筧 一彦 Erickson Donna
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.100, no.726, pp.47-54, 2001-03-23
被引用文献数
2

本研究では日米の幼児・児童を対象に、母語の音声的制約が感情表現に及ぼす影響の言語間差異を、日米同一の発話内容を用いて検討した。その結果、平静発話では母語の音声的制約を反映した特性が多くみられたものの、感情をこめることにより、FOピークの移行、音節長の延長なとの共通した傾向がみられた。しかしながら、母音の無声化率や音節長の制御の方略などは感情発話においても言語固有の特性を示した。
著者
北村 達也
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.107, no.282, pp.49-54, 2007-10-18
参考文献数
15
被引用文献数
1

物真似音声が似ていると知覚される要因を調べるため,プロの物真似タレントによる物真似音声と対象話者の音声を比較した.2つの文章音声を分析した結果,基本周波数の平均値は対象話者の音声より20Hz前後高く,その変動パターンはこれらの話者の間でよく似ていた.スペクトルに関しても,その概形や第1,第3,第4ホルマント周波数が対象話者のもに近付けられていた.さらに,声帯音源特性を表す,DFTスペクトルの第1,第2調波の振幅差(H1-H2)もこれらの話者間で近い値を示した.一方,第2ホルマント周波数は話者間で異なっており,音節継続時間長は対象話者のものに近付ける傾向が見られなかった.
著者
峯松 信明 西村 多寿子 西成 活裕 櫻庭 京子
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.98, pp.1-8, 2005-05-20
被引用文献数
14

『音声知覚の容易性と音声物理の多様性』音声研究者を長年悩ませ続けてきた古典的問題である[1]。音声科学は, 音素に対する音響的不変量の不在から, 調音運動にその答えを求めている(運動理論)[2]。その一方で音声工学は, 膨大なる音声データの収集とその統計的モデリングにその答えを求めている(隠れマルコフモデル)[3]。問題は解かれたのか?否である。本研究は, これらとは全く異なる方法で一つの解答を与える。その際, 「構造不変の定理」と呼ぶ数学定理を導入する。この数学定理の上で, 「何故言語(記号とその操作体系)は空気振動に宿ったのか?」「言語が宿るということは, 空気振動に如何なる物理特性を要求するのか?」という問題を意識して音声モデリングを再考し, 上記問題に対する解答, 音声ゲシュタルト, を導出する。本稿では, この導出が, 認知心理学, 生態心理学, 認知言語学, 障害学, 及び, 複雑系研究を通して音声言語コミュニケーションを捉え直すことと等価であることを示す。更に, 音声研究史に対する一つの提言を行なうと同時に, 言語の獲得, 及び, 言語の起源についても考察する。
著者
氏平 明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.586, pp.57-64, 1998-03-05
参考文献数
23

本研究は吃音者の発音に着目して, その声の特徴を明らかにし, 音源の喉頭機能と吃音との関係を探究することを目的とする.そのため, 各23名の成人吃音者と健常者の持続母音の音響分析で病的音声の指標を調べた.結果はAPQとSPで吃音者は健常者より有意に高い数値を示した.次に吃音者の喉頭の器質的な問題を調べるため, 各4名の吃音者と健常者の声門を電子内視鏡で観察した.結果は全員異常が無かった.次にピッチの制御についてアクセント型と吃音発生との関係を調べた.結果は複雑なピッチと吃音発生率が対応していた.よって吃音者は喉頭制御に問題があり, それに複雑な処理の負荷がかかると吃音を生じやすいと考えられる.
著者
藤芳 衛 石田 透 澤崎 陽彦 大武 信之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.101, no.352, pp.1-8, 2001-10-11

最近コンピュータの世界共通コード体系としてWindows等で使用されているUnicodeの図形文字に点字記号を割り付け, 日本語と英語の共通の点字記号体系として統一日本語点字記号の開発を進めている.1996年に情報交換用符号JIS X-0201及びJIS X-0208に対応した「統一日本語点字記号」第1版を拡張してUnicodeに対応した第2版の開発を行った.本点字記号は日本と英語の一般文書から情報科学や数学等, 専門分野の文書までを統一された一通りの点字記号で表記することができる.小学生から専門家までの視覚障害者が学校や職場で共通に使用することができる.
著者
峯松 信明 中村 新芽 橋本 浩弥 広瀬 啓吉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.113, no.366, pp.129-134, 2013-12-12

日本語の韻律教育を支援すべく,自然言語処理技術,音声言語処理技術を用いたオンラィンアクセント辞書(Online Japanese Accent Dictionary, OJAD)を構築,運用している。日本語は前後のコンテキストによって単語のアクセントが頻繁に変化する特徴を有するが,アクセント変形に十分対応した日本語教育史上初の教材として,世界中の教育現場で利用されるに至っている。またこれまで,約4時間に渡るOJAD講習会を,国内10都市,海外17都市で開催しており,どの講習会も好評を博している。OJAD開発を技術的観点から見ると,アクセント句境界推定,アクセント核位置推定,F_0パターン生成など,音声合成の裏方として機能していた技術を表舞台に出しているに過ぎない。これは音声合成技術の一部を,音声を合成する目的以外に応用している例として考えることができる。本稿では,音声合成技術の応用可能性を考える一つの例としてOJAD開発・運用を捉え,検討する。
著者
河原 英紀 Cheveigne Alain de
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.449, pp.9-18, 1997-01-17
参考文献数
18
被引用文献数
33

基本波成分の瞬時周波数の計算に基づく音声の基本周波数の新しい抽出方法を提案し、発声と同時に記録したEGG信号との相互比較と人工的信号を用いたシミュレーションにより、性能の評価を行なった。基本周波数および基本周期に対して等方的なGabor関数から導かれるanalyzing waveletを用い、基本周波数の探索範囲を40Hz〜800Hzとした場合、後処理無しの状態で既に本方法の性能は、従来の方法の性能を凌駕している。因に、女性の発声した100文章音声の分析結果は、全分析結果の50%以上が、EGGの分析結果の±0.3%以内に入っていることを示した。wavelet分析に基づいて新たに「基本波らしさ」の指標を定義することにより、基本周波数を抽出せずに基本波成分を選択できるようにしたことが本方法の鍵となっている。
著者
伊田 政樹 中川 聖一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.92, pp.1-8, 1996-06-13
参考文献数
15
被引用文献数
4

音声認識システムの実用化には高精度認識と実時間処理という2つの課題がある。近年、より大規模な連続音声認識システムが求められており、全ての候補との照合を行なうことなく高精度かつ効率的な探索処理が必要となってきている。ここでは、ビームサーチ法とA^*探索法による認識性能の評価について述べる。認識実験より、ビームサーチ法は最適性が保証されていないが、適当なビーム幅と枝刈りのしきい値を与えることで、最適解を失う可能性は非常に小さくなり、枝刈りによって探索空間を大幅に削減できるために高速処理が可能となる。さらにここでは、ビーム幅の範囲内に最適バスが存在していることから、A^*探索法の探索空間をビーム幅で制限する方法について提案する。
著者
齋藤 大輔 山本 敬介 峯松 信明 広瀬 啓吉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.111, no.322, pp.7-12, 2011-11-21

本稿では,話者空間をテンソル形式によって表現することにより,柔軟に話者性を制御することが可能となる新しい手法を提案する.声質変換の研究において,任意話者の音声を入力または出力として,変換を実現する手法はアプリケーション応用の観点からも非常に重要な技術であるといえる.任意話者声質変換を目的とする技術として,固有声混合正規分布モデル(EV-GMM)に基づく固有声変換法(EVC)が提案されている.EVCにおいては,話者認識でよく用いられるアプローチと同様に,各話者GMMの正規分布の平均ベクトルを連結して得られるGMMスーパーベクトルをもとに話者空間が構築される.構築された話者空間上において,個々の話者は固有スーパーベクトルに対する少数の重みパラメータによって表現することが可能となる.本稿では,話者空間を構築するための事前学習話者データに対して,テンソル解析を導入することによって話者空間を構築することを検討する.本研究における提案手法では,個々の話者はスーパーベクトルではなく行列によって表現される.この話者を表す行列の行及び列は,それぞれ音響特徴量の平均ベクトルの次元及びガウス分布の要素に対応する.ここで,これらの行列のセットに対してテンソル解析を導入することで話者空間が構築される.提案法は,話者情報のスーパーベクトル表現に内在する問題点に対する解法となっており,任意話者声質変換の性能向上が期待できる.本稿では,一対多声質変換において,提案する話者空間表現を導入することで,その有効性を示す.