著者
森勢 将雅 河原 英紀 小川 真
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2012-SLP-90, no.9, pp.1-6, 2012-01-27

急速に普及した動画共有サイトとコンテンツ制作支援のソフトウェアは,アマチュアクリエイタにも作品を公開する場と技術を与えた.現在では,複数のクリエイタの協調的な創造活動により,高い品質のコンテンツが多数生み出されている.また,クリエイタが利用するためのソフトウェア開発に関しても協調的な創造活動が行われ,優れたソフトウェアが創出されている.本稿では,歌声合成ソフトウェアをターゲットとし,誰でも利用可能な歌声合成技術を開発・公開することで,歌声合成ソフトウェア開発者間で協調的創造活動が創出されるか社会実験を試みた結果について示す.
著者
河原 英紀 増田 郁代
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.449, pp.19-24, 1997-01-17
被引用文献数
12

音声の時間周波数特性を有声音の周期性についての新しい観点に基づいて復元することに基礎を置く音声分析・変換・合成方法STRAIGHT (speech Transformation and Representation using Adaptive Interpolation of weiGHTed spectrogram) の近似特性の改良について報告する。本資料では、STRAIGHTで用いていた区分的一次関数が2階のカーディナルB-スプラインであることに注目し、スプライン関数近似理論に基づいて近似特性を評価し、改良方法について説明する。また、この改良を有効に機能させるため、二つの相補的な窓関数を組み合わせて、零を含まないパワースペクトルを計算する方法を提案する。これらの改良の結果、STRAIGHTによる分析合成音声は、ヘッドフォンによる受聴の際にも、場合によっては、原音声と区別がつかない程度に改良された。
著者
和田 芳佳 森勢 将雅 西村 竜一 入野 俊夫 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EA, 応用音響 (ISSN:09135685)
巻号頁・発行日
vol.111, no.175, pp.81-86, 2011-08-02

歌唱音声や障害音声,強い感情音声など,基本周波数のみでは十分に表すことのできない複雑な構造をもつ音声を分析するために,XSX(eXcitation Structure extractor)と呼ばれる方法を提案してきた.本資料では,従来の基本周波数抽出法と比較することで,XSXの特長と有効な適用領域を明らかにする.まず,FM調波複合音を試験用の信号として,基本周波数の変調周波数に対する追従性能を調べ,XSXが比較対象であるYINとSWIPEを大きく凌ぐ性能を有することを明らかにした.次いで,障害音声データの分析を行い,比較対象の方法と大きく異なる結果が得られる音声に対して詳細な検討を行った.XSXによる詳細な分析結果は,それらの音声では,いわゆる基本周期に加えて,複数の周期が組み合わされた単位が繰返されるサブハーモニックが生じていることを明らかにした.これらの結果は,XSXが従来の方法では困難な複雑な音声の分析に有用な方法であることを示すものである.
著者
筧 一彦 島田 正治 河原 英紀 竹内 勇剛
出版者
中京大学
雑誌
基盤研究(B)
巻号頁・発行日
2002

良好な人間-機械間の対話コミュニケーションの実現には、人間の機械に対する対話の志向性を形成することが重要である。このため対話における非言語情報や環境要因について検討した。1)対話の共感性:非擬人的エージェントであるクリーチャーが、人間の発話の韻律情報を模倣する非言語的応答を返すことによって、エージェントとの共感性が高まることを明らかとした。人間はクリーチャーの発話速度の変化に対して調整的発話をすることや通常より高いピッチレンジの応答に対して相手の強い意図や要求を感じるなどの点が明らかとなった。また、擬人的エージェントに対しては、エージェントの仮想的身体に対して働きかけを行うこと、複数エージェントとの対話環境においては、多数意見を背景にした行動をとることなどが判明した。2)感情音声の高品質処理と知覚特性:STRAIGHTをベースとした音声モーフィング法を完成した。異なる感情発話の間をモーフィングした音声の自然性が心理実験に十分な品質をもつこと、感情音声の心理連続体を構成うることを明らかとした。また、表情の知覚と異なり感情音声の知覚は必ずしもカテゴリカルでないことを示した。また、感情音声は言語の制約をこえて普遍的に知覚されることを示した。3)音源知覚・音環境制御:明確な音源定位知覚を得るのに必要な刺激音の提示時間刺激音の種類について明らかとした。また、ヘッドホン受聴、ステレオ拡声における両耳相加効果を解明した。音環境実現する手法として波面合成法をベースとし、音源推定によって少ない情報で音場再現・制御を可能とする方法を提案し、その実用を示した。また、音源が動くような場合にも適用可能なアルゴリズムを示した。
著者
坂野 秀樹 陸 金林 中村 哲 鹿野 清宏 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.177, pp.15-20, 1997-07-17
被引用文献数
9

これまで音声の短時間位相は振幅情報に比べると聴覚的に重要でないという理由でなおざりにされてきた. しかし, 高品質な音声合成や符号化を考えた場合, それは必ずしもあてはまる訳ではなく, 短時間位相も合成音の品質に大きく関わってくる. ところが, 振幅スペクトルにはいくつかのパラメータ化法が確立されており効率的な表現が可能なのに対し, 短時間位相にはそのような方法は確立されていない. そこで, 短時間位相を効率良く表現する方法を提案し, 主観評価及び客観評価の両方から提案手法の有効性を示す.
著者
岸本 宏子 羽石 英里 ERICKSON Donna エリクソン ドナ 細川 久美子 鈴木 とも恵 河原 英紀 竹本 浩典 榊原 健一 藤村 靖 新美 成二 本多 清志 中巻 寛子 長木 誠司 八尋 久仁代
出版者
昭和音楽大学
雑誌
基盤研究(C)
巻号頁・発行日
2010

音楽学の学際的な研究の試みとしてとりあげた「ソプラノの声の特性」の研究は、音声学、音響学、物理学、医学、声楽演奏、声楽指導、音楽学、音楽療法等の関係分野それぞれに、有益な収穫をもたらした。しかしそれにも増す成果は、研究の進行と共に個々の分野内の研究成果の枠を超えて、「学際的研究」としての総合的な研究への興味が高まって来た。そして、新たな研究代表者の下、本研究の成果を礎とした新たな研究へと発展的に継承されることである(基盤研究C25370117「歌唱時の身体感覚の解明:MRIによる発声器官の可視化と音響分析を中心とした試み」)。
著者
西村 竜一 三宅 純平 河原 英紀 入野 俊夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.103, pp.13-18, 2007-10-19
被引用文献数
16

提案する w3voice システムは、Web システムに対して、音声による入力インタフェースを拡張する。Java アプレットと CGI プログラムから構成し、通信プロトコルには、HTTP POST method と Redirection response を応用した実装を行った。このため、事前に特別な専用プログラムのインストールを要求せず、普段の Web ブラウザをそのままで使うことができる。また、音声認識、対話、ボイスチェンジャ、掲示板等の音声 Web アプリケーションを作成し、Web サイトで公開した。本研究は、家庭や職場等での音声インタフェースの利用環境を調べることを目的とする。そのために、利用者からの入力発話を蓄積し、分析をはじめている。約7ケ月で一日 47.6個、合計で 8 412 の入力を得ることができた。本稿では、提案システムの概要を述べ、収集データの発話時間及び SNR に関する調査結果を報告する。We have developed a speech input method called "w3voice" to build practical and handy voice-enabled Web applications. It is constructed using a simple Java applet and CGI programs comprising free software. The mechanism of voice-based interaction is developed on the basis of raw audio signal transmissions via the POST method and the redirection response of HTTP. We have released a number of w3voice applications on our website for public uses. The system also aims at organizing a voice database obtained from home and office environments. We have succeeded in acquiring 8,412 inputs (47.9 inputs / day) over a period of seven months. This report describes an overview of the proposed system, and results of analyzing collected inputs to observe utterance lengths and SNR.
著者
入野 俊夫 河原 英紀 西村 竜一 高橋 徹 津崎 実 津崎 実 高橋 徹 ロイD. パターソン
出版者
和歌山大学
雑誌
基盤研究(B)
巻号頁・発行日
2006

初期聴覚系における「寸法・形状知覚理論」の検証とその応用を行った。そのための心理実験を実施し、理論を支持する実験結果を数多く得た。fMRI実験によって、音節情報処理の脳内部位を推定し、寸法・形状情報処理の部位特定のための制約条件を与えた。「ガンマチャープ聴覚フィルタ」等のモデルをさらに洗練化した。 高品質音声分析合成法STRAIGHTの性能改善や、劣化音声の知覚実験と自動音声認識実験の対比も行い、音声知覚の計算理論構築の足がかりを得た。
著者
河原 英紀
出版者
一般社団法人 電気学会
雑誌
電気学会誌 (ISSN:13405551)
巻号頁・発行日
vol.130, no.6, pp.360-363, 2010-06-01 (Released:2010-06-01)
参考文献数
26

本記事に「抄録」はありません。
著者
河原 英紀
出版者
和歌山大学
雑誌
挑戦的萌芽研究
巻号頁・発行日
2010

我国の伝統的芸術である能の謡の表現に含まれる音声の分析合成技術の開発を通じて、これまでの分析合成技術では不可能であった情報の抽出と可視化ならびに制御と再合成を可能にする技術を開発した。特に、これまで不可能であった高い時間分解能での基本周波数およびスペクトルの分析を可能にした。これらに基づくモーフィングは、意識化が困難な脳における潜在的処理の計測の手段を提供することで、新しい研究の可能性を拓いた。
著者
吉田 有里 森勢 将雅 高橋 徹 河原 英紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.107, no.282, pp.31-36, 2007-10-18
被引用文献数
3

数分にわたる曲全体を一括して分析することのできる新しく開発されたTANDEM-STRAIGHTを用い、プロ歌手によるポップス系歌唱を分析して得られた歌唱音声中の母音スペクトルの統計的性質を調べた。分析には、男女各一名による歌唱音声が用いられた。STRAIGHTスペクトルから求められたMel帯域フィルタ出力とMFCCの主成分分析の結果は、いずれも第5主成分までに全分散の90%以上が含まれることを示した。また、求められた固有ベクトルとMFCCの基底関数の張る空間が類似する傾向が認められた。歌唱音声は、話声と比較して、基本周波数、発声のパワー、歌唱法などによるスペクトル変動が大きく、各母音の分布は元のパラメタ空間においても、低次の主成分で張られる空間においても、大きく重なっている。これらの結果が、母音情報に基づく音声変換法においてどのような意味を持っかについて議論する。