著者
白土 保
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.54, no.10, pp.715-719, 1998-10-01 (Released:2017-06-02)

二重奏音から, 個々の単音の基本周波数を分離抽出する手法と提案した。本手法は, 対象音の音響的性質に関して二つの穏やかな制約:(1)単音や調波複合音に類似しており, 低次の調波成分のパワーは他の部分音のパワーに比べ概して大きい, (2)二重奏音のパワースペクトルはそれぞれの単音のパワースペクトルの和として近似できる, ものを仮定している。このため本手法は, 対象とする楽器固有の音響特性やad hocなシステムパラメータを用いることなく幅広い範囲の二重奏音に対して適用することができる。また, 本手法では統計的検定手法を導入することにより, 基本周波数比が1:n(ただしnは2以上の整数)の関係, すなわち調波的関係の単音からなる二重奏音からの基本周波数の分離抽出を可能にしている。ヴァイオリン二重奏音, フルート二重奏音, 及び1台のピアノによるピアノ二重音に対し基本周波数分離抽出実験を行った。その結果, 調波的関係の単音からなる二重奏音に対し60〜90%程度, それ以外の二重奏音に対し90%程度の正解率で演奏された音名を同定でき, 本手法の有効性が確認された。
著者
長谷 芳樹 橘 亮輔 阪口 剛史 細井 裕司
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.64, no.11, pp.647-649, 2008-11-01 (Released:2017-06-02)
参考文献数
4
被引用文献数
2

近年,日本語単語及び単音節の聴取実験に「親密度別単語了解度試験用音声データセット(FW03)」(NII音声資源コンソーシアム,2006)が広く用いられている。しかし,FW03の音声レベルは等価騒音レベルが等しくなるよう校正されているため,特に単音節音声の聴感レベルが試験語ごとに大きく異なるという問題があった。そこで我々は,単音節音声について聴取実験によるラウドネス校正を行い,その校正値を公開することとした。実験の結果,必要な補正量は最大で12dBを超えていた。FW03の単音節音声を用いる際には,この校正値を適用することが望ましい。
著者
河井 恒 広瀬 啓吉 藤崎 博也
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.50, no.6, pp.433-442, 1994-06-01
参考文献数
19
被引用文献数
8

規則による日本語の音声合成において、高品質の韻律的特徴を生成しうる規則を作成した。この規則は、アクセント型、統語構造、文の焦点などの言語情報から韻律的特徴を表現する記号を生成する。韻律記号は、3種類の休止記号、4種類のフレーズ記号、及び6種類のアクセント記号からなり、音声の基本周波数パターンを生成するために用いられる。統語構造は、文境界、節境界、ICRLB境界などの統語境界によって表され、主として休止記号とフレーズ記号の生成に用いられる。一方、文の焦点は、韻律語の強調/抑圧として表され、アクセント記号の生成に用いられる。規則によって生成された韻律的特徴の正当性を評価するため、規則作成に用いたものとは別の文章を対象として、規則によって生成された韻律上の単位と職業アナウサが発声した自然音声の韻律上の単位との対応関係を調べた。その結果、両者は70〜90%の高い割合で一致しており、合成音声の自然性とあいまって本規則の有効性が示された。
著者
徳田 恵一 益子 貴史 小林 隆夫 今井 聖
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.53, no.3, pp.192-200, 1997-03-01 (Released:2017-06-02)
被引用文献数
2

動的特徴 (音声のデルタ及びデルタデルタパラメータを含む混合連続分布HMMから音声パラメータ列を生成するための高速アルゴリズムを提案する。ここでは, 尤度最大の意味で最適な音声パラメータ列を生成することを考え, この問題を現実的な演算量で解くため, 適応フィルタリングにおけるRLSアルゴリズムと類似の手法を用いて高速アルゴリズムを導出した。また, 提案アルゴリズムにより, 静的及び動的特徴の統計情報(平均及び共分散)を反映した音声パラメータ列の生成が可能となることを例によって示すと共に, 提案アルゴリズムの音声の規則合成への応用について考察を加えている。
著者
長田 泰公 吉田 拓正
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.53, no.8, pp.599-604, 1997-08-01
参考文献数
19
被引用文献数
2

航空機騒音のアノイヤンスの構造をパス解析によって検討した研究はS. M. Taylor(1984)のもの以外には見当たらない。そこで本報では, 成田空港周辺で行われた住民アンケート調査結果(1989)を用い, 騒音のアノイヤンス(全体的迷惑感)を目的変数とし, 居住地の騒音量(WECPNL)を含む回答者の属性と生活妨害や情緒影響などを説明変数としたモデルを作り, パス解析によってアノイヤンスに対する各説明変数の効果を検討した。アノイヤンスに対する騒音量の効果は最も大きかったが, それは直接効果に加えて会話妨害, 情緒的影響などを介する間接効果が大きいためである。直接効果そのものは会話妨害, 情緒影響よりも小さい。そこで騒音によるアノイヤンスは, 騒音の直接影響に加えて具体的な個々の影響が総合された結果であると結論された。この結果は, S. M. Taylorの航空機騒音, K. Izumiらの道路騒音についての報告と一致した。
著者
グリーンバーグ 陽子 加藤 宏明 津崎 実 匂坂 芳典
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.67, no.2, pp.65-74, 2011-02-01 (Released:2017-06-02)
参考文献数
15

対話音声の合成を目指して,対話韻律生成の方法を提案した。対話場面において出現する発話内容自体が,その取り得る対話韻律を限定することに着目し,提案方法では,入力となる語彙が与える印象によって制約される韻律特徴量を用いて,従来の読み上げ韻律を修正する対話韻律生成を行う。これまでに行った一語発話「ん」のパラ言語分析が示した,3次元の知覚的印象空間(確信-疑念,肯定-否定,好印象-悪印象)と韻律制御(基本周波数の平均値と時間変化形状,発話時間長)の関係を用いて,同じ印象空間で典型的な座標を持つ語彙に対して,対応する対話韻律を付与した。得られた合成音声に対する自然性評価実験により,提案した方法の妥当性を確認した。
著者
永岡 篤 森 大毅 有本 泰子
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.73, no.11, pp.682-693, 2017

<p>感情音声コーパスに付与されている感情ラベルには,次元で記述されたものとカテゴリで記述されたものがあり,これらには互換性がない。複数コーパスを統合し大規模なコーパスとして扱うためには感情ラベルの共通化が必要であるが,人手による感情ラベル付与はコストが高い。音声からの感情認識の技術を利用すれば異種感情ラベルの自動付与が可能だが,その推定精度は十分とは言えない。本論文では,音声から得られる特徴量に加え,それぞれの感情音声コーパスにもともと付与されている感情ラベルをも推定器への入力として利用した異種感情ラベル推定手法を提案する。まず,感情カテゴリラベルを持つコーパスOGVCに対する感情次元ラベルの推定実験を行った。モデル学習用のコーパスに付与されている感情ラベルとしては,次元とカテゴリの両方が利用できる場合,及び次元だけが利用できる場合についてそれぞれ検討した。次に,感情次元ラベルを持つコーパスUUDBに対する感情カテゴリラベルの推定実験を同様に実施した。実験の結果,対象コーパスにもともと付与されている感情ラベルの併用により,異種感情ラベルの推定精度を向上できることが示された。特に,UUDBに対する感情カテゴリラベルの推定においては,モデル学習用のコーパスが感情次元ラベルを持たず,推定された感情次元ラベルで代用した場合でも,推定精度を改善できることが分かった。</p>
著者
颯田 琴次 菅原 淳夫 小橋 豊
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.8, no.2, pp.97-103, 1952-06-30 (Released:2017-06-02)

The authors studies the body wall vibration(especially at the back of the nose)by phonation with a crystal pick-up to search the corelation among the amplitude of the wall vibration(μ), voice pressure(μbar)and the quantity of the nasal respiration(cc). It was found useful to decide the degree of nasalization from the ratio of the amplitude of wall vibration and the voice pressure, which was named by the authors as "vibration proportion". Comparison was made with Japanese vowels and nasal sounds uttered by 40 persons(9 male, 12 female, 5 singers and 14 patients of nasal speech). (A)Normal persons:1. The amplitude of wall vibration of nasal sounds is greatest in speech sounds. Yhe vowels "i"and "u" have greater amplitudes than others and "a" the smallest. 2. In average, the amplitude is greater in male voice than in female voice. In male voice the amplitude is great in low vocal range and in female voice it is great in high vocal range. It is very interesting to think of vocal difference by sex. 3. When nasopharynx is closed, the amplitude is smaller than when it is opened and this fact coincides with the degree of nasalization by acoustical examination. 4. The measured values slightly change sometimes on the same person(with same vocal range, voice intensity and speech sound). Accordingly, it is found that articulation is not always constant. 5. The vibration of nose wall increases with the nasalization and the relation between them, which is one of main objects of this study, is made more clear by "vibration proportion". Namly it is possible to know the degree of nasalization of a person from the "vibration proportion". (B)Singers(by singing voice):Difference between speech sounds which we perceived generally in normal persons decreases by singers and the vibration becomes more uniform. There is no wonder that it is the results of practice of singing method. (C)Patients of nasal speach:The amplitude of nose wall vibration is larger than normal extent(sometimes several times larger than normal). Therefore it is possible to know the degree of nasal speech by measurement of the wall viblation.