著者
濱上 知樹
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.54, no.12, pp.831-841, 1998-12-01

VCVを基本単位とする規則音声合成方式において, 発話速度の変化に対応することのできる, パワー時間変化パタン制御方法を提案する。提案に先立ち, 自然発声の発話速度変化に伴う, パワー時間変化パタンの変動について分析を行った。この実験結果に基づき, 音韻間の滑らかな変化(マクロパタン)と, 子音区間の細かい変化(ミクロパタン)を足し合わせるパタン制御方法を提案する。更に規則合成に応用するために, これら二つのパタンの合成に必要な, 制御パラメータテーブルとデータベースを, VCVパタンから作成した。本制御方法を用いた合成音の評価結果から, 本手法が, 自然なパワー時間変化パタンを合成する上で有効であることが明らかとなった。
著者
平井 啓之 党 建武 本多 清志
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.51, no.12, pp.918-928, 1995-12-01
被引用文献数
13

喉頭を含めた発話器官の生理学的モデルを作成した。このモデルは、各筋の活動量を入力として、舌・喉頭・顎などの発話器官に加わるすべての力が釣り合うときの発話器官の位置を求め、得られた声道形状及び声帯長を用いて音声の生成を行なうものである。また、本モデルでは、舌・下顎・舌骨・喉頭は互いに筋によって接続され力の授受が考慮されているため、舌と喉頭との相互作用を表現することができる。測定された筋電信号を入力として発話時の声道形状及び音声を生成し、発話時の声道断面のMRI画像及び実音声との比較を行なった。また、本モデルを用いて外舌筋のF_0に及ぼす影響について検討した。
著者
中山 剛 宮川 陸男 三浦 種敏
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.22, no.6, pp.332-339, 1966-11-30
被引用文献数
2

A model of the process of evaluating reproduced sound quality was examined experimentally. As shown in Fig. 1, it was assumed that there was such relationship between the preference scale of sound quality R and multidimensional sensory scale D_i(i=1, 2. . . , n), as R=w_iD_i, where w_i=W(L, S, A), L: listener groups classfied in terms of the similarity of preference, S: musical signals classfied by their effect on w_i, A: age(time) and D_i=φ_i(t_j, s_i), t_j: a physical parameter of a transmission system, s_i: components of S, contributing to D_i. To examine this model, three experiments were made. The first and the second experiments were made to examine a linear equation relating to above-mentioned R and D_i. Stimulus conditions are shown in Table 1, and the block diagram of experimental circuits is shown in Fig. 2. Two of classic music(A: synphony, B: string quartet) were used as the source S, and presented to ten listeners under the above stimulus conditions. By means of the method of paired comparisons, the preference scale R and two sensory scales D_1(sensation of noises, mainly related to nonlinear distortion) and D_3(sensation ob treble, mainly related to low-pass filtering frequency) were obtained. From three scales the least square solutions of w_1 and w_3 were calculated. These values are shown in Fig. 3 and 4. Finally, from the scale values of D_1 and D_3 and estimated weights w_1 and w_3, estimated value R^^~ of preference scale was calculated. As shown in Figs. 3 and 4, the coincidence of observed value R and estimated value R^^~ was fairly good. This seems to prove the adequacy of the model. Fig. 5 shows the coincidence of R and R^^~ with four dimenstional sensory scales (D_1-D_4) taken into account. This third experiment was made to examine the stability of w_i. If w_i is only affected by L, S and A, and not by t_j, and once w_i for definite L and S is obtained, as far as L and L and S are fixed, R^^~ for various t_j will be able to be estimated from the curves of φ_i. These estimated values of R^^~ should coincide with observed R for such t_j. Fig. 6 shows the curves, in which w_i was calculated, and Fig. 7 shows tho estimated scale values of D^^~_<2i> for the second set of t_j, which is different from that used in determing w_i (the first set of t_j). From such predetermined w_i and estimated D^^~_<2i>, estimated value R^^~_2 of preference scale was calculated. As shown in Fig. 8, estimated value R^^~_2 and obserbed value R_2 for the second set of t_j coincided with each other very well again. If this model is proved to be adequate, and when a listener group and a source classification are given, it will became possible to design a transmission system, the sound quality of which is liked best by the listener group.
著者
武田 昌一 大山 玄 朽谷 綾香 西澤 良博
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.58, no.9, pp.561-568, 2002-09-01
被引用文献数
9

筆者らは,より詳細なニュアンスの感情を表現する規則合成音声を実現することを究極目的として,感情を数段階に分けて韻律的特徴の解析を行っている。本論文では「怒り」を取り上げ,怒りの度合いを平常,軽い怒り,怒り,激怒の4段階に分けて段階に応じた単語音声の韻律的特徴の違いを調べた。今回は韻律的特徴として,単語内の最高音声パワー,平均発話速度,最高基本周波数を測定した。実験の結果,怒りの度合いが大きくなるにつれて(1)最高音声パワーは増大すること,(2)発話速度は増大傾向にあるが激怒になると逆に遅くなる傾向が見られること,(3)最高基本周波数は高くなる傾向が見られること,などが分かった。
著者
川浦 淳一 鈴木 陽一 浅野 太 曽根 敏夫
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.45, no.10, pp.756-766, 1989-10-01
被引用文献数
30

本論文では、ヘッドホン再生によってラウドスピーカ再生時の音場を模擬する手法について述べる。ヘッドホン再生条件と、ラウドスピーカ再生条件の比較から、頭部が静止している状態の静的な頭部伝達関数と、聴取者が頭部を動かすことによって生じる頭部伝達関数の動的な変化の2点について、ディジタル信号処理などの手法により補償を行った。静的な頭部伝達だけの補償によって、ヘッドホン再生によっても、頭外の水平面内任意方向への音像定位が実現できたが、正面付近のラウドスピーカを模擬した場合には前後の誤判定が増加する、頭内定位が起き易いなどの問題が生じた。静的な頭部伝達関数に加えて、伝達関数の動的な変化を模擬すると、前後の誤判定が減少し、頭内定位も減少するなど、より自然な音像定位が実現された。また、頭部回転に伴う動的な音源位置情報は、静的な伝達関数からの音源位置情報に比べて、少なくとも同程度の重みを持つものであることが示唆された。
著者
大串 健吾
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.36, no.5, pp.253-259, 1980-05-01
被引用文献数
9

In order to investigate physical and psychological factors governing timbre of complex tones, three-frequency complex tones are synthesized on a digital computer. Subjects make similarity judgments of pairs of the complex tones and the experimental data are analyzed by Kruskal's multidimensional scaling program. The analysis of the experimental data shows the followings : (1) the absolute values of the lowest and the highest frequencies are the most important factors governing timbre, (2) from a different point of view, the mean of the logarithmic values of the lowest and the highest frequencies are also important, and these values correspond to tone height (kan-dakasa) of complex tones, and the mean of adjacent frequency ratios (or absolute dissonance) is another important physical factor governing timbre and this physical factor is closely related to consonance of complex tones.
著者
鎌倉 友男 阿比留 巌 熊本 芳朗
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.46, no.10, pp.802-809, 1990-10-01
被引用文献数
2

音波の吸収、回折、非線形効果を集約したKZK放物形波動方程式を数値解析することで、1周期の正弦波パルスが伝搬するに際し発生する波形歪を追跡した。初期波形、特に符号のみ異なる正及び負で立ち上がるパルスに対して、波形の変化のみならずパワースペクトルの変化についても言及した。広帯域なパルス波においては1次波と2次波のスペクトルが重畳し、周波数成分間の非線形相互作用や回折効果の違いにより複雑な波形変化をする。初期信号の符号のみを変えることでこのような歪んだ波形から1次波と2次波を分離することができ、この手法について実験結果を加えて議論した。
著者
大垣 正勝 竹村 英夫
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.46, no.9, pp.723-727, 1990-09-01

乾き雪の積雪中の音速及び積雪表面の垂直入射吸音率を測定し、文献による従来のデータと比較検討した。まず、密度の小さい新雪から、密度の大きいしまり雪までの積雪試料について音速を測定し、音速と密度との関連を考察した。密度の大きい試料は、自然の状態では得られなかったので、積雪をふるいに通してから圧縮したものを用いた。今回測定した乾き雪の積雪試料においては、積雪中の音速は空気中の音速より遅く、巨視的に見て密度の増加と共に減少する傾向が得られた。次に、積雪表面の垂直入射吸音率の周波数特性を密度をパラメータとして音響管を用いて測定した。その結果、音速、垂直入射吸音率ともに、文献による従来のデータとばらつきの範囲内でほぼ一致した。本測定により、乾き雪の積雪における密度と音速及び垂直入射吸音率との関連を実験的に把握することができた。
著者
入野 俊夫
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.78, no.12, pp.718-723, 2022-12-01 (Released:2023-01-01)
参考文献数
16
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.79, no.6, pp.325-326, 2023-06-01 (Released:2023-07-01)
著者
森勢 将雅
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.79, no.1, pp.9-17, 2022-12-25 (Released:2023-02-01)
参考文献数
24

本論文では,テキスト音声合成の中でも特にEnd-to-End音声合成時代に向けた大規模日本語コーパスROHANを提案する。ROHANは常用漢字すべてを網羅しつつ,日本語文章では出現しにくいモーラを一定数含めるモーラバランスを重視している。オリジナルのコーパス文4,600文を22のサブセットとして構築しており,パブリックドメインのライセンスで公開している点も,本コーパスの特色である。本論文では,ROHANの設計コンセプトと具体的な作成手順を示し,各モーラの出現回数やコーパス文の平均モーラ数などの解析結果を示す。モーラ出現頻度に関するエントロピー,及び音素の拡張エントロピーによる評価から,既存のコーパスよりもモーラ・音素バランスに優れていることも示す。