著者
厨川 守 八尋 博司 柏木 成豪
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.34, no.9, pp.493-500, 1978-09-01
被引用文献数
17 8

As a result of determining a macroscopic structure of tone quality by sensory evaluations and multidimensional scaling method, it seemed that the psychological space applicable to tonal descriptive terms is composed of three main attributes, namely LOUDNESS(loud-sorf), PITCH(high pitched-low pitched) and PLEASANTNESS(pleasant-unpleasant) mutually almost orthogonal. Moreover, four sub-attributes intersecting obliquely to the three main-attributes were found. These sub-attributes included CONSONANCE (clear-turbid), BRIGHTNESS(bright-somber), RICHNESS (rich-thin) and SMOOTHNESS (smooth-rough). As a matter of fact, these four sub-attributes depend on the three main-attributes(Fig. 10). For example, the "clear" quality of consonance is "soft", "high pitched" and "pleasant" sound, while the "turbid" quality is "loud", "low pitched" and "unpleasant" sound, and this result thoroughly corresponds to the CONSONANCE THEORY. The tonal sources used for the present hearing experiments consist of four groups. They are (1) 57 synthetic tones the physical values of which are distinctly grasped, (2) 97 musical instrument solo tones, (3) 44 tones by varying a part of the sound of "Scheherazade", which is the orchestral music with dominant string sections, and (4) 33 tones by varying a part of "Pictures at an exhibition", which is the orchestral music with dominant percussion and brass sections. As for the variation of above mentioned two orchestral sources, the quantitative variations such as spectrum form, intensity, phase modulation and echo were given, 41-53 hearing panels evaluated these tones by the choise of 38 tonal descriptive terms(Table 1) in the auditorium. For analysis, the program by Kruskal was used. (Fig. 4). As the result of this analysis, configurations in Fig. 6〜9 were obtained in three dimensions for each two source groups(Table 3). As for the distribution of the terms for these four source groups, the words of praise and displeasure distributed in two semispherical shell space divided by LOUDNESS-PITCH plane. At the center of the two hemispheric configurations, "pleasant" and "unpleasant" distributed, which represent important factors. This axis was stable even if the sources are different, therefore, PLEASANTNESS is regarded as the third main attribute following LOUDNESS and PITCH(Table 4). Next, the stable terms distributing in the diagonal quadrants among eight quadrants in Fig. 6〜9 are closely examined in common in four source groups, then the terms of four sub-attributes described above were extracted. When the above experimental data were reanalyzed with 14 terms concerning three main attributes and four sub-attributes, the stress in three dimensions decreased further, and approximately similar configuration was obtained. Based on these facts, it is suggested that the fourteen tonal descriptive terms concerning three main-attributes and four sub-attributes are sufficient for deriving the macroscopic structure of tonal sources.
著者
千葉 修 柏 達也 霜田 英麿 鏡 愼 深井 一郎
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.49, no.8, pp.551-562, 1993-08-01
被引用文献数
23 4

3次元時間領域における音場解析は定常解だけでなく過渡解やパルス応答が容易に得られ、フィールド分布など系の特性把握に有効である。本論文では、この3次元時間領域音場解析の一つとして従来の差分法とは異なるリープフロッグアルゴリズムに基づく時間依存差分法による音場解析を試みた。ここでは、音場解析のための本手法の定式化を3次元空間について行った。次に、表面インピーダンスを持つ境界条件の定式化を行いその妥当性を確認した。また剛体角柱による散乱定常解析から本定式化の妥当性を確認した。更に、表面インピーダンスが仮定された角柱と剛体角柱による散乱過渡解析を行い、本手法の散乱解析への有効性を示した。
著者
佐々木 實 石川 智子 山田 真司
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.45, no.10, pp.743-747, 1989-10-01
被引用文献数
11 2

人間の手によるピアノの直接演奏において、楽譜上の等しい時価を演奏したときの時間間隔に見られるゆらぎについて分析を試みた。各音符の長さをできる限り正確に弾いたメトロノーム的な演奏(Aタイプと名づける)と、芸術的な演奏(Bタイプと名づける)とについて、各音符の時価に対応する時間間隔を測定し、その時系列からゆらぎのパワースペクトルを求めた。その結果次の結論を得た。1)Aタイプの演奏は全体のゆらぎのパワーが小さく、かつ、スペクトルエンベロープの傾きは、平坦又は右上がりである。2)Bタイプの演奏は全体のゆらぎのパワーが大きく、かつ、長い周期によるゆらぎが強調されており、スペクトルエンベロープの傾きは右下がりである。3)A、B両タイプのスペクトルエンベロープの傾きの係数の境界はおおまかに-2付近に設定できる。
著者
岩宮 眞一郎
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.48, no.9, pp.649-657, 1992-09-01
被引用文献数
29

市販のレーザ・ディスク作品、及び、別の作品の音と映像を組み合わせた素材を用いて、AVメディアを通しての情報伝達における、視覚と聴覚の相互作用に及ぼす、音と映像の調和度の影響を検討した。音と映像の重畳が、音と映像の印象を良くする、協合的な相互作用においては、音と映像の調和度が高いほど、その効果が大きい。視覚と聴覚に共通する性質(通様相性)が同方向に変化する、共鳴現象に関しては、通様相性の処理レベルに依存し、明るさのように、低次の処理による性質では、調和度とは関わりなく、共鳴現象が生ずるが、引き締まり感、きれいさのような、高次の処理を必要とする性質では、調和度が高くないと、共鳴現象が生じない。
著者
中根 偕夫 平田 尚史 瀬谷 浩一郎
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.46, no.11, pp.893-898, 1990-11-01
被引用文献数
15

ここでは定在波音場中での高気圧グロー放電の諸特性の変化をみた。すなわち、(1)高気圧グロー放電の発生する電圧の範囲、(2)高気圧グロー放電の発光部の形状、(3)電流波形への音の影響、(4)V-I特性、(5)放電の発生と消滅する電圧の履歴的な現象に関して検討した。実験方法として、針(+)対平板(-)電極を定在波音場中の粒子速度分布の腹に位置させ、音の強さと電源の電圧を変化して実験した。その結果、音を大にすることによって(1)高気圧グロー放電はスパークへと変化し、(2)放電の発光部が扇子を開いたような形状へと広がり、(3)電流波形にパルスの発生が見られ、(4)電極間電圧の上昇、(5)発生と消滅する電圧の履歴現象などに音の影響があることが分かった。
著者
福留 公利
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.44, no.4, pp.272-281, 1988-04-01
被引用文献数
21

複数個のマイクロホンを一つの剛球に埋め込む「球バッフル埋込みマイクロホン」とその回折情報を用いて、複数個の未知の音源の入射方向角及びスペクトルの両方を推定する方法を述べる。音源方向角を仮定しながら、本マイクロホンの回折情報を用いて計算したスペクトルと実際のスペクトルとの差から周波数ごとに定義されるノルムの自乗を最小にするようにして、音源推定を行う。更に、推定した方向からの音信号を抽出するマイクロホンシステムについても述べる。計算機シミュレーションにより、本方法の有効性を確かめている。
著者
岡田 清
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.55, no.11, pp.742-751, 1999-11-01
被引用文献数
1

MA過程の共分散が与えられたときに,振幅スペク1・ルは容易に求めることができる。よく知られているように,このとき最小位相スペクトルは,対数振幅スペクトルのHilbert変換として積分方程式の形で与えられる。この積分の値は,今まで直接的に求められてはいない。本論文ではこの積分の値を直接的に求めることによって,q次のMA過程の最小位相スペクトルは,共分散のz変換を双線形z変換して得られるq次の代数方程式の根を得ることによって求めることができることを示す。結果の具体的な応用例として,ここで求められた最小位相スペクトルから,有効数字の桁数を含めて最小位相多項式を求める方法を示す。
著者
迫江 博昭 千葉 成美
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.27, no.9, pp.483-490, 1971-09-10
被引用文献数
33

We consider that the pattern matching method with time-normalizing ability is one of the most effective methods for the spoken word recognition, and that it can well be applied to the recognition of continuously spoken words. Speech can be expressed as a vector-valued time function (1), (2) by appropriate feature extraction. Then, the effect of speaking rate variation can be regarded as non-linear transformation of time axis (3), and can well be compensated by minimizing (4)(Fig. 1). Based on these consideration, we evaluate time-normalized similarity S(A, B) by (5). Calculation of S(A, B) is efficiently carried out using dynamic programming technique (15), (16), (17), (Fig. 3). Utilizing this pattern matching scheme, continuously spoken words can by separated into word units by determining the subpattern A^l which is most similar to the stored reference pattern, or for which S(A^l, B) is minimum (19), . (20), (Fig. 4). Based on this segmentation scheme, three methods to recognize continuously spoken words are proposed. Method-a is direct application of this segmentation scheme. In Metod-b, recognition is carried out by evaluating similarity S(A^l, B_mB_n) between concatenated reference patterns (17) and input pattern, and the amount of computation is considerably reduced using the segmentation scheme and the DP technique(Fig. 5). Method-c is modification of Method-b, where, after recognizing each word, matching window is shifted so that it will be able to cover the timing difference of the next word(Fig. 6). These Methods were extensively examined by computer simulation. Average recognition rate of 99. 8 per cent has been obtained for 2400 utterances of Japanese 1-digit numbers of five speakers, and 99. 6 per cent for total of 500 continuously spoken 2-digit numbers of five male speakers by Method-c(Table 1, 2, 3).
著者
鈴木 弘之 田村 明弘 鹿島 教昭
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.45, no.5, pp.374-384, 1989-05-01
被引用文献数
18

歩行者空間のスライド映像の視覚情報と道路交通騒音のスピーカ再生音の聴覚情報を同時あるいは別々に用いて、二つの心理実験を行っている。これらをもとに、緑の持つ喧騒感緩和効果の存在条件とそのメカニズムを検討し、次の結果を得ている。1)緑による地区の喧騒感の緩和効果が存在する。2)地区の喧騒感は視覚情報による喧騒感と聴覚情報による喧騒感の平均化作用によって形成される。3)平均化作用は注意配分が関係し、聴覚情報への注意配分が大きくなると緑の効果は認めにくくなる。4)視覚情報から得られる喧騒感に対応する騒音レベル、すなわち期待騒音レベルが推定される。5)一方、緑の存在が騒音の侵入による地区の喧騒感の増加を誘発する効果も認められる。
著者
梅田 規子 寺西 立年
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.22, no.4, pp.195-203, 1966-07-30
被引用文献数
19

This paper describes a simple device which simulates a human vocal tract acoustically, and results obtained from systhesized speech sounds produced by the device. It is simple and easy to deal with as compared with an electrical vocal tract simulator. Acoustic models of vocal tracts are made of transparent acryl-resin. They are of box shape. The vocal tract length of a man's model is 17. 5cm, that of woman's model 14cm, about 80% of that of the man's and that of children's models about 11cm and 9cm. The height is 2. 5cm. The cross-sectional areas of these models are made variable by moving 1-cm thick plastic strips which are closely inserted from one side. They have a nasal branch as well. Glottal sounds are sent into one end (glottis) of the models and let out of the other end (mouth). Various vowels and other sustained sounds are produced accrding to the configuration of the models at that time. The driving unit of a horn speaker (NEC-555M, Japan) was used as a sound source. Considering that the acoustic impedance at the human glottis is very high, a bundle of steel wires, each 1. 5mm in diameter and 14mm in length was packed tightly into the throat of the loud speaker. Consequently, the cross-sectional area of the throat is about 1. 3cm^2. By observing sustained seech sounds, we find two features in them. One is phonemic feature, in other words a feature that distinguishes one phoneme from others, and the other is a feature that contributes to naturalness, in other words, a feature that distinguishes not only males, females and children but also individuals from one another. We have successfully made these features clear physically. When the length of a vocal tract is reduced gradually from 17. 5cm, it will be seen that the configuration of phoneme is reduced similarly without spoiling the phonemic feature. As for the cross-sectional areas, relative values are only required. So we can normalize the vocal tract configuration of every phoneme with respect to the vocal tract length and the cross-sectional areas. The use of the normalized configurations will afford us normalized spectra of phonemes. The relation between the vocal tract length and the fundamental frequency of voice, which serves to distinguish speakers from one another in sex and age, can also be nomalized. That is to say, if the ratio of frequency, the wavelength of which is four times as long as a tract to the fundamental frequency of voice, is called a normalized pitch, we can obtain natural synthesized speech sounds when the normalized pitch ranges from 2. 5 to 5. 0. The waveform of glottal sounds referred to herein is saw-tooth form. The decay time T_3(msec) of the saw-tooth-wave form being sufficiently short as compared with one cycle T, the first zero point of glottal spectrum will apper at 1/(T_3)(kc). Glottal sound spectrum has a great influence upon characteristics of each individual's voice. The shorter the decay times, the sharper a voice becomes. Longer decay time (about 0. 6-1. 0 msec) is better for a female voice while shorter one (about 0. 2-0. 5 msec) is better for a child's voice.
著者
平松 幸三 箕浦 一哉 松井 利仁 宮北 隆志 長田 泰公 山本 剛夫
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.56, no.8, pp.556-564, 2000-08-01
参考文献数
24
被引用文献数
1

特殊空港周辺で実施されている家屋防音工事が生活実態上どの程度生活環境の改善に寄与しているのかを検討するため, 嘉手納基地周辺において質問紙調査を行い, 家屋防音工事の実施状況, それに対する満足度と効果の有無並びにうるささ, 生活妨害, 環境質に関する回答を分析した。その結果によると, 騒音曝露地区では, 家屋防音工事への満足度が高く, その効果を評価する回答が多かったが, 高度曝露地区ではそれらの回答率が著しく低かった。多重ロジスティック分析を行って生活妨害の反応に関するオッズ比を家屋防音工事実施群と非実施群とで比較したところ, 両群において反応に差が認められなかった。このことから家屋防音工事が生活環境を改善することにはなっていない, と結論された。
著者
石井 泰 山田 一郎 幹 康 五十嵐 寿一
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.35, no.5, pp.226-234, 1979-05-01
被引用文献数
17

A new technique to measure the ground to ground noise propagation was developed. The test sound of a band limited noise is emitted from a loudspeaker intermittently. A several second burst of the noise and the following pause of the same length are repeated. At a receiving spot, the sound intensity is integrated alternatively by two digital counters. One counter integrates the intensity of the test sound plus the background noise at that spot in the period for which the test sound is present. The other integrates the intensity of the background noise in the absent period of the test sound. Each of the devices at the source and receiving spots has a precise crystal oscillator as the clock. Once the synchronization of the two devices is made before a measurement, the relative phase of the operations of the devices is kept constant during the time of the measurement without any connection. After the completion of a predetermined number of integrations, the difference of the accumulated numbers in the two counters is read, which gives the intensity of the test sound at the receiving spot. Experiments using a 5-Watt loudspeaker showed that the noise attenuations of the distance of 170m can be measured with the statistical error less than 0. 5dB.
著者
子安 勝
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.32, no.10, pp.670-673, 1976-10-01
著者
グリーンバーグ 陽子 加藤 宏明 津崎 実 匂坂 芳典
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.67, no.2, pp.65-74, 2011-02-01
参考文献数
15
被引用文献数
1

対話音声の合成を目指して,対話韻律生成の方法を提案した。対話場面において出現する発話内容自体が,その取り得る対話韻律を限定することに着目し,提案方法では,入力となる語彙が与える印象によって制約される韻律特徴量を用いて,従来の読み上げ韻律を修正する対話韻律生成を行う。これまでに行った一語発話「ん」のパラ言語分析が示した,3次元の知覚的印象空間(確信-疑念,肯定-否定,好印象-悪印象)と韻律制御(基本周波数の平均値と時間変化形状,発話時間長)の関係を用いて,同じ印象空間で典型的な座標を持つ語彙に対して,対応する対話韻律を付与した。得られた合成音声に対する自然性評価実験により,提案した方法の妥当性を確認した。
著者
三浦 雅展 江村 伯夫 秋永 晴子 柳田 益造
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.66, no.5, pp.203-212, 2010-05-01
参考文献数
17

ピアノを用いた1オクターブの上下行長音階演奏に対する自動評価について述べている。音階演奏の客観的な評価基準を求めるために,種々の音階演奏の5名の専門家による適切性の主観評価とその演奏のMIDI記録の関係を求めている。記録されたピアノ演奏に含まれる打鍵タイミング,打鍵強度(ヴェロシティ),及び押鍵時間長について,音階演奏に含まれる逸脱のスプライン補間曲線を求め,得られた曲線の特徴から,当該演奏の特徴を15のパラメータで表している。補間曲線は鍵盤に対する奏者の手指交差に基づいて求められている。得られた主観評価スコアはその適切性をLeave-one-out法によってオープンテストするために用いられている。評価データに対する評価スコアは,KL展開によって次元縮小を行った後にk近傍法によって求められている。音楽の専門家による評価値に基づいて,提案手法が音階演奏の適切性に関する主観スコアを適切に予測していることを確認している。
著者
蘆原 郁 桐生 昭吾
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.62, no.12, pp.871-876, 2006-12-01
参考文献数
20
被引用文献数
3