著者
木戸 博 粕谷 英樹
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.57, no.5, pp.337-344, 2001-05-01
被引用文献数
13

通常発話の声質を表す日常表現語について研究を進めている。自然音声の聴取実験を通して, 同じ音声を複数の他者が評価した値から, 声質表現語の抽出を行った。了解性の高い25語の声質表現語を評価項目として, 性別や年齢を考慮した被験者90名を対象に, 吟味した男声18例を評価させる聴取実験を行った。実験結果を統計分析した上で,反意語を調べたところ, 声質表現語は男女被験者とも同じ6対の表現語対と反意語を持たない一つの表現語に凝縮できた。また, 聴取印象の因子として, 音色因子に対応する3因子を抽出した。以上の結果は, 自己評価法で得られた155名の自己評価値に基づく結果と同質であり, 得られた表現語対は, 声質表現語として一般性を持つものと判断できる。
著者
長谷 芳樹 橘 亮輔 阪口 剛史 細井 裕司
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.64, no.11, pp.647-649, 2008-11-01
被引用文献数
2

近年,日本語単語及び単音節の聴取実験に「親密度別単語了解度試験用音声データセット(FW03)」(NII音声資源コンソーシアム,2006)が広く用いられている。しかし,FW03の音声レベルは等価騒音レベルが等しくなるよう校正されているため,特に単音節音声の聴感レベルが試験語ごとに大きく異なるという問題があった。そこで我々は,単音節音声について聴取実験によるラウドネス校正を行い,その校正値を公開することとした。実験の結果,必要な補正量は最大で12dBを超えていた。FW03の単音節音声を用いる際には,この校正値を適用することが望ましい。
著者
宮崎 謙一 石井 玲子 大串 健吾
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.50, no.10, pp.780-788, 1994-10-01
被引用文献数
2 1

単独に提示された音の音楽的音高名を音高コンテクストとは無関係に絶対的に同定することができる絶対音感の能力は、従来から音楽に深い関わりを持つ能力とされてきた。しかし音楽が本質的に相対的音高関係の上に成り立つものであることを考えると、この絶対音感の能力が音楽にとってどのような意義を持つものであるかが問題となる。そこで、絶対音感を持つ音楽専攻の大学生が、相対的音高関係をどのように認知するかを調べる目的で実験を行った。絶対音感テストの結果から、被験者を3グループに分けた。実験課題は、音譜で視覚的に提示されたハ長調の7音メロディと、ハ長調、1/4音低いホ長調及び嬰ヘ長調の3通りのいずれかの調で聴覚的に提示された7音メロディとが旋律的に同じか違うかを判断することである。実験の結果、どのグループもハ長調でメロディが提示された場合に比べて他の調で提示された場合に正答率が低下し、反応時間も長くなるという結果が得られた。また、正確な絶対音感を持つグループでは、絶対音感と巧妙なストラテジを組み合わせて判断したものが多くみられた。これらの結果から、音楽的音高処理において絶対音感が持つ問題点について考察した。
著者
厨川 守 八尋 博司 柏木 成豪
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.34, no.9, pp.493-500, 1978-09-01
被引用文献数
17 8

As a result of determining a macroscopic structure of tone quality by sensory evaluations and multidimensional scaling method, it seemed that the psychological space applicable to tonal descriptive terms is composed of three main attributes, namely LOUDNESS(loud-sorf), PITCH(high pitched-low pitched) and PLEASANTNESS(pleasant-unpleasant) mutually almost orthogonal. Moreover, four sub-attributes intersecting obliquely to the three main-attributes were found. These sub-attributes included CONSONANCE (clear-turbid), BRIGHTNESS(bright-somber), RICHNESS (rich-thin) and SMOOTHNESS (smooth-rough). As a matter of fact, these four sub-attributes depend on the three main-attributes(Fig. 10). For example, the "clear" quality of consonance is "soft", "high pitched" and "pleasant" sound, while the "turbid" quality is "loud", "low pitched" and "unpleasant" sound, and this result thoroughly corresponds to the CONSONANCE THEORY. The tonal sources used for the present hearing experiments consist of four groups. They are (1) 57 synthetic tones the physical values of which are distinctly grasped, (2) 97 musical instrument solo tones, (3) 44 tones by varying a part of the sound of "Scheherazade", which is the orchestral music with dominant string sections, and (4) 33 tones by varying a part of "Pictures at an exhibition", which is the orchestral music with dominant percussion and brass sections. As for the variation of above mentioned two orchestral sources, the quantitative variations such as spectrum form, intensity, phase modulation and echo were given, 41-53 hearing panels evaluated these tones by the choise of 38 tonal descriptive terms(Table 1) in the auditorium. For analysis, the program by Kruskal was used. (Fig. 4). As the result of this analysis, configurations in Fig. 6〜9 were obtained in three dimensions for each two source groups(Table 3). As for the distribution of the terms for these four source groups, the words of praise and displeasure distributed in two semispherical shell space divided by LOUDNESS-PITCH plane. At the center of the two hemispheric configurations, "pleasant" and "unpleasant" distributed, which represent important factors. This axis was stable even if the sources are different, therefore, PLEASANTNESS is regarded as the third main attribute following LOUDNESS and PITCH(Table 4). Next, the stable terms distributing in the diagonal quadrants among eight quadrants in Fig. 6〜9 are closely examined in common in four source groups, then the terms of four sub-attributes described above were extracted. When the above experimental data were reanalyzed with 14 terms concerning three main attributes and four sub-attributes, the stress in three dimensions decreased further, and approximately similar configuration was obtained. Based on these facts, it is suggested that the fourteen tonal descriptive terms concerning three main-attributes and four sub-attributes are sufficient for deriving the macroscopic structure of tonal sources.
著者
千葉 修 柏 達也 霜田 英麿 鏡 愼 深井 一郎
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.49, no.8, pp.551-562, 1993-08-01
被引用文献数
23 4

3次元時間領域における音場解析は定常解だけでなく過渡解やパルス応答が容易に得られ、フィールド分布など系の特性把握に有効である。本論文では、この3次元時間領域音場解析の一つとして従来の差分法とは異なるリープフロッグアルゴリズムに基づく時間依存差分法による音場解析を試みた。ここでは、音場解析のための本手法の定式化を3次元空間について行った。次に、表面インピーダンスを持つ境界条件の定式化を行いその妥当性を確認した。また剛体角柱による散乱定常解析から本定式化の妥当性を確認した。更に、表面インピーダンスが仮定された角柱と剛体角柱による散乱過渡解析を行い、本手法の散乱解析への有効性を示した。
著者
佐々木 實 石川 智子 山田 真司
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.45, no.10, pp.743-747, 1989-10-01
被引用文献数
11 2

人間の手によるピアノの直接演奏において、楽譜上の等しい時価を演奏したときの時間間隔に見られるゆらぎについて分析を試みた。各音符の長さをできる限り正確に弾いたメトロノーム的な演奏(Aタイプと名づける)と、芸術的な演奏(Bタイプと名づける)とについて、各音符の時価に対応する時間間隔を測定し、その時系列からゆらぎのパワースペクトルを求めた。その結果次の結論を得た。1)Aタイプの演奏は全体のゆらぎのパワーが小さく、かつ、スペクトルエンベロープの傾きは、平坦又は右上がりである。2)Bタイプの演奏は全体のゆらぎのパワーが大きく、かつ、長い周期によるゆらぎが強調されており、スペクトルエンベロープの傾きは右下がりである。3)A、B両タイプのスペクトルエンベロープの傾きの係数の境界はおおまかに-2付近に設定できる。
著者
岩宮 眞一郎
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.48, no.9, pp.649-657, 1992-09-01
被引用文献数
29

市販のレーザ・ディスク作品、及び、別の作品の音と映像を組み合わせた素材を用いて、AVメディアを通しての情報伝達における、視覚と聴覚の相互作用に及ぼす、音と映像の調和度の影響を検討した。音と映像の重畳が、音と映像の印象を良くする、協合的な相互作用においては、音と映像の調和度が高いほど、その効果が大きい。視覚と聴覚に共通する性質(通様相性)が同方向に変化する、共鳴現象に関しては、通様相性の処理レベルに依存し、明るさのように、低次の処理による性質では、調和度とは関わりなく、共鳴現象が生ずるが、引き締まり感、きれいさのような、高次の処理を必要とする性質では、調和度が高くないと、共鳴現象が生じない。
著者
中根 偕夫 平田 尚史 瀬谷 浩一郎
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.46, no.11, pp.893-898, 1990-11-01
被引用文献数
15

ここでは定在波音場中での高気圧グロー放電の諸特性の変化をみた。すなわち、(1)高気圧グロー放電の発生する電圧の範囲、(2)高気圧グロー放電の発光部の形状、(3)電流波形への音の影響、(4)V-I特性、(5)放電の発生と消滅する電圧の履歴的な現象に関して検討した。実験方法として、針(+)対平板(-)電極を定在波音場中の粒子速度分布の腹に位置させ、音の強さと電源の電圧を変化して実験した。その結果、音を大にすることによって(1)高気圧グロー放電はスパークへと変化し、(2)放電の発光部が扇子を開いたような形状へと広がり、(3)電流波形にパルスの発生が見られ、(4)電極間電圧の上昇、(5)発生と消滅する電圧の履歴現象などに音の影響があることが分かった。
著者
福留 公利
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.44, no.4, pp.272-281, 1988-04-01
被引用文献数
21

複数個のマイクロホンを一つの剛球に埋め込む「球バッフル埋込みマイクロホン」とその回折情報を用いて、複数個の未知の音源の入射方向角及びスペクトルの両方を推定する方法を述べる。音源方向角を仮定しながら、本マイクロホンの回折情報を用いて計算したスペクトルと実際のスペクトルとの差から周波数ごとに定義されるノルムの自乗を最小にするようにして、音源推定を行う。更に、推定した方向からの音信号を抽出するマイクロホンシステムについても述べる。計算機シミュレーションにより、本方法の有効性を確かめている。
著者
岡田 清
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.55, no.11, pp.742-751, 1999-11-01
被引用文献数
1

MA過程の共分散が与えられたときに,振幅スペク1・ルは容易に求めることができる。よく知られているように,このとき最小位相スペクトルは,対数振幅スペクトルのHilbert変換として積分方程式の形で与えられる。この積分の値は,今まで直接的に求められてはいない。本論文ではこの積分の値を直接的に求めることによって,q次のMA過程の最小位相スペクトルは,共分散のz変換を双線形z変換して得られるq次の代数方程式の根を得ることによって求めることができることを示す。結果の具体的な応用例として,ここで求められた最小位相スペクトルから,有効数字の桁数を含めて最小位相多項式を求める方法を示す。
著者
迫江 博昭 千葉 成美
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.27, no.9, pp.483-490, 1971-09-10
被引用文献数
33

We consider that the pattern matching method with time-normalizing ability is one of the most effective methods for the spoken word recognition, and that it can well be applied to the recognition of continuously spoken words. Speech can be expressed as a vector-valued time function (1), (2) by appropriate feature extraction. Then, the effect of speaking rate variation can be regarded as non-linear transformation of time axis (3), and can well be compensated by minimizing (4)(Fig. 1). Based on these consideration, we evaluate time-normalized similarity S(A, B) by (5). Calculation of S(A, B) is efficiently carried out using dynamic programming technique (15), (16), (17), (Fig. 3). Utilizing this pattern matching scheme, continuously spoken words can by separated into word units by determining the subpattern A^l which is most similar to the stored reference pattern, or for which S(A^l, B) is minimum (19), . (20), (Fig. 4). Based on this segmentation scheme, three methods to recognize continuously spoken words are proposed. Method-a is direct application of this segmentation scheme. In Metod-b, recognition is carried out by evaluating similarity S(A^l, B_mB_n) between concatenated reference patterns (17) and input pattern, and the amount of computation is considerably reduced using the segmentation scheme and the DP technique(Fig. 5). Method-c is modification of Method-b, where, after recognizing each word, matching window is shifted so that it will be able to cover the timing difference of the next word(Fig. 6). These Methods were extensively examined by computer simulation. Average recognition rate of 99. 8 per cent has been obtained for 2400 utterances of Japanese 1-digit numbers of five speakers, and 99. 6 per cent for total of 500 continuously spoken 2-digit numbers of five male speakers by Method-c(Table 1, 2, 3).
著者
鈴木 弘之 田村 明弘 鹿島 教昭
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.45, no.5, pp.374-384, 1989-05-01
被引用文献数
18

歩行者空間のスライド映像の視覚情報と道路交通騒音のスピーカ再生音の聴覚情報を同時あるいは別々に用いて、二つの心理実験を行っている。これらをもとに、緑の持つ喧騒感緩和効果の存在条件とそのメカニズムを検討し、次の結果を得ている。1)緑による地区の喧騒感の緩和効果が存在する。2)地区の喧騒感は視覚情報による喧騒感と聴覚情報による喧騒感の平均化作用によって形成される。3)平均化作用は注意配分が関係し、聴覚情報への注意配分が大きくなると緑の効果は認めにくくなる。4)視覚情報から得られる喧騒感に対応する騒音レベル、すなわち期待騒音レベルが推定される。5)一方、緑の存在が騒音の侵入による地区の喧騒感の増加を誘発する効果も認められる。
著者
梅田 規子 寺西 立年
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.22, no.4, pp.195-203, 1966-07-30
被引用文献数
19

This paper describes a simple device which simulates a human vocal tract acoustically, and results obtained from systhesized speech sounds produced by the device. It is simple and easy to deal with as compared with an electrical vocal tract simulator. Acoustic models of vocal tracts are made of transparent acryl-resin. They are of box shape. The vocal tract length of a man's model is 17. 5cm, that of woman's model 14cm, about 80% of that of the man's and that of children's models about 11cm and 9cm. The height is 2. 5cm. The cross-sectional areas of these models are made variable by moving 1-cm thick plastic strips which are closely inserted from one side. They have a nasal branch as well. Glottal sounds are sent into one end (glottis) of the models and let out of the other end (mouth). Various vowels and other sustained sounds are produced accrding to the configuration of the models at that time. The driving unit of a horn speaker (NEC-555M, Japan) was used as a sound source. Considering that the acoustic impedance at the human glottis is very high, a bundle of steel wires, each 1. 5mm in diameter and 14mm in length was packed tightly into the throat of the loud speaker. Consequently, the cross-sectional area of the throat is about 1. 3cm^2. By observing sustained seech sounds, we find two features in them. One is phonemic feature, in other words a feature that distinguishes one phoneme from others, and the other is a feature that contributes to naturalness, in other words, a feature that distinguishes not only males, females and children but also individuals from one another. We have successfully made these features clear physically. When the length of a vocal tract is reduced gradually from 17. 5cm, it will be seen that the configuration of phoneme is reduced similarly without spoiling the phonemic feature. As for the cross-sectional areas, relative values are only required. So we can normalize the vocal tract configuration of every phoneme with respect to the vocal tract length and the cross-sectional areas. The use of the normalized configurations will afford us normalized spectra of phonemes. The relation between the vocal tract length and the fundamental frequency of voice, which serves to distinguish speakers from one another in sex and age, can also be nomalized. That is to say, if the ratio of frequency, the wavelength of which is four times as long as a tract to the fundamental frequency of voice, is called a normalized pitch, we can obtain natural synthesized speech sounds when the normalized pitch ranges from 2. 5 to 5. 0. The waveform of glottal sounds referred to herein is saw-tooth form. The decay time T_3(msec) of the saw-tooth-wave form being sufficiently short as compared with one cycle T, the first zero point of glottal spectrum will apper at 1/(T_3)(kc). Glottal sound spectrum has a great influence upon characteristics of each individual's voice. The shorter the decay times, the sharper a voice becomes. Longer decay time (about 0. 6-1. 0 msec) is better for a female voice while shorter one (about 0. 2-0. 5 msec) is better for a child's voice.
著者
平松 幸三 箕浦 一哉 松井 利仁 宮北 隆志 長田 泰公 山本 剛夫
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.56, no.8, pp.556-564, 2000-08-01
参考文献数
24
被引用文献数
1

特殊空港周辺で実施されている家屋防音工事が生活実態上どの程度生活環境の改善に寄与しているのかを検討するため, 嘉手納基地周辺において質問紙調査を行い, 家屋防音工事の実施状況, それに対する満足度と効果の有無並びにうるささ, 生活妨害, 環境質に関する回答を分析した。その結果によると, 騒音曝露地区では, 家屋防音工事への満足度が高く, その効果を評価する回答が多かったが, 高度曝露地区ではそれらの回答率が著しく低かった。多重ロジスティック分析を行って生活妨害の反応に関するオッズ比を家屋防音工事実施群と非実施群とで比較したところ, 両群において反応に差が認められなかった。このことから家屋防音工事が生活環境を改善することにはなっていない, と結論された。
著者
石井 泰 山田 一郎 幹 康 五十嵐 寿一
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.35, no.5, pp.226-234, 1979-05-01
被引用文献数
17

A new technique to measure the ground to ground noise propagation was developed. The test sound of a band limited noise is emitted from a loudspeaker intermittently. A several second burst of the noise and the following pause of the same length are repeated. At a receiving spot, the sound intensity is integrated alternatively by two digital counters. One counter integrates the intensity of the test sound plus the background noise at that spot in the period for which the test sound is present. The other integrates the intensity of the background noise in the absent period of the test sound. Each of the devices at the source and receiving spots has a precise crystal oscillator as the clock. Once the synchronization of the two devices is made before a measurement, the relative phase of the operations of the devices is kept constant during the time of the measurement without any connection. After the completion of a predetermined number of integrations, the difference of the accumulated numbers in the two counters is read, which gives the intensity of the test sound at the receiving spot. Experiments using a 5-Watt loudspeaker showed that the noise attenuations of the distance of 170m can be measured with the statistical error less than 0. 5dB.
著者
子安 勝
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.32, no.10, pp.670-673, 1976-10-01