著者
藤崎 和香 柏野 牧夫
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.57, no.12, pp.759-767, 2001-12-01
被引用文献数
6 5

音高知覚には基底膜振動のピーク位置(場所情報)と聴神経の発火の周期性(時間情報)の両方の情報が関わっている。音楽経験や絶対音感の有無によってこれらの情報の利用に違いが見られるかを場所情報と時間情報を独立に操作した刺激を用いて検討した。主に場所情報により音高知覚が生じ時間情報はあいまいである刺激として狭帯域雑音, 時間情報のみ利用可能な刺激として反復リプル雑音, 両情報が利用可能な刺激として純音を用いた。実験の結果, クロマの同定には時間情報, ハイトの同定には場所情報が主要な役割を果たしていることが示された。また, 絶対音感保持者は時間情報を有効に利用して音名の同定を行っていることが明らかになった。
著者
西野 隆典 梶田 将司 武田 一哉 板倉 文忠
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.55, no.2, pp.91-99, 1999-02-01
被引用文献数
47

ヘッドホン受聴では, 頭部伝達関数(Head Related Transfer Function ; HRTF)を用いることにより, 立体音場を忠実に再生することができる。しかし, HRTFは方向に依存した関数であるため, HRTFを用いた聴覚バーチャルリアリティシステムでは, 測定した音源方向については忠実な立体音場が再生できるが, その他の音源方向については, 再生に必要なHRTFを新たに測定するか, すでに測定されたHRTFから推定して求める必要がある。しかし, HRTFの補間が可能であれば, 少数の測定HRTFから全方位のHRTFが作れるため, データ削減の有効な手段となるだけでなく, 滑らかな移動感を得ることができる。本論文では, (1)線形2点補間, (2)主成分分析を用いた補間の2手法を用いて, 水平面上のHRTFのインパルス応答と周波数振幅応答の補間可能性を, 客観基準と主観基準(移動感並びに方向定位感)により評価した。その結果, (1)水平面上のHRTFは45゜もしくはそれ以下の角度間隔で測定を行い, 未知のHRTFはそれらから補間可能であること, (2)線形2点補間は主成分分析による補間手法と比べて, より良い補間が可能なこと, (3)補間対象のインパルス応答と周波数振幅応答の間では, 補間精度の有意な差はなく, 位相は最小位相であっても良いことが明らかになった。
著者
降旗 建治 柳沢 武三郎
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.45, no.8, pp.577-582, 1989-08-01
被引用文献数
67

数多くの研究者が与えた独自のうるささ尺度とは異なる心理尺度を採用して、我々は各種騒音源の心理的影響の程度を評価している。その心理尺度は、長野地区における住民の大多数が日常用いている代表的な評価語から構成されている。本論文では、機械工場騒音、製材所騒音、列車騒音、鉄工所騒音、建設騒音などの場合について実験的検討を行っている。その結果、これらの騒音に対して、1)使用頻度の高い評価語は"うるさい"と"気にならない"であること、2)それらの程度表現語は7段階のグループに分けられること、3)選定した評価語によるうるささ尺度は等間隔性を有すること、4)うるささ尺度とL_&ltAeq,T&gtの対応性はかなりよいことなどが明らかになり、我々が採用した心理尺度は前回の自動車騒音の場合も含めて各種音源の「うるささ」を共通に評価できることを見出している。
著者
二階堂 誠也
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.28, no.9, pp.485-495, 1972-09-01
被引用文献数
20

The conventional measuring method of nonlinear distortion using one or two tones of a fixed level does not always provide an objective value of distortion which agrees with the subjective sound quality of speech or music signal passing through the apparatus or the system to be measured. To find a better agreement, the distortion produced in the actual performance of the system should be obtained, and the distortion components appearing in various frequency bands should be extracted separately. A measuring method that meets these requirements is proposed in this paper. Fig. 1 shows the principle. As a test signal, a wide-band signal whose spectrum is similar to that of speech or music is used. The test signal is applied to the system to be measured after removing the narrow band components with band-elimination filter. Distortion components that appear in the eliminated band are extracted with an appropriate band-pass filter having the same frequency as that of the band-elimination filter. In this way the distortion component appearing in a specified frequency band is extracted, and the whole spectrum of distortion is also obtained by using pairs of filters of various central frequencies. Perceptibility of nonlinear distortion for three kinds of typical program sound was obtained as a function of frequency of distortion components using a distortion circuit having an input-output characteristics as shown in Fig. 6. The results are shown in Fig. 11, from which it is clearly seen that the distortion appearing in the high frequency band is much noticeable. Results of this measurement and a few additional experiments were discussed from the viewpoint of masking, and it was shown that the perceptibility of distortion components in a specified frequency band is mainly determined by the signal level in the same and the neibouring frequency bands, and that the just perceptible level of distortion is almost constant when the level is given relative to the signal level of the same frequency band as far as a fixed program signal is concerned.
著者
安齊 祐美 荒木 章子 牧野 昭二 中谷 智広 山田 武志 中村 篤 北脇 信彦
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.68, no.2, pp.74-85, 2012-02-01
被引用文献数
1

本論文では,音源信号のスパース性に基づき,時間周波数バイナリマスク(BM)を用いる音源分離手法におけるミュージカルノイズの低減を目的とした,分離音声のケプストラムスムージング(CSS)を提案する。CSSは,近年提案されたスペクトルマスクのケプストラムスムージング(CSM)で用いられるケプストラム領域でスムージングする考え方と,ケプストラム表現による音声特性の保持の制御という観点では,マスクではなくBMによって得られた分離音声を直接スムージングする方が好ましいという仮説とに基づいている。また,従来法(CSM)や提案法(CSS)と他のミュージカルノイズ低減手法の性能を実験により比較する。CSSでは,CSMと同程度のミュージカルノイズ低減性能を有し,更に目的音声の歪の小さい分離信号が得られた。
著者
濱村 真理子 青野 まなみ 岩宮 眞一郎
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.71, no.2, pp.65-72, 2015-02-01

BGM,サイン音とアナウンス,自然環境音の丁度よいと感じられる音量(最適聴取レベル)を調整法により測定し,その男女差の有無を検討した。BGM,サイン音,アナウンスの最適聴取レベルに男女差が認められ,女性よりも男性の方が最適聴取レベルを高く設定していた。自然環境音の場合には最適聴取レベルに男女差は認められなかった。同一音圧レベルを女性よりも男性の方がより小さいと感じるため,男性が要求する音の大きさを満たすためには女性よりも聴取レベルを高く設定する必要が生じたと考えられる。しかし,自然環境音の最適聴取レベルは実際に聴いて記憶された音量に合わせて設定されたために,男女差が生じなかったのであろう。
著者
沢島 政行
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.27, no.9, pp.425-434, 1971-09-10
被引用文献数
2

For viewing the articulatory movements of speech organs inside the body, we have developed a new technique by use the specially designed fiberscope. There are three types of fiberscopes, the standard model, the thinner model, and the wide-angle model. The former two models were designed for observing the larynx, and the third mainly for observing the pharynx and the velum. All of them are inserted through the nasal passage in order to secure free movements of the articulatory organs during observation. Fiberscopes are basically composed of the image guide, the light guide, the objective lens, and the eye piece(Fig. 1). The image guide is a bundle of aligned("coherent")glass fibers and it transmits the image from one end coupled to the objective lens, to the other end coupled to the eye piece, while the light guide conducts the light for illumination from a light source to the object. The two bundles form a flexible cable of the scope. The diameter of each glass fiber is 9 microns for the image guide and 22 microns for the light guide. In a control unit there is an angle lever to which thin wire is attached and runs to the tip of the flexible cable for the remote bending control of the tip portion. A cine-camera can be attached to the eye piece by means of an adapter. The standard mode, animproved version of the model we first reported in 1968, has an outside diameter of 5. 5 mm at the tip. The objective lens gives an image field angle of 44 degrees, and the object to lens distance ranges from 15 to 50 mm. A light source of 300 W xenon lamp gives sufficient illuminations for the glottis for motion pictures at a rate of, for example, 64 frames per sec. , giving an image size of 6×6 mm^2 on the film. Photographic emulsion of ASA 500 is used. The thinner model which was more recently designed has an outside diameter of 4. 4 mm at the tip. The image size on the film is approximately 4×4 mm^2 when the same adapter as in the standard model is used. In respect to the image resolution, it is somewhat inferior to the standard model. The wide-angle model has an outside diameter comparable with the standard one, the objective lens giving a field angle of 65 degrees and a lens to object distance range of 7 mm to infinity. The image size on the film is designed to be the same as the thinner model. Before the insertion of the scope, a surface anesthesia is applied to the nasal cavity and the epipharynx. Positioning of the scope(Fig. 2 and 8) is quite easy and does not cause any discomfort or disturbance to the subject in performing natural utterances. By visual inspection and some quantitative measurement of the photographic images of the larynx, frame by frame, we can analyze the opening and closing gestures of the glottis as well as the presence or absence of the vocal fold vibration during consonant articulations(Fig. 4). When the vocal pitch is controlled, an apparent change in the distance between the arytenoid and the epiglottis, and the up and down movements of the larynx are usually observable(Fig. 5). A combination of the transillumination technique(photoelectric glottography) with the fiberscopic observation(Fig. 6) provides useful data for detailed analysis of the rapid changes in the glottal conditions(Fig. 7). Some phonetic data of the laryngeal adjustments in speech have been reported elsewhere. Use of the wide-angle model for viewing the pharynx and the velum is now in the stage of preliminary experiment. Results are quite promising. A brief review is also presented on other techniques being employed for observing articulatory movements of the speech organs. The techniques mentioned are:ordinary cineradiography, the new technique of computer controlled tracking of moving objects with use of an x-ray microbeam, the photoelectric(transillumination) method, the ultrasonic measurement, the electrical glottography, and the dynamic palatography.
著者
木戸 博 粕谷 英樹
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.57, no.5, pp.337-344, 2001-05-01
被引用文献数
13

通常発話の声質を表す日常表現語について研究を進めている。自然音声の聴取実験を通して, 同じ音声を複数の他者が評価した値から, 声質表現語の抽出を行った。了解性の高い25語の声質表現語を評価項目として, 性別や年齢を考慮した被験者90名を対象に, 吟味した男声18例を評価させる聴取実験を行った。実験結果を統計分析した上で,反意語を調べたところ, 声質表現語は男女被験者とも同じ6対の表現語対と反意語を持たない一つの表現語に凝縮できた。また, 聴取印象の因子として, 音色因子に対応する3因子を抽出した。以上の結果は, 自己評価法で得られた155名の自己評価値に基づく結果と同質であり, 得られた表現語対は, 声質表現語として一般性を持つものと判断できる。
著者
長谷 芳樹 橘 亮輔 阪口 剛史 細井 裕司
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.64, no.11, pp.647-649, 2008-11-01
被引用文献数
2

近年,日本語単語及び単音節の聴取実験に「親密度別単語了解度試験用音声データセット(FW03)」(NII音声資源コンソーシアム,2006)が広く用いられている。しかし,FW03の音声レベルは等価騒音レベルが等しくなるよう校正されているため,特に単音節音声の聴感レベルが試験語ごとに大きく異なるという問題があった。そこで我々は,単音節音声について聴取実験によるラウドネス校正を行い,その校正値を公開することとした。実験の結果,必要な補正量は最大で12dBを超えていた。FW03の単音節音声を用いる際には,この校正値を適用することが望ましい。
著者
宮崎 謙一 石井 玲子 大串 健吾
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.50, no.10, pp.780-788, 1994-10-01
被引用文献数
2 1

単独に提示された音の音楽的音高名を音高コンテクストとは無関係に絶対的に同定することができる絶対音感の能力は、従来から音楽に深い関わりを持つ能力とされてきた。しかし音楽が本質的に相対的音高関係の上に成り立つものであることを考えると、この絶対音感の能力が音楽にとってどのような意義を持つものであるかが問題となる。そこで、絶対音感を持つ音楽専攻の大学生が、相対的音高関係をどのように認知するかを調べる目的で実験を行った。絶対音感テストの結果から、被験者を3グループに分けた。実験課題は、音譜で視覚的に提示されたハ長調の7音メロディと、ハ長調、1/4音低いホ長調及び嬰ヘ長調の3通りのいずれかの調で聴覚的に提示された7音メロディとが旋律的に同じか違うかを判断することである。実験の結果、どのグループもハ長調でメロディが提示された場合に比べて他の調で提示された場合に正答率が低下し、反応時間も長くなるという結果が得られた。また、正確な絶対音感を持つグループでは、絶対音感と巧妙なストラテジを組み合わせて判断したものが多くみられた。これらの結果から、音楽的音高処理において絶対音感が持つ問題点について考察した。
著者
厨川 守 八尋 博司 柏木 成豪
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.34, no.9, pp.493-500, 1978-09-01
被引用文献数
17 8

As a result of determining a macroscopic structure of tone quality by sensory evaluations and multidimensional scaling method, it seemed that the psychological space applicable to tonal descriptive terms is composed of three main attributes, namely LOUDNESS(loud-sorf), PITCH(high pitched-low pitched) and PLEASANTNESS(pleasant-unpleasant) mutually almost orthogonal. Moreover, four sub-attributes intersecting obliquely to the three main-attributes were found. These sub-attributes included CONSONANCE (clear-turbid), BRIGHTNESS(bright-somber), RICHNESS (rich-thin) and SMOOTHNESS (smooth-rough). As a matter of fact, these four sub-attributes depend on the three main-attributes(Fig. 10). For example, the "clear" quality of consonance is "soft", "high pitched" and "pleasant" sound, while the "turbid" quality is "loud", "low pitched" and "unpleasant" sound, and this result thoroughly corresponds to the CONSONANCE THEORY. The tonal sources used for the present hearing experiments consist of four groups. They are (1) 57 synthetic tones the physical values of which are distinctly grasped, (2) 97 musical instrument solo tones, (3) 44 tones by varying a part of the sound of "Scheherazade", which is the orchestral music with dominant string sections, and (4) 33 tones by varying a part of "Pictures at an exhibition", which is the orchestral music with dominant percussion and brass sections. As for the variation of above mentioned two orchestral sources, the quantitative variations such as spectrum form, intensity, phase modulation and echo were given, 41-53 hearing panels evaluated these tones by the choise of 38 tonal descriptive terms(Table 1) in the auditorium. For analysis, the program by Kruskal was used. (Fig. 4). As the result of this analysis, configurations in Fig. 6〜9 were obtained in three dimensions for each two source groups(Table 3). As for the distribution of the terms for these four source groups, the words of praise and displeasure distributed in two semispherical shell space divided by LOUDNESS-PITCH plane. At the center of the two hemispheric configurations, "pleasant" and "unpleasant" distributed, which represent important factors. This axis was stable even if the sources are different, therefore, PLEASANTNESS is regarded as the third main attribute following LOUDNESS and PITCH(Table 4). Next, the stable terms distributing in the diagonal quadrants among eight quadrants in Fig. 6〜9 are closely examined in common in four source groups, then the terms of four sub-attributes described above were extracted. When the above experimental data were reanalyzed with 14 terms concerning three main attributes and four sub-attributes, the stress in three dimensions decreased further, and approximately similar configuration was obtained. Based on these facts, it is suggested that the fourteen tonal descriptive terms concerning three main-attributes and four sub-attributes are sufficient for deriving the macroscopic structure of tonal sources.
著者
千葉 修 柏 達也 霜田 英麿 鏡 愼 深井 一郎
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.49, no.8, pp.551-562, 1993-08-01
被引用文献数
23 4

3次元時間領域における音場解析は定常解だけでなく過渡解やパルス応答が容易に得られ、フィールド分布など系の特性把握に有効である。本論文では、この3次元時間領域音場解析の一つとして従来の差分法とは異なるリープフロッグアルゴリズムに基づく時間依存差分法による音場解析を試みた。ここでは、音場解析のための本手法の定式化を3次元空間について行った。次に、表面インピーダンスを持つ境界条件の定式化を行いその妥当性を確認した。また剛体角柱による散乱定常解析から本定式化の妥当性を確認した。更に、表面インピーダンスが仮定された角柱と剛体角柱による散乱過渡解析を行い、本手法の散乱解析への有効性を示した。