著者
南 泰浩
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.67, no.10, pp.482-487, 2011-10-01
被引用文献数
2
著者
徳田 恵一
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.67, no.1, pp.17-22, 2010-12-25

本解説では,統計的パラメトリック音声合成の基礎技術について簡単にまとめると共に,最近の動向について概観する。特に,統計モデルとして,隠れマルコフモデル(hidden Markov model;HMM)を用いた方式は,効率的な学習アルゴリズムが利用できることから,広く利用されており,本解説でもHMMを用いる方式を中心に述べる。また,ここ10年ほどの間,主流な手法として利用されてきた単位選択型音声合成との関係について対比しながら,近い将来に期待される技術開発の方向性についても述べる。
著者
金子 格 竹内 大貴 大山 貴紀
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.72, no.2, pp.61-67, 2016-02-01

音楽を題材とし,数学や物理との関係を示すことで,受講者の理数系科目への関心を高めようとする授業は数多くみられる.しかし我々は,音楽を題材にしても受講者が受動的に説明を聞くだけでは,受講者に理数系科目への強い関心を持たせるのは難しいと考えた.そして,受講者が自ら数式により音楽を合成しながら音楽と数学の関係を確認し,また数式を用いた音楽合成による作品を制作する演習授業の実施を試みた.演習授業にはScilabを用いた.受講者にとって演習授業が困難すぎることはなく,4時間〜9時間の授業の中で説明〜制作を終え各自の作品の発表を行うことができた.高校生の受講者で数学への関心に有意な上昇が確認できた.本論文では,我々が行った演習授業の詳細と評価アンケートの分析結果を報告する.受講者の演習授業の内容と受講者が作成した作品はwebページで公開している.
著者
藤崎 和香 柏野 牧夫
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.57, no.12, pp.759-767, 2001-12-01
被引用文献数
6 5

音高知覚には基底膜振動のピーク位置(場所情報)と聴神経の発火の周期性(時間情報)の両方の情報が関わっている。音楽経験や絶対音感の有無によってこれらの情報の利用に違いが見られるかを場所情報と時間情報を独立に操作した刺激を用いて検討した。主に場所情報により音高知覚が生じ時間情報はあいまいである刺激として狭帯域雑音, 時間情報のみ利用可能な刺激として反復リプル雑音, 両情報が利用可能な刺激として純音を用いた。実験の結果, クロマの同定には時間情報, ハイトの同定には場所情報が主要な役割を果たしていることが示された。また, 絶対音感保持者は時間情報を有効に利用して音名の同定を行っていることが明らかになった。
著者
西野 隆典 梶田 将司 武田 一哉 板倉 文忠
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.55, no.2, pp.91-99, 1999-02-01
被引用文献数
47

ヘッドホン受聴では, 頭部伝達関数(Head Related Transfer Function ; HRTF)を用いることにより, 立体音場を忠実に再生することができる。しかし, HRTFは方向に依存した関数であるため, HRTFを用いた聴覚バーチャルリアリティシステムでは, 測定した音源方向については忠実な立体音場が再生できるが, その他の音源方向については, 再生に必要なHRTFを新たに測定するか, すでに測定されたHRTFから推定して求める必要がある。しかし, HRTFの補間が可能であれば, 少数の測定HRTFから全方位のHRTFが作れるため, データ削減の有効な手段となるだけでなく, 滑らかな移動感を得ることができる。本論文では, (1)線形2点補間, (2)主成分分析を用いた補間の2手法を用いて, 水平面上のHRTFのインパルス応答と周波数振幅応答の補間可能性を, 客観基準と主観基準(移動感並びに方向定位感)により評価した。その結果, (1)水平面上のHRTFは45゜もしくはそれ以下の角度間隔で測定を行い, 未知のHRTFはそれらから補間可能であること, (2)線形2点補間は主成分分析による補間手法と比べて, より良い補間が可能なこと, (3)補間対象のインパルス応答と周波数振幅応答の間では, 補間精度の有意な差はなく, 位相は最小位相であっても良いことが明らかになった。
著者
降旗 建治 柳沢 武三郎
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.45, no.8, pp.577-582, 1989-08-01
被引用文献数
67

数多くの研究者が与えた独自のうるささ尺度とは異なる心理尺度を採用して、我々は各種騒音源の心理的影響の程度を評価している。その心理尺度は、長野地区における住民の大多数が日常用いている代表的な評価語から構成されている。本論文では、機械工場騒音、製材所騒音、列車騒音、鉄工所騒音、建設騒音などの場合について実験的検討を行っている。その結果、これらの騒音に対して、1)使用頻度の高い評価語は"うるさい"と"気にならない"であること、2)それらの程度表現語は7段階のグループに分けられること、3)選定した評価語によるうるささ尺度は等間隔性を有すること、4)うるささ尺度とL_&ltAeq,T&gtの対応性はかなりよいことなどが明らかになり、我々が採用した心理尺度は前回の自動車騒音の場合も含めて各種音源の「うるささ」を共通に評価できることを見出している。
著者
二階堂 誠也
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.28, no.9, pp.485-495, 1972-09-01
被引用文献数
20

The conventional measuring method of nonlinear distortion using one or two tones of a fixed level does not always provide an objective value of distortion which agrees with the subjective sound quality of speech or music signal passing through the apparatus or the system to be measured. To find a better agreement, the distortion produced in the actual performance of the system should be obtained, and the distortion components appearing in various frequency bands should be extracted separately. A measuring method that meets these requirements is proposed in this paper. Fig. 1 shows the principle. As a test signal, a wide-band signal whose spectrum is similar to that of speech or music is used. The test signal is applied to the system to be measured after removing the narrow band components with band-elimination filter. Distortion components that appear in the eliminated band are extracted with an appropriate band-pass filter having the same frequency as that of the band-elimination filter. In this way the distortion component appearing in a specified frequency band is extracted, and the whole spectrum of distortion is also obtained by using pairs of filters of various central frequencies. Perceptibility of nonlinear distortion for three kinds of typical program sound was obtained as a function of frequency of distortion components using a distortion circuit having an input-output characteristics as shown in Fig. 6. The results are shown in Fig. 11, from which it is clearly seen that the distortion appearing in the high frequency band is much noticeable. Results of this measurement and a few additional experiments were discussed from the viewpoint of masking, and it was shown that the perceptibility of distortion components in a specified frequency band is mainly determined by the signal level in the same and the neibouring frequency bands, and that the just perceptible level of distortion is almost constant when the level is given relative to the signal level of the same frequency band as far as a fixed program signal is concerned.
著者
安齊 祐美 荒木 章子 牧野 昭二 中谷 智広 山田 武志 中村 篤 北脇 信彦
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.68, no.2, pp.74-85, 2012-02-01
被引用文献数
1

本論文では,音源信号のスパース性に基づき,時間周波数バイナリマスク(BM)を用いる音源分離手法におけるミュージカルノイズの低減を目的とした,分離音声のケプストラムスムージング(CSS)を提案する。CSSは,近年提案されたスペクトルマスクのケプストラムスムージング(CSM)で用いられるケプストラム領域でスムージングする考え方と,ケプストラム表現による音声特性の保持の制御という観点では,マスクではなくBMによって得られた分離音声を直接スムージングする方が好ましいという仮説とに基づいている。また,従来法(CSM)や提案法(CSS)と他のミュージカルノイズ低減手法の性能を実験により比較する。CSSでは,CSMと同程度のミュージカルノイズ低減性能を有し,更に目的音声の歪の小さい分離信号が得られた。
著者
濱村 真理子 青野 まなみ 岩宮 眞一郎
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.71, no.2, pp.65-72, 2015-02-01

BGM,サイン音とアナウンス,自然環境音の丁度よいと感じられる音量(最適聴取レベル)を調整法により測定し,その男女差の有無を検討した。BGM,サイン音,アナウンスの最適聴取レベルに男女差が認められ,女性よりも男性の方が最適聴取レベルを高く設定していた。自然環境音の場合には最適聴取レベルに男女差は認められなかった。同一音圧レベルを女性よりも男性の方がより小さいと感じるため,男性が要求する音の大きさを満たすためには女性よりも聴取レベルを高く設定する必要が生じたと考えられる。しかし,自然環境音の最適聴取レベルは実際に聴いて記憶された音量に合わせて設定されたために,男女差が生じなかったのであろう。
著者
沢島 政行
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.27, no.9, pp.425-434, 1971-09-10
被引用文献数
2

For viewing the articulatory movements of speech organs inside the body, we have developed a new technique by use the specially designed fiberscope. There are three types of fiberscopes, the standard model, the thinner model, and the wide-angle model. The former two models were designed for observing the larynx, and the third mainly for observing the pharynx and the velum. All of them are inserted through the nasal passage in order to secure free movements of the articulatory organs during observation. Fiberscopes are basically composed of the image guide, the light guide, the objective lens, and the eye piece(Fig. 1). The image guide is a bundle of aligned("coherent")glass fibers and it transmits the image from one end coupled to the objective lens, to the other end coupled to the eye piece, while the light guide conducts the light for illumination from a light source to the object. The two bundles form a flexible cable of the scope. The diameter of each glass fiber is 9 microns for the image guide and 22 microns for the light guide. In a control unit there is an angle lever to which thin wire is attached and runs to the tip of the flexible cable for the remote bending control of the tip portion. A cine-camera can be attached to the eye piece by means of an adapter. The standard mode, animproved version of the model we first reported in 1968, has an outside diameter of 5. 5 mm at the tip. The objective lens gives an image field angle of 44 degrees, and the object to lens distance ranges from 15 to 50 mm. A light source of 300 W xenon lamp gives sufficient illuminations for the glottis for motion pictures at a rate of, for example, 64 frames per sec. , giving an image size of 6×6 mm^2 on the film. Photographic emulsion of ASA 500 is used. The thinner model which was more recently designed has an outside diameter of 4. 4 mm at the tip. The image size on the film is approximately 4×4 mm^2 when the same adapter as in the standard model is used. In respect to the image resolution, it is somewhat inferior to the standard model. The wide-angle model has an outside diameter comparable with the standard one, the objective lens giving a field angle of 65 degrees and a lens to object distance range of 7 mm to infinity. The image size on the film is designed to be the same as the thinner model. Before the insertion of the scope, a surface anesthesia is applied to the nasal cavity and the epipharynx. Positioning of the scope(Fig. 2 and 8) is quite easy and does not cause any discomfort or disturbance to the subject in performing natural utterances. By visual inspection and some quantitative measurement of the photographic images of the larynx, frame by frame, we can analyze the opening and closing gestures of the glottis as well as the presence or absence of the vocal fold vibration during consonant articulations(Fig. 4). When the vocal pitch is controlled, an apparent change in the distance between the arytenoid and the epiglottis, and the up and down movements of the larynx are usually observable(Fig. 5). A combination of the transillumination technique(photoelectric glottography) with the fiberscopic observation(Fig. 6) provides useful data for detailed analysis of the rapid changes in the glottal conditions(Fig. 7). Some phonetic data of the laryngeal adjustments in speech have been reported elsewhere. Use of the wide-angle model for viewing the pharynx and the velum is now in the stage of preliminary experiment. Results are quite promising. A brief review is also presented on other techniques being employed for observing articulatory movements of the speech organs. The techniques mentioned are:ordinary cineradiography, the new technique of computer controlled tracking of moving objects with use of an x-ray microbeam, the photoelectric(transillumination) method, the ultrasonic measurement, the electrical glottography, and the dynamic palatography.