著者
佐々木 實 石川 智子 山田 真司
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.45, no.10, pp.743-747, 1989-10-01
被引用文献数
11 2

人間の手によるピアノの直接演奏において、楽譜上の等しい時価を演奏したときの時間間隔に見られるゆらぎについて分析を試みた。各音符の長さをできる限り正確に弾いたメトロノーム的な演奏(Aタイプと名づける)と、芸術的な演奏(Bタイプと名づける)とについて、各音符の時価に対応する時間間隔を測定し、その時系列からゆらぎのパワースペクトルを求めた。その結果次の結論を得た。1)Aタイプの演奏は全体のゆらぎのパワーが小さく、かつ、スペクトルエンベロープの傾きは、平坦又は右上がりである。2)Bタイプの演奏は全体のゆらぎのパワーが大きく、かつ、長い周期によるゆらぎが強調されており、スペクトルエンベロープの傾きは右下がりである。3)A、B両タイプのスペクトルエンベロープの傾きの係数の境界はおおまかに-2付近に設定できる。
著者
岩宮 眞一郎
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.48, no.9, pp.649-657, 1992-09-01
被引用文献数
29

市販のレーザ・ディスク作品、及び、別の作品の音と映像を組み合わせた素材を用いて、AVメディアを通しての情報伝達における、視覚と聴覚の相互作用に及ぼす、音と映像の調和度の影響を検討した。音と映像の重畳が、音と映像の印象を良くする、協合的な相互作用においては、音と映像の調和度が高いほど、その効果が大きい。視覚と聴覚に共通する性質(通様相性)が同方向に変化する、共鳴現象に関しては、通様相性の処理レベルに依存し、明るさのように、低次の処理による性質では、調和度とは関わりなく、共鳴現象が生ずるが、引き締まり感、きれいさのような、高次の処理を必要とする性質では、調和度が高くないと、共鳴現象が生じない。
著者
中根 偕夫 平田 尚史 瀬谷 浩一郎
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.46, no.11, pp.893-898, 1990-11-01
被引用文献数
15

ここでは定在波音場中での高気圧グロー放電の諸特性の変化をみた。すなわち、(1)高気圧グロー放電の発生する電圧の範囲、(2)高気圧グロー放電の発光部の形状、(3)電流波形への音の影響、(4)V-I特性、(5)放電の発生と消滅する電圧の履歴的な現象に関して検討した。実験方法として、針(+)対平板(-)電極を定在波音場中の粒子速度分布の腹に位置させ、音の強さと電源の電圧を変化して実験した。その結果、音を大にすることによって(1)高気圧グロー放電はスパークへと変化し、(2)放電の発光部が扇子を開いたような形状へと広がり、(3)電流波形にパルスの発生が見られ、(4)電極間電圧の上昇、(5)発生と消滅する電圧の履歴現象などに音の影響があることが分かった。
著者
福留 公利
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.44, no.4, pp.272-281, 1988-04-01
被引用文献数
21

複数個のマイクロホンを一つの剛球に埋め込む「球バッフル埋込みマイクロホン」とその回折情報を用いて、複数個の未知の音源の入射方向角及びスペクトルの両方を推定する方法を述べる。音源方向角を仮定しながら、本マイクロホンの回折情報を用いて計算したスペクトルと実際のスペクトルとの差から周波数ごとに定義されるノルムの自乗を最小にするようにして、音源推定を行う。更に、推定した方向からの音信号を抽出するマイクロホンシステムについても述べる。計算機シミュレーションにより、本方法の有効性を確かめている。
著者
岡田 清
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.55, no.11, pp.742-751, 1999-11-01
被引用文献数
1

MA過程の共分散が与えられたときに,振幅スペク1・ルは容易に求めることができる。よく知られているように,このとき最小位相スペクトルは,対数振幅スペクトルのHilbert変換として積分方程式の形で与えられる。この積分の値は,今まで直接的に求められてはいない。本論文ではこの積分の値を直接的に求めることによって,q次のMA過程の最小位相スペクトルは,共分散のz変換を双線形z変換して得られるq次の代数方程式の根を得ることによって求めることができることを示す。結果の具体的な応用例として,ここで求められた最小位相スペクトルから,有効数字の桁数を含めて最小位相多項式を求める方法を示す。
著者
迫江 博昭 千葉 成美
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.27, no.9, pp.483-490, 1971-09-10
被引用文献数
33

We consider that the pattern matching method with time-normalizing ability is one of the most effective methods for the spoken word recognition, and that it can well be applied to the recognition of continuously spoken words. Speech can be expressed as a vector-valued time function (1), (2) by appropriate feature extraction. Then, the effect of speaking rate variation can be regarded as non-linear transformation of time axis (3), and can well be compensated by minimizing (4)(Fig. 1). Based on these consideration, we evaluate time-normalized similarity S(A, B) by (5). Calculation of S(A, B) is efficiently carried out using dynamic programming technique (15), (16), (17), (Fig. 3). Utilizing this pattern matching scheme, continuously spoken words can by separated into word units by determining the subpattern A^l which is most similar to the stored reference pattern, or for which S(A^l, B) is minimum (19), . (20), (Fig. 4). Based on this segmentation scheme, three methods to recognize continuously spoken words are proposed. Method-a is direct application of this segmentation scheme. In Metod-b, recognition is carried out by evaluating similarity S(A^l, B_mB_n) between concatenated reference patterns (17) and input pattern, and the amount of computation is considerably reduced using the segmentation scheme and the DP technique(Fig. 5). Method-c is modification of Method-b, where, after recognizing each word, matching window is shifted so that it will be able to cover the timing difference of the next word(Fig. 6). These Methods were extensively examined by computer simulation. Average recognition rate of 99. 8 per cent has been obtained for 2400 utterances of Japanese 1-digit numbers of five speakers, and 99. 6 per cent for total of 500 continuously spoken 2-digit numbers of five male speakers by Method-c(Table 1, 2, 3).
著者
鈴木 弘之 田村 明弘 鹿島 教昭
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.45, no.5, pp.374-384, 1989-05-01
被引用文献数
18

歩行者空間のスライド映像の視覚情報と道路交通騒音のスピーカ再生音の聴覚情報を同時あるいは別々に用いて、二つの心理実験を行っている。これらをもとに、緑の持つ喧騒感緩和効果の存在条件とそのメカニズムを検討し、次の結果を得ている。1)緑による地区の喧騒感の緩和効果が存在する。2)地区の喧騒感は視覚情報による喧騒感と聴覚情報による喧騒感の平均化作用によって形成される。3)平均化作用は注意配分が関係し、聴覚情報への注意配分が大きくなると緑の効果は認めにくくなる。4)視覚情報から得られる喧騒感に対応する騒音レベル、すなわち期待騒音レベルが推定される。5)一方、緑の存在が騒音の侵入による地区の喧騒感の増加を誘発する効果も認められる。
著者
梅田 規子 寺西 立年
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.22, no.4, pp.195-203, 1966-07-30
被引用文献数
19

This paper describes a simple device which simulates a human vocal tract acoustically, and results obtained from systhesized speech sounds produced by the device. It is simple and easy to deal with as compared with an electrical vocal tract simulator. Acoustic models of vocal tracts are made of transparent acryl-resin. They are of box shape. The vocal tract length of a man's model is 17. 5cm, that of woman's model 14cm, about 80% of that of the man's and that of children's models about 11cm and 9cm. The height is 2. 5cm. The cross-sectional areas of these models are made variable by moving 1-cm thick plastic strips which are closely inserted from one side. They have a nasal branch as well. Glottal sounds are sent into one end (glottis) of the models and let out of the other end (mouth). Various vowels and other sustained sounds are produced accrding to the configuration of the models at that time. The driving unit of a horn speaker (NEC-555M, Japan) was used as a sound source. Considering that the acoustic impedance at the human glottis is very high, a bundle of steel wires, each 1. 5mm in diameter and 14mm in length was packed tightly into the throat of the loud speaker. Consequently, the cross-sectional area of the throat is about 1. 3cm^2. By observing sustained seech sounds, we find two features in them. One is phonemic feature, in other words a feature that distinguishes one phoneme from others, and the other is a feature that contributes to naturalness, in other words, a feature that distinguishes not only males, females and children but also individuals from one another. We have successfully made these features clear physically. When the length of a vocal tract is reduced gradually from 17. 5cm, it will be seen that the configuration of phoneme is reduced similarly without spoiling the phonemic feature. As for the cross-sectional areas, relative values are only required. So we can normalize the vocal tract configuration of every phoneme with respect to the vocal tract length and the cross-sectional areas. The use of the normalized configurations will afford us normalized spectra of phonemes. The relation between the vocal tract length and the fundamental frequency of voice, which serves to distinguish speakers from one another in sex and age, can also be nomalized. That is to say, if the ratio of frequency, the wavelength of which is four times as long as a tract to the fundamental frequency of voice, is called a normalized pitch, we can obtain natural synthesized speech sounds when the normalized pitch ranges from 2. 5 to 5. 0. The waveform of glottal sounds referred to herein is saw-tooth form. The decay time T_3(msec) of the saw-tooth-wave form being sufficiently short as compared with one cycle T, the first zero point of glottal spectrum will apper at 1/(T_3)(kc). Glottal sound spectrum has a great influence upon characteristics of each individual's voice. The shorter the decay times, the sharper a voice becomes. Longer decay time (about 0. 6-1. 0 msec) is better for a female voice while shorter one (about 0. 2-0. 5 msec) is better for a child's voice.
著者
平松 幸三 箕浦 一哉 松井 利仁 宮北 隆志 長田 泰公 山本 剛夫
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.56, no.8, pp.556-564, 2000-08-01
参考文献数
24
被引用文献数
1

特殊空港周辺で実施されている家屋防音工事が生活実態上どの程度生活環境の改善に寄与しているのかを検討するため, 嘉手納基地周辺において質問紙調査を行い, 家屋防音工事の実施状況, それに対する満足度と効果の有無並びにうるささ, 生活妨害, 環境質に関する回答を分析した。その結果によると, 騒音曝露地区では, 家屋防音工事への満足度が高く, その効果を評価する回答が多かったが, 高度曝露地区ではそれらの回答率が著しく低かった。多重ロジスティック分析を行って生活妨害の反応に関するオッズ比を家屋防音工事実施群と非実施群とで比較したところ, 両群において反応に差が認められなかった。このことから家屋防音工事が生活環境を改善することにはなっていない, と結論された。
著者
石井 泰 山田 一郎 幹 康 五十嵐 寿一
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.35, no.5, pp.226-234, 1979-05-01
被引用文献数
17

A new technique to measure the ground to ground noise propagation was developed. The test sound of a band limited noise is emitted from a loudspeaker intermittently. A several second burst of the noise and the following pause of the same length are repeated. At a receiving spot, the sound intensity is integrated alternatively by two digital counters. One counter integrates the intensity of the test sound plus the background noise at that spot in the period for which the test sound is present. The other integrates the intensity of the background noise in the absent period of the test sound. Each of the devices at the source and receiving spots has a precise crystal oscillator as the clock. Once the synchronization of the two devices is made before a measurement, the relative phase of the operations of the devices is kept constant during the time of the measurement without any connection. After the completion of a predetermined number of integrations, the difference of the accumulated numbers in the two counters is read, which gives the intensity of the test sound at the receiving spot. Experiments using a 5-Watt loudspeaker showed that the noise attenuations of the distance of 170m can be measured with the statistical error less than 0. 5dB.
著者
子安 勝
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.32, no.10, pp.670-673, 1976-10-01
著者
グリーンバーグ 陽子 加藤 宏明 津崎 実 匂坂 芳典
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.67, no.2, pp.65-74, 2011-02-01
参考文献数
15
被引用文献数
1

対話音声の合成を目指して,対話韻律生成の方法を提案した。対話場面において出現する発話内容自体が,その取り得る対話韻律を限定することに着目し,提案方法では,入力となる語彙が与える印象によって制約される韻律特徴量を用いて,従来の読み上げ韻律を修正する対話韻律生成を行う。これまでに行った一語発話「ん」のパラ言語分析が示した,3次元の知覚的印象空間(確信-疑念,肯定-否定,好印象-悪印象)と韻律制御(基本周波数の平均値と時間変化形状,発話時間長)の関係を用いて,同じ印象空間で典型的な座標を持つ語彙に対して,対応する対話韻律を付与した。得られた合成音声に対する自然性評価実験により,提案した方法の妥当性を確認した。
著者
三浦 雅展 江村 伯夫 秋永 晴子 柳田 益造
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.66, no.5, pp.203-212, 2010-05-01
参考文献数
17

ピアノを用いた1オクターブの上下行長音階演奏に対する自動評価について述べている。音階演奏の客観的な評価基準を求めるために,種々の音階演奏の5名の専門家による適切性の主観評価とその演奏のMIDI記録の関係を求めている。記録されたピアノ演奏に含まれる打鍵タイミング,打鍵強度(ヴェロシティ),及び押鍵時間長について,音階演奏に含まれる逸脱のスプライン補間曲線を求め,得られた曲線の特徴から,当該演奏の特徴を15のパラメータで表している。補間曲線は鍵盤に対する奏者の手指交差に基づいて求められている。得られた主観評価スコアはその適切性をLeave-one-out法によってオープンテストするために用いられている。評価データに対する評価スコアは,KL展開によって次元縮小を行った後にk近傍法によって求められている。音楽の専門家による評価値に基づいて,提案手法が音階演奏の適切性に関する主観スコアを適切に予測していることを確認している。
著者
蘆原 郁 桐生 昭吾
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.62, no.12, pp.871-876, 2006-12-01
参考文献数
20
被引用文献数
3
著者
伊藤 憲三 水島 昌英 北脇 信彦
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.61, no.8, pp.431-440, 2005
参考文献数
28
被引用文献数
1

入力信号を音声とそれ以外の信号(非音声)に識別して, 定常雑音を効率的に抑圧する方式を提案した。音声と非音声の識別には, 入力信号の周期性を表す特徴量, 信号スペクトル特徴, パワーなどを用いた。雑音抑圧処理は, スペクトルサブトラクション(SS)とロスコントロール(LC)を併用した。SSでは, 周波数重みづけによって雑音を差し引くこととし, また, LCはSSで消し残った残留雑音を損失制御することによって無音区間の残留雑音を完全に除去した。種々の雑音を用いて評価実験を行った結果, 信号対雑音比が10dB程度以上の雑音条件下で良好な動作をすることを示した。また, 本方式をマルチマイク集音系と組み合わせることによって更に性能を向上させることを示した。更に, 聴覚障害者による数字了解度試験を実施し, 提案した雑音抑圧処理が難聴者の聴こえに非常に有効であることを示した。
著者
馬場 紘彦 江端 正直
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.52, no.4, pp.244-252, 1996-04-01
被引用文献数
1

本論文は, 一般ドライバの音環境(L_<Aeq>)を調べ, 電子サイレン音の検知レベルを測定し, 運転に向ける注意の効果や, 救急車の接近を予測していないこと等の要因に依る検知レベルの上昇を実験的に求め, 更に救急車の電子サイレン音に気づく距離を推測したものである。得られた結果は以下のとおりである。(1)運転中に聴く音楽のL_<Aeq>の平均値は67.0dBであり, L_<Aeq>が2dB大きくなるごとに約1.0〜1.7dB聞こえ難くなる。(2)車速が10km/h増すごとに, 約0.5dB検知レベルは上昇する。(3)予期時と非予期時との検知率の差は音圧レベルに依り異なる。そして, 検知率が50%付近では, 非予期時の場合は予期時の場合よりいき値が約6dB上昇する。これらのことから, 検知率は救急車の距離が10m遠くなるごとに計算上約13%減少する.