著者
粕谷 英樹 鈴木 久喜 城戸 健一
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.24, no.6, pp.355-364, 1968-11-30
被引用文献数
43

For the purpose of determining the characteristics of phonetic quality of voewls, the trend in the changes of formants and pitch of vowel with age and sex of speaker has been investigated by analyzing a large number of samples of five japanese vowels. Conclusions obtained are as follows. (1) Most of the formants considerably change with the age of the speaker. Principal articulatory factor in the change of formants is the difference in the vocal tract length. On the other hand, the third formant of /i/ which depends mainly upon the front part of oral cavity, and the first and second formants of vowels /o/ and /u/ which constitute comparatively lip-rounded articulatory configuration do not change so much. For each case of children, youth and female adults the ratio of the measured formant of the open and back vowel /a/ to the mean value of the corresponding formant of male adults is approximately constant. Hence we can estimate the vocal tract length of the speaker from the mesured formants, using Eq. (2). (2) The differences between the first and second formants of male and those of female become distinct after 11 years old, while the difference between the third formant of male and that of female becomes distinct after 9 years old. absolute differences of formants, particularly of the third formant, are useful to discriminate the sex of the speaker. This is important in the case of children since pitch is useless in the distinction of the sex of the speaker before 12 years old (the voice change). (3)There is obvious difference between the pitches of children, youth, female adults and male adults, but it is difficult to infer the age of the speaker from his pitch. (4) Generally speaking, there is a correlation between formant and pitch, but there is no correlation if the speech samples are taken from the speakers of the same age. The correlations of formants and pitch come from the correlations between the age and the formants and the correlation between the age and the pitch. (5) Perfect discrimination of the vowels can not be made by the first and second formants only. There are some confusions between certain vowels (/a/ and /o/, /e/ and /u/) on the first and second formant-plane. But, thre is little confusion between the vowels in the three dimentional space composed of the first, the second and the third formants or of the pitch, the first and the second formants. The pitch or the third formant, not to mention the first and second formant, is an indispensable parameter for the discrimination of the vowels regardless of the age and sex of the speaker.
著者
安倍 正人 城戸 健一
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC)
巻号頁・発行日
vol.1991, no.64(1991-ARC-089), pp.75-80, 1991-07-19

現状のVLIW型の計算機の問題として、入力データのポート数が1つしか無いことがあげられる。すなわち、たとえ演算器が複数あってもほとんどの計算において実際に動作する演算器は1つだけということになり、パフォーマンスが良くない。そこで、我々は複数のデータキャッシュをサポートするVLIW型計算機KIDOCHを開発中である。具体的には2つのデータキャッシュをサポートし、さらに5ポートレジスタファイルを用いてキャッシュ間のコヒーレンスも保つようにしている。また、この5ポートレジスタファイルはMMUのTLBおよび汎用のレジスタファイルとしても効果的に用いられている。さらに、これらの機能を有効に使うためのCコンパイラについても特にループ展開について詳しく述べている。
著者
城戸 健一 鈴木 英男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. EA, 応用音響 (ISSN:09135685)
巻号頁・発行日
vol.107, no.186, pp.25-30, 2007-08-02

本文では瞬時周波数を波形の瞬時位相の時間微分として,その性質について考察する。瞬時位相を求めるためには,その波形と直交する(位相がπ/2遅れる)波形が必要であるが,それはスペクトルの正の周波数範囲に-jを,負の周波数範囲にjを乗じてフーリエ逆変換することでつくられる。これは波形から解析信号をつくることと同じである。数列で波形が表されているときには,時間による微分の代わりに差分を用いるので,サンプリング周波数を十分に高くすることと,偏りが生じないように両側差分を用いることが必要である。波形が高調波を含むときには,それによって瞬時周波数が負になることもある。本文ではその理由をベクトル図によってわかりやすく説明する。振幅変調波形あるいはFM波形の瞬時周波数について興味深い現象が生じることを述べ、最後に,正弦波の瞬時周波数は時間にかかわらず一定であるのに,ある時点で急に始まる正弦波の瞬時周波数がその時点で2倍になることを計算例によって示す。
著者
曽根 敏夫 城戸 健一 二村 忠元
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.18, no.6, pp.320-326, 1962-11-30
被引用文献数
40 7

We subjectively evaluate the acoustics of rooms and the qualities of acoustical instruments by evaluating musical sounds, speech sounds, and others passing through them. In such a case we had expressed the evaluations by some descriptive adjectives such as "rich", "clear", "resound" and so forth. But there are a variety of expressions to describe the impression of such sounds, and it is uncertain what and how many adjectives we should use. Judging from the number of physical factors influencing those sounds, we expected that it is possible to select a limited number of adjectives sufficiently evaluating those sounds and made two experiments. The first experiment was made from the standpoint of room acoustics. 15 differentlyconditioned sounds made with a reverberation equipment were rated on 21 seven-category scales defined by polar-opposite adjectives. As a result of factor analysis of the intercorrelation between scales by the centroid method, four nearly orthogonal factors were extracted; (1) the aesthetic or lyric factor, (2) the one expressing "volume" and "extent", (3) the one expressing "brightness" and suchlike, (4) the one expressing "softness" and suchlike. The secound experiment was made by varying the lowest resonance of a dynamic loudspeaker by means of a simulator. The ratings were made by the Scheffe's method for pair comparison, and the result proved consistent with the first one.
著者
金井 浩 城戸 健一 鈴木 篤 金井 淳
出版者
一般社団法人 日本統計学会
雑誌
日本統計学会誌 (ISSN:03895602)
巻号頁・発行日
vol.20, no.2, pp.255-276, 1990 (Released:2009-01-22)
参考文献数
40

経済指標の時系列信号は,公定歩合の引下げ,戦争の勃発など経済的衝撃による影響を大きく受ける.従って,経済的インパクトに対応するマルチパルス系列が,経済市場という伝達系を駆動し,その応答を観測しているというモデルが構築できる.この時系列モデルに基づく分析を行なう場合,一つの時間窓内に複数の衝撃パルスが存在する場合がある.しかし,従来のBox-Jenkinsモデル等の時系列分析法では,伝達系を駆動する信号は定常白色雑音か単一インパルスに限られるため,マルチパルスによって駆動された伝達系の応答から,各パルスの振幅及び伝達系の特性を決定することができない.本論文では,マルチパルスで駆動された伝達系の応答に,更に雑音が付加された観測信号から,全極型伝達系の特性と駆動パルス系列の振幅を決定する方法を提案する.最後に東京市場の円/ドル為替レートに対して,本分析法を適用した結果を述べる.
著者
松崎 雅子 黒田 敬之 城戸 健一
出版者
特定非営利活動法人 日本顎変形症学会
雑誌
日本顎変形症学会雑誌 (ISSN:09167048)
巻号頁・発行日
vol.9, no.3, pp.149-156, 1999-12-15 (Released:2011-02-09)
参考文献数
19

The purpose of this study was to investigate acoustically the influence of orthognathic surgery on the phonetic quality of patients with skeletal mandibular protrusion. Samples of speech sounds were collected from nine patients (seven females, two males) before and after orthognathic surgery.The psychoacoustic analysis was carried out by 24 examiners using the paired comparison in naturalness of the five different Japanese words.The acoustic analysis, based on the linear predictive coding (LPC), were applied to determine the lowest two local spectral peaks (Fl, F2) on the vowels. Fl and F2 were compared with the normal speakers, and the changes of Fl and F2 with orthognathic surgery were evaluated using 40 Japanese words.The results were as follows:1) The naturalness of speech has been improved in most patients after orthognathic surgery in the psychoacoustic analysis.2) Distribution of Fl and F2 in patients after surgery approximated that of normal speakers.3) The psychoacoustic and acoustic analyses have a significant correlation. It was suggested that improvement in naturalness of speech is associated with the changes of Fl and F2 by orthognathic surgery.
著者
柴山 秀雄 福永 一保 城戸 健一
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.40, no.3, pp.152-160, 1984-03-01 (Released:2017-06-02)

This paper proposes a new pulse discharge sound source for acoustical measurements and discribes the construction and acoustical characteristics of the source. Existing pulse sound source generate sound sources generate sound pluse by a spark discharge using static energey in the charged condenser. The sound source proposed in this paper uses electromagnetic energy in a transformer. The current in the primaty turn of the transformer is cut off suddenly and a spark discharge is generated between the electrodes connected to the secondary turn. The timing of discharge is easily controlled by the electronic switch in the primarty turn. The duration of the sound pluse is very short and controllable and the power spectrum of the sound covers very wide frequencies. The extent of the nonlinearity is very small and the nondirectivity is realized. The reproducibility is good. The pluse discharge sound source proposed is useful for linear acoustical measurements
著者
打越 聰 東 貞男 城戸 健一
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.47, no.4, pp.289-295, 1991-04-01
被引用文献数
2

多数の騒音源の中から対象とする音源のみを分離測定するために、筆者らが、先に提案した2個の配列マイクロホンの結合によるX形又はV形マイクロホン配列システムは、感度の空間特性におけるメインローブの幅が、対象音源の全周方向で一様に得られる。しかし、サイドローブの減衰レベルは、単一の配列マイクロホンの減衰レベルに比してかなりに劣化する。本報では、サイドローブの減衰レベルを改善する目的で、2組のX形又はV形マイクロホン配列システムを結合したXX形又はVV形マイクロホン配列システム構成を採り上げ、コンピュータ・シミュレーションによる特性の計算を実施した。計算結果の検討を通して、XX形マイクロホン配列システムの場合、初めの段階で、X形マイクロホン配列システムの2配列マイクロホンの出力間のクロススペクトルを求め、次の段階で、求められた2X形マイクロホン配列システム出力間のクロススペクトルを求める「2重クロススペクトル」の信号処理法によれば、所要の目的が達成できることを示す。
著者
粕谷 英樹 鈴木 久喜 城戸 健一
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.24, no.6, pp.355-364, 1968-11-30 (Released:2017-06-02)
被引用文献数
5

For the purpose of determining the characteristics of phonetic quality of voewls, the trend in the changes of formants and pitch of vowel with age and sex of speaker has been investigated by analyzing a large number of samples of five japanese vowels. Conclusions obtained are as follows. (1) Most of the formants considerably change with the age of the speaker. Principal articulatory factor in the change of formants is the difference in the vocal tract length. On the other hand, the third formant of /i/ which depends mainly upon the front part of oral cavity, and the first and second formants of vowels /o/ and /u/ which constitute comparatively lip-rounded articulatory configuration do not change so much. For each case of children, youth and female adults the ratio of the measured formant of the open and back vowel /a/ to the mean value of the corresponding formant of male adults is approximately constant. Hence we can estimate the vocal tract length of the speaker from the mesured formants, using Eq. (2). (2) The differences between the first and second formants of male and those of female become distinct after 11 years old, while the difference between the third formant of male and that of female becomes distinct after 9 years old. absolute differences of formants, particularly of the third formant, are useful to discriminate the sex of the speaker. This is important in the case of children since pitch is useless in the distinction of the sex of the speaker before 12 years old (the voice change). (3)There is obvious difference between the pitches of children, youth, female adults and male adults, but it is difficult to infer the age of the speaker from his pitch. (4) Generally speaking, there is a correlation between formant and pitch, but there is no correlation if the speech samples are taken from the speakers of the same age. The correlations of formants and pitch come from the correlations between the age and the formants and the correlation between the age and the pitch. (5) Perfect discrimination of the vowels can not be made by the first and second formants only. There are some confusions between certain vowels (/a/ and /o/, /e/ and /u/) on the first and second formant-plane. But, thre is little confusion between the vowels in the three dimentional space composed of the first, the second and the third formants or of the pitch, the first and the second formants. The pitch or the third formant, not to mention the first and second formant, is an indispensable parameter for the discrimination of the vowels regardless of the age and sex of the speaker.
著者
伊藤 彰則 牧野 正三 城戸 健一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J74-D2, no.9, pp.1147-1155, 1991-09-25

連続音声認識のための新しい統語処理アルゴリズム「機能語予測CYK法」について述べる.機能語予測CYK法は,CYK法をベースとし,これに機能語の予測機能を加えたものである.機能語を予測しながらマッチングすることにより,効率的な処理を行うことができる.次に,この機能語予測CYK法にビームサーチを導入したアルゴリズムを提案する.また,機能語を効率良く予測するための正規文法(機能語オートマトン)を導入する.これは,従来の文節処理に用いられてきた有限オートマトンと同じものが使用できるため,文節内文法での各種の制約が利用できる.ビームサーチと機能語オートマトンの導入によって,非終端記号数の増加に伴う記憶容量および計算量の増加を抑えることができる.このビームサーチを用いた機能語予測CYK法と,文節検出+統語処理の2段階の認識方式との比較実験を行った結果,計算量・精度ともに機能語予測CYK法が優れていることがわかった.
著者
安倍 正人 嶋 明弘 上田 隆 金井 浩 牧野 正三 城戸 健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.28, no.12, pp.1306-1317, 1987-12-15
被引用文献数
1

筆者らは ディジタル信号処理技術を応用して 音響および音声信号処理の研究を行っている.具体的には 音響信号処理分野では機械系の故障診断 音源位置の推定を行っており 音声信号処理の分野では不特定話者単語音声認識に関する研究を行っている.これらの処理はいずれも膨大な計算量および記憶容量を必要とし かつ 最終的にはリアルタイムで行わなければならない.そのため 汎用計算機では演算速度 リアルタイム性および処理の連続性の点で問題があり DSPでは記憶容量 演算精度およびソフトウェアの柔軟性の点で問題がある.このため 筆者らはホスト計算機のバックエンドプロセッサとして ディジタル信号処理を主な目的とした以下に示す3つの特徴を持つ高速演算装置μKIDOCHを開発した.(1)ホスト計算機との間のデータ転送ネックを解消するため パイプライン化メモリにより結合する(2)マイクロプログラム方式によるパイプライン処理を行う.(3)データパスあるいはアドレスパスとして使える3本の32bitパスおよび128bitプログラムバスを用いることにより 複数の演算器が並列に動作する.本報では 試作した高速演算装置以μKIDOCHの特徴とクロスアセンブラを用いて作成した種々のプログラムにより検討したμKID0CHの性能について報告する.
著者
古賀 秀昭 牧野 正三 城戸 健一
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.46, no.10, pp.795-801, 1990-10-01
被引用文献数
8

聴覚に関する生理学的及び心理学的知見から、ローカルピークが母音認識の手掛かりとして重要であると考えて、著者らは単語中の母音の認識をローカルピークを用いて行っている。しかし、これまで認識実験と聴取実験との比較検討は行われていない。今回、単語中の母音について聴取実験を行うと共に、同じ音声資料を用いてローカルピークと通常行われているLPCケプストラム係数による認識実験も行い、それらを比較検討した。認識実験は聴取実験で10人中の8人以上が正答したもので標準パタンを作成したもので行った。特徴量と識別規則を含めた検討の結果、部分的には差が見られないものもあるが、全体的にはローカルピークによる認識結果の方が聴取実験結果に近いという結果になった。
著者
竹内 博樹 荒井 秀一 城戸 健一 三井田 惇郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.396, pp.19-26, 1997-11-21
被引用文献数
3

本研究は、マスメディア上に流れる大量の音声データから必要な情報を検索する手段として、ニュース音声を対象にHMMを用いたワードスポッティングの利用を検討する。ワードスポッティングは、音韻情報に基づいて行われるため音声中によく似た音素列が存在するとキーワードとして誤検出される。そこで本研究では、キーワードの音素数と湧き出し数の関係について比較実験を行った。また、キーワードの調音点の変化に注目して、キーワードの推定出力尤度と実際に出力された尤度の関係について調べた。