著者
河原 英紀 栃内 香次 永田 邦一
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.33, no.9, pp.470-479, 1977-09-01 (Released:2017-06-02)

This paper describes a speech analysis method for linear predictor coefficients and formant frequencies and bandwidths estimation using a portion of one pitch period of speech waveform. This method is based on the fact that estimation errors together with prediction errors vanish when excitation-free segments are utilized (Eq. 6). In the case of actual speech analysis, however, prediction errors may remain, even if they are minimum (Fig. 1). Therefore, it is necessary to formulate estimation errors in order to evaluate the performance of the proposed method. Theoretical studies on estimation errors are carried out. Estimation errors in linear predictor coefficients are dependent on the unknown component of excitation (see Eqs. 7 through 11). Expected values of estimation errors are derived, based on the assumption of the statistical property of excitation (see Eqs. 13 through 15) . A similar expression of estimation errors in formant frequencies and bandwidths is derived in the same manner (see Eqs. 16 through 18). Finally, two kinds of error estimates represented in terms of observed values are introduced as criteria for the determination of analysis conditions of our method and for the experimental comparison between the proposed method and the usual linear predictive analysis (Eq. 19). Simulation studies on these error estimates are performed using several kinds of synthetic speech. Their formant frequencies and bandwidths are given in Table 1. The relevance of these error estimates is indicated in the case of our method and in the case of usual linear predictive analysis (Figs. 2 through 5 and Tables 2 and 3). The length of the analysis segment must be properly chosen when these error estimates are employed in the error evaluation of the usual linear predictive analysis of periodic speech (Eq. 20 and Fig. 6). The results of simulation studies indicate both adequacy and validity of these error estimates. Experimental studies have been done to evaluate the performance of our method in the case of actual speech analysis. The minimum values of these error estimates of our method are as small as one half to one eighth of those of usual linear predictive analysis (Figs. 7 through 9 and Tables 4 and 5). In addition, the glottal source waveform estimated by using the result of our method seems more plausible than that obtained by using the result of the usual linear predictive analysis (Fig. 10). The results of these studies indicate that the proposed method yields more accurate estimates of parameters than those obtained by the usual linear predictive analysis, especially in the case of low-pitched speech.
著者
荒木 健治 高橋 祐治 桃内 佳雄 栃内 香次
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.3, pp.391-402, 1996-03-25
被引用文献数
19

我々は, 人間の言語および知識獲得能力の解明とその実現を目的として研究を行っている. このような研究はこれまでいくつか存在するが, 工学的に有効なシステムを完成するまでに至っていないのが現状である. また, 心理学の立場からの研究も存在するが, これらの研究は工学的にどう実現するかという問題は対象としていない. そこで, 本論文では, この言語および知識獲得能力を工学的に実現する一つの試みとして, 入力べた書き文とその漢字かな交じり文より帰納的に語の読みと表記を獲得し, その獲得状況および変換精度に基づく確実性の高い語より順に変換するという帰納的学習によるべた書き文のかな漢字変換手法を提案する. 本手法は辞書が空の状態からでも学習機能により語を獲得することができるので, 辞書を個人ごとに自動的に作成することが可能, 個人用辞書とすることにより辞書容量を少なくできる, 未登録語の自動登録が可能, 初期辞書作成の労力を回避できるという利点がある. 本論文では, 更に本手法に基づく実験システムを作成し, 異なる4分野の論文40編を用いて本手法の学習機能による適応性能を確認するための実験を行った. 実験の結果, 4分野すべてにおいて90%以上の精度が得られ, べた書き文のかな漢字変換における本手法の有効性が確認された.
著者
荒木 健治 笹岡 久行 広重 真人 栃内 香次
出版者
北海道大学
雑誌
萌芽研究
巻号頁・発行日
2002

最終年度である平成15年度は平成14年度に行なった基礎実験に基づいて作成された実験システムを用いて性能評価実験とその結果明らかとなった問題点の改良を行なった.具体的には実環境下でビデオカメラを固定し,その手前に飼い主がいるという設定で限定された呼びかけに対するシステムの精度,使い勝手の評価を行なった.対象動物は猫である.評価基準としては「非常に満足,やや満足,やや不満,非常に不満.未応答」という5段階を用いた.実験の結果,総合では「非常に満足」が67.2%であるが,ユーザや対象動物に対するシステムの適応が進んでいない前半では「非常に満足」が46.9%であり,後半では87.5%と非常に高くなっている.このことは本手法の有効性を示しているものと考えられる.さらに,音声認識結果が誤りとなった場合のシステムの動作について考察したところ音声認識結果に誤りがある場合でも総合で「非常に満足」が49.3%であるが,後半だけでは73.5%となり音声認識誤りについても音声認識誤りを含む実例からのルールの獲得やフィードバック機能により正解となる場合が多く見られた.今回行なった改良は動物の動作の認識として動物の写っている画像においてその画像における動物の割合によって動物が現在どのくらい離れているのかを近距離,中距離,遠距離の3段階に評価を行い,動物が近づいて来たのか,そのままとどまっているのか,遠ざかったのかの判断を行なうという機能の追加である.本研究課題の研究機関である2年間において動物の行動とユーザの発話よりユーザの意図する動物の応答をシステムが代行できることの可能性が示された.また,そのようなシステムを使用することの有効性を性能評価実験により確認した.今後は本研究課題で達成された成果を基にさらに実用化に向けてシステムの改良を行なう予定である.
著者
木村 泰知 荒木 健治 桃内 佳雄 栃内 香次
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J84-D2, no.9, pp.2079-2091, 2001-09-01

本論文では対話例から学習を行う音声対話処理手法について述べる.多くの音声対話システムはあらかじめ生成規則やデータベースを与えて処理を行うタスク指向であり,日常対話における雑談などの様々な話題を処理することは難しい.本手法はシステムとユーザのやりとりを対話例として,遺伝的アルゴリズムを用いた帰納的学習によってシステム応答とユーザ発話を対としたルールの獲得を行う.あらかじめ学習データを必要とせず,実対話例から獲得したルールにより応答を試みる.そのため,動的なデータから学習を行うことができ,データによる偏りを少なくする.本論文では本手法の有効性を明らかにするために,雑談を対象とし,音声対話に拡張したELIZA型システムと本手法によるシステムとの比較実験及び,複数被験者による実験を行った.その結果,比較実験で正応答と準応答の合計の割合が66.3%から76.1%に向上したことと,実対話例から獲得したルールを用いて有効な応答を行うことを確認した.この9.8ポイントの向上という結果は本手法が雑談に対して有効であることを示している.
著者
荒木 健治 栃内 香次 永田 邦一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.28, no.4, pp.412-421, 1987-04-15
被引用文献数
6

べた書き文のかな漢字変換方式においては 計算機で文を分割する際に一般に極めて多数の候補が出現し それを一つに決定することが大きな問題となる.本論文は この問題に対して 他の語と重なりあうことなく確実に分離できる部分(キーワード)から順次 段階的に単語のあてはめを行う手法を提案し さらに本方式の前提となるキーワードの存在とその有効性を確認し その上で本方式を用いた実験システムを開発し その性能評価実験を特定専門分野の学術文献を対象に行った結果について述べたものである.本方式では 最初にキーワードを用いてべた書き文を分割し ついでそのキーワードによるあてはめの拡張を行い 以後カタカナ語のあてはめ 文節端の助詞候補の検出 連接情報を用いた単語のあてはめ 助詞候補の評価 接辞の処理 最後に一字漢字語のあてはめを行う.実験により500語程度のキーワードで平均3?4文字程度にべた書き文が分割できることがわかり 本方式によるべた書き文のかな漢字変換システムを開発した.さらに 工学に関する3分野の学術文献を資料として 性能評価実験を行った結果 90%以上の変換精度が得られることがわかり 本方式の有効性を示すことができた.