著者
鈴木 誠史 臼杵 秀範 島村 徹也
出版者
放送大学
雑誌
放送教育開発センター研究紀要 (ISSN:09152210)
巻号頁・発行日
vol.12, pp.131-149, 1995

We frequently produce mispronunciation and hesitation in phonation. This paper analyzes the Japanese tongue twister in order to emphasize the effects of mispronunciation and hesitation. First, a statistical analysis of tongue twisters in phonation was carried out by employing phonemes, moras, and the place and manner of articulation. Next, the phonemes that occurred in mispronunciation and hesitation were surveyed by questioning to ten students. It was concluded that most hesitation and mispronunciation were made by articulating back vowels and front consonants. The results will assist in selecting words and sentences capable of speaking more fluently, as well as establishing speech synthesis by rule.
著者
趙 奇方 島村 徹也 高橋 淳一 鈴木 誠史
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 (ISSN:09135707)
巻号頁・発行日
vol.84, no.6, pp.745-758, 2001-06-01
被引用文献数
7

本論文では, 自己相関関数の雑音低減能力を利用し, 線形予測分析に基づくホルマント周波数抽出法の雑音耐性の改善を考える.自己相関関数は, 白色雑音が混入した音声信号に対して, 雑音成分を遅延の低い部分に集中させる性質がある.これを利用し, 音声信号の代わりにその自己相関関数をホルマント周波数の抽出に用いることにより, ホルマント周波数抽出の雑音耐性を改善することが可能であると考えられる.本論文では, まず自己相関関数からホルマント周波数を抽出するための原理を解析し, その問題点及び可能な解決策を詳細に検討する.そしてこれらの解析に基づき, 音声信号の自己相関関数に線形予測分析を施す提案法1を提案する.実験結果より, 提案法1を用いることによってクリーンな音声に対しては従来法と同程度の抽出精度が得られ, 雑音の混入した音声に対しては従来法より抽出精度が大幅に改善されることが確認される.しかし一方で, 強雑音環境下においては抽出精度が十分でない点も指摘し, その原因を解析した上で, 自己相関関数の引き算を利用する改善法を提案法2として提案する.実験結果は, SN比が15dB以下のとき, 提案法2ではホルマント周波数抽出誤差(Average Absolute Error)が従来法の3分の1程度に, また提案法1の2分の1程度に抑えられることを示す.
著者
新藤 義昭 松田 洋 鈴木 誠史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.8, pp.2782-2796, 2002-08-15
被引用文献数
6

情報処理演習室での質疑応答コミュニケーション用に開発したCyber Teaching Assistant(CTA)というCG-Animationシステムと,そのシナリオを記述するハイパーテキスト言語CPSL(Cyber Person Scenario Language)について述べる.CTAは,受講者からの質問が殺到したとき,人間型3DCGモデル(Cyber Person)を回答代行者としたCG-Animationを提示するシステムで,CPSL BrowserとCTA Starterで構成される.CPSL Browserは各々の受講者側PCで別個に動作する.CTAのシナリオはCPSLで記述し,ネットワークサーバに格納する.講師は受講者の画面を見て,CTAのシナリオで質問に回答できると判断したときは,シナリオを指定して質問者のCTAを遠隔起動する.CTAは,シナリオに従って必要な舞台や小道具を設定し,顔表情を変えたり体演技したりしながら台詞を音声合成で読み上げて質問に回答する.CPSLは,非専門家でも低コストでCG-Animationを制作できることを目標に開発したハイパーテキスト言語で,HTML言語に類似した文法と簡単な平文表記で制作できる.本論文では,CPSLの機能とCTAのシナリオの制作技法を述べ,従来の技法によるCG-Animationの制作コストとの比較実験を行いCPSLの有効性を確認した.This Paper describes CG-Animation system named Cyber Teaching Assistant (CTA), developed for new type communication between Teacher and Students in the Computer Seminar Room and Animation Scenario Language named CPSL (Cyber Person Scenario Language). CTA is a Cyber Person Animation system based on 3DCG technology, which includes CPSL Browser and CTA Starter. CPSL Browser is installed in each student's PC. CTA's Scenario files are written by CPSL and they are saved in the network file server. When teacher detects the student's question or help request and if student's difficult situation would be resolved by the CTA Scenario, he can start the CTA with appropriate scenario by using CTA Starter. CTA sets up the stage and properties and reads aloud the Japanese text by Voice Synthesizer with Facial Expression and plays specified body Action according to the Animation Scenario. CPSL is a Script Language similar to the HTML Language to produce the Animation Scenario by a low cost even for a non-expert. This paper describes a function of CPSL and production technique of a scenario of CTA. In addition, we did a comparison experiment with a production cost of CG Animation by conventional technique and confirmed the effectiveness of CPSL.
著者
鈴木 誠史
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.102, no.291, pp.25-30, 2002-08-22
参考文献数
29

筆者は、1955年に郵政省電波研究所(現独立行政法人通信総合研究所)に入所して、情報通信、音声情報処理の研究を始めた。これらの分野の黎明期であったため、限られた情報源から、広い関連分野を学びながらの実験的研究を進めた。音声研究を主としたが、その方向性は手探り状態だった。中田和男氏がMIT留学から帰国後、ホルマント合成方式の合成器を制作し、母音.半母音・子音の合成音による言語音知覚の実験を行った。引き続き、母音、数字語の認識装置を試作した。ハードウェアによる限界を知り、1960年頃からは、計算機処理による分析、認識を開始した。これらの研究は、研究法が定式化していない時代としては、正鵠を得ていたと思う。1965年頃には連続音声認識、神経回路による分析などを手がけた。FFTを導入するとともに基礎的研究を指向した。音声、通信、信号処理の境界領域のプロジェクト的研究も行った。ヘリウム音声の性質の解明.了解性改善、騒音や雑音で妨害された音声の品質向上などがあげられる。研究テーマが早すきたり、技術が追いつかなかったことも多い。ほとんどの研究が初めてチャレンジするもので、研究・開発に際しての考え方等は、今の研究者の参考になるであろう。
著者
吉尾 重治 趙 奇方 島村 徹也 鈴木 誠史
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 (ISSN:09135707)
巻号頁・発行日
vol.84, no.3, pp.436-440, 2001-03-01
被引用文献数
4

本論文では, 音声信号のピッチ周期/基本周波数の新しい推定法を提案する.スペクトルを波形とみなし, その周期を求めることにより基本周波数を算出する立場をとる.ケプストラム法及びその拡張法であるACLOS法がパワースペクトルの対数値を基本とするのに対し, 提案法はパワースペクトルの平方根及び4乗根を基本とする.実験結果は, 提案する方法が優れた耐雑音性を有することを示す.