- 著者
-
金 明哲
徳田 尚之
村上 征勝
田中 栄一
- 出版者
- 日本行動計量学会
- 雑誌
- 行動計量学 (ISSN:03855481)
- 巻号頁・発行日
- vol.19, no.1, pp.49-65, 1992-03-31 (Released:2010-06-28)
- 参考文献数
- 24
中国語の音声認識の機械処理を進める上で,中国語の計量的な性質を把握することは不可欠である.本論文ではSuen(1986)が中国語の高頻度単語として提唱している6,321語を用いて,中国語の音声認識を行う上で必要となるその音声学的性質について以下の項目にわたる計量分析を試みた.(1)声母,韻母,音素,声調の出現頻度(2)音節,音素を単位とした単語長 (3)音素を単位としたエントロピー,1次条件付きエントロピーおよび2次条件付きエントロピー (4)声母,韻母,音素を単位とした近距離単語数および声調,品詞が近距離単語数に与える影響 (5)声母,韻母,音素を単位とした置換対.その結果,例えば,声調や品詞情報が既知の場合でも一漢字単語では音素を単位としたレーベンシュタイン距離1の単語数は1単語あたり10.38語にものぼり,機械的な音声認識において単語単位での誤り訂正は極めて難しいが,二漢字単語では同じレーベンシュタイン距離1単語数は声調や品詞情報を考慮しなくとも1単語あたり平均約3語で,声調,品詞情報が既知であると1単語あたり0.26語まで減少するため,声調,品詞情報などを有効に利用することにより単語単位の誤り訂正が十分可能であると考えられるなど,今後中国語の音声認識などの機械処理を進める上で有益な幾つかの結果を得た.