著者
黒崎 弘光 山口 和紀
出版者
情報処理学会
雑誌
研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.2, pp.1-7, 2010-09-09

近年大規模なコーパスを用いた統計的仮名漢字変換が注目されている.しかし,一般的な分野の辞書を用いると対象分野特有の単語において仮名漢字変換の変換精度は低下してしまう.変換対象の分野に応じた辞書を使うと、仮名漢字変換の精度が向上するが,そのためには変換対象の分野を推定する必要がある。HMM を用いて単語ごとの分野の推定を行うと単語に関連性がない場合推定した分野が大きく変動してしまう.先行研究では 10 単語単位で状態を変化させていたものもあるが,若干の精度の向上にとどまった.そこで本研究では HMM の構造で単語間の関連性を表現して各単語の分野を推定する方法を提案する.HMM で文章の分野を推定し,分野に適した辞書を用いることによる仮名漢字変換の変換精度を調べたところ,適応分野における変換精度が向上した。Statistical approach to Japanese input method is popular these days. But it is difficult to convert in a specific domain. We consider a state as a topic of sentences, and estimate the states with Hidden Markov Model. In this paper, we improve a structure of HMM, because it is difficult to estimate the topics with the basic structure of HMM. We made experimental evaluation on a task of Japanese input method and observed an improvement in the accuracy.