著者
黒崎 弘光 山口 和紀
出版者
情報処理学会
雑誌
研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.2, pp.1-7, 2010-09-09

近年大規模なコーパスを用いた統計的仮名漢字変換が注目されている.しかし,一般的な分野の辞書を用いると対象分野特有の単語において仮名漢字変換の変換精度は低下してしまう.変換対象の分野に応じた辞書を使うと、仮名漢字変換の精度が向上するが,そのためには変換対象の分野を推定する必要がある。HMM を用いて単語ごとの分野の推定を行うと単語に関連性がない場合推定した分野が大きく変動してしまう.先行研究では 10 単語単位で状態を変化させていたものもあるが,若干の精度の向上にとどまった.そこで本研究では HMM の構造で単語間の関連性を表現して各単語の分野を推定する方法を提案する.HMM で文章の分野を推定し,分野に適した辞書を用いることによる仮名漢字変換の変換精度を調べたところ,適応分野における変換精度が向上した。Statistical approach to Japanese input method is popular these days. But it is difficult to convert in a specific domain. We consider a state as a topic of sentences, and estimate the states with Hidden Markov Model. In this paper, we improve a structure of HMM, because it is difficult to estimate the topics with the basic structure of HMM. We made experimental evaluation on a task of Japanese input method and observed an improvement in the accuracy.
著者
山本 和英 中山 匠
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2010-NL-198, no.1, pp.1-7, 2010-09-09

日本語の動詞と形容詞はその形態によって明確に分類されている。ところが両者の意味を考えると一部の動詞は動作というよりも対象とする事物の状態を表現 (すなわち形容) していると見なしたほうが自然である。本稿ではこのような日本語の動詞と形容詞の分類の意味的ずれに着目し、新たな用言の分類 「形状性用言」 「作用性用言」 を提案する。まず動詞・形容詞という形態上の対比よりもより意味に近い形状性・作用性という分類が実用上有益であることを議論し、形状性用言の定義、及び辞書の作成に際しての検討課題を整理する。
著者
柴木 優美 永田 昌明 山本 和英
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2010-NL-198, no.3, pp.1-8, 2010-09-09

Wikipedia を利用し,人に関する大規模な is-a 関係のオントロジーを構築する手法を提案する.本手法では初めに,人を表すカテゴリを機械学習による分類器で判定し,Wikipedia の階層構造をそのまま利用して is-a 関係だけから構成される人のカテゴリ階層を構築する.その後,人を表すカテゴリが付与されている記事から,人を表す記事をインスタンスとして抽出する.機械学習では,カテゴリ名及びカテゴリの周辺の単語が,日本語語彙大系のインスタンスとどのようにマッチするかを素性にした.その結果,人を表すカテゴリを適合率 99.3%,再現率 98.4%,人を表すインスタンスを適合率 98.2%,再現率 98.6% で抽出することができた.