著者
吉村 衛 木村 文則 前田 亮
雑誌
じんもんこん2011論文集
巻号頁・発行日
vol.2011, no.8, pp.261-268, 2011-12-03

現在,日本語の古文に対して汎用的に用いることができる形態素解析器は存在しない.それゆえ日本語の古文に対しては,文章を単語に分割することさえ困難である.単語分割が行えるようになると,古文テキストの解析に役立てることができる.本論文では,日本語の古文の文章を単語に分割する手法を手案する.本手法では,文字Nグラムの単語らしさを評価し,この単語らしさが高い文字Nグラムを単語として文の単語への分割を行う.今回は,「源氏物語」に対し本手法の評価実験を行い,評価・考察を行う.