著者
吉村 衛 木村 文則 前田 亮
雑誌
じんもんこん2011論文集
巻号頁・発行日
vol.2011, no.8, pp.261-268, 2011-12-03

現在,日本語の古文に対して汎用的に用いることができる形態素解析器は存在しない.それゆえ日本語の古文に対しては,文章を単語に分割することさえ困難である.単語分割が行えるようになると,古文テキストの解析に役立てることができる.本論文では,日本語の古文の文章を単語に分割する手法を手案する.本手法では,文字Nグラムの単語らしさを評価し,この単語らしさが高い文字Nグラムを単語として文の単語への分割を行う.今回は,「源氏物語」に対し本手法の評価実験を行い,評価・考察を行う.

言及状況

Twitter (3 users, 3 posts, 1 favorites)

古文って自然言語処理できんのかなってふと気になってググッたら既にあったすげぇ https://t.co/hdgVluvJhS
(承前)Nグラムに基づく古文テキストの単語分割については http://t.co/CveNvbr8iL を、SVMを用いた固有表現抽出に関しては http://t.co/LRiFJFZ0oq を参照。 #jinmoncom

収集済み URL リスト