- 著者
-
山元 啓史
- 出版者
- 東京工業大学
- 雑誌
- 基盤研究(C)
- 巻号頁・発行日
- 2010-04-01
代表者は2007年に和歌用の形態素解析ツールを開発した。その解析対象は八代集に限定されていた。本研究では八代集の解析済みデータを用い、連接規則をコンピュータ処理で獲得し、それにより二十一代集の解析を実行し、品詞タグづけを行うことを目的とする。KyTea(京都大学KyTeaプロジェクト)とそれに付属する点推定連接規則学習システムにより、ノートブック程度のマシンであっても数十秒で学習モデルの生成ができた。これを用いて、二十一代集の単位切りを行ったところ、ほぼ96%の高い割合で解析ができた。未知語の入力と未知語周辺の連接規則の学習はまだ必要であるが、二十一代集の単位分割を行う辞書は完成した。