- 著者
-
片山 久留美
小木曽 智信
中村 壮範
- 雑誌
- じんもんこん2018論文集
- 巻号頁・発行日
- vol.2018, pp.89-96, 2018-11-24
国立国語研究所で構築中の『日本語歴史コーパス』に『室町時代編Ⅱキリシタン資料』として『天草版平家物語』『天草版伊曽保物語』の2作品が追加された.これらの資料は原本がポルトガル式ローマ字により表記されており,当時の発音を知ることができる資料として日本語研究上重要な位置を占める.コーパス化にあたっては,ローマ字テキストと和文テキストを用意し両者をアラインメントにより対応付けることで二つのテキストを同時に参照可能にした.その際,仮の和文テキストを作成して形態素解析を行い,付与された形態論情報を利用することによって,均質性の高い独自の和文テキストを自動で出力したほか,ローマ字テキストと和文テキストのアラインメント作業も効率よく行うことが可能となった.