著者
片山 久留美 小木曽 智信 中村 壮範
雑誌
じんもんこん2018論文集
巻号頁・発行日
vol.2018, pp.89-96, 2018-11-24

国立国語研究所で構築中の『日本語歴史コーパス』に『室町時代編Ⅱキリシタン資料』として『天草版平家物語』『天草版伊曽保物語』の2作品が追加された.これらの資料は原本がポルトガル式ローマ字により表記されており,当時の発音を知ることができる資料として日本語研究上重要な位置を占める.コーパス化にあたっては,ローマ字テキストと和文テキストを用意し両者をアラインメントにより対応付けることで二つのテキストを同時に参照可能にした.その際,仮の和文テキストを作成して形態素解析を行い,付与された形態論情報を利用することによって,均質性の高い独自の和文テキストを自動で出力したほか,ローマ字テキストと和文テキストのアラインメント作業も効率よく行うことが可能となった.
著者
片山 久留美
出版者
慶應義塾大学国文学研究室
雑誌
三田國文 (ISSN:02879204)
巻号頁・発行日
no.61, pp.82-66, 2016-12

1. 目的と方法 1.1 目的 1.2 『宝物集』について2. 各本の文体的特徴3. 表記上の特徴 3.1 全体の漢字表記率 3.2 機能語の表記 3.3 漢語の概念語の表記 3.4 和語の概念語の表記 3.5 小字表記とふりがな4. 結論