- 著者
-
前川 武
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
- 巻号頁・発行日
- vol.2007, no.78, pp.55-62, 2007-07-27
日本語の文献に関する研究においては、本文テキストのデータベース化と語彙索引の電子化が進めばさまざまな角度からの計量的分析が可能になる。古典文学の分野では、本文テキストのデータベース化は進んでいるが、索引の電子化は、なかなか進んでいないのが現状である。このような現状の中で、村田菜穂子氏は、古代語の形容詞と形容動詞について、単なる作品における語の出現度数、用例だけではなく、詳細な情報を付加した語彙表を作成し、様々な計量分析を行っている。今回、村田氏の作成したデータに基づき、中古の散文資料22作品について、その語彙の使用状況から作品間の類似度を測定する試みを行った。In the research on a Japanese document, if the computerization of a full text database and glossarial index advances, measurement analysis from various angles becomes possible. The computerization of the glossarial index is not advancing easily, though that of a full text database is advanced. In such a situation, Nahoko Murata makes the glossarial index of the adjective and the adjective verb of an ancient word, and is doing various analyses and consideration. I tried to measure a similar degree of 22 Old and Medieval prose works by using the data in the writing of Murata.