- 著者
-
近藤 公久
天野 成昭
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会技術研究報告. TL, 思考と言語 (ISSN:09135685)
- 巻号頁・発行日
- vol.100, no.335, pp.1-8, 2000-10-05
- 参考文献数
- 20
日本語の単語および文字の様々な特性値を集めたデータベース「日本語の語彙特性」を構築した。「日本語の語彙特性」の1-6巻[1, 2, 3, 4, 5, 6, ]には、新明解国語辞典[7]の見出し語約8万語に対する、単語親密度、単語表記の妥当性などと、JIS X 0208-1990[8]に規定される6, 847文字に対する、文字親密度、複雑度などが収録されている。また、「日本語の語彙特性」の7巻[9]には、1985年から1998年までの14年間に発行された朝日新聞中の単語および文字の出現頻度が収録されている。本稿では、本データベースに収録されている特性値の概略と特性間の関係を示すとともに、本データベースの有効性と問題点について述べる。