- 著者
-
相澤 一美
上村 俊彦
望月 正道
投野 由紀夫
杉森 直樹
石川 慎一郎
- 出版者
- 東京電機大学
- 雑誌
- 基盤研究(B)
- 巻号頁・発行日
- 2004
本プロジェクトでは,3年間の研究期間内に,学習語彙表の作成と教材分析システムの構築を最終目標に掲げ,研究に邁進してきた。まず,前回作成したJACET8000を学習語彙表として検証し,その欠点を探ってきた。しかし,当初の予想以上にJACET8000の完成度が高いことがわかった。JACET8000の妥当性を検証した研究では,特に大きな問題点を発見することはできなかった。その結果を踏まえて,2年目途中から路線を転換し,検定教科書,口語,米語,児童英語に基づく4種類のサブコーパスを構築し,その中からJACET8000に漏れた語をsupplementとして提案することになった。しかし,時間的な制約に加えてsupplementの作成は,予想以上に困難な作業であった。新しく構築したサブコーパス・から,JACET8000をべースとした出現頻度順リストを作成した。非語,固有名詞等を排除した各リストを100万語換算で頻度補正した上で,4リストをマージしてレンジ値を取り,JACET8000のsupplement候補語636語を提案するに至った。以上のような軌道修正のため,教材分析システムを開発するという本プロジェクトの研究課題の一部が,未解決のまま残った。当面の間は,JACET8000とPlus250にもとついた清水氏作成のLevel Makerを代用することで対処したい。また,今回発表したSupplement636も,十分な検証が済んだわけではない。場合によっては,今回の候補語とJACET8000の語を統合して,リストを再構築することも視野に入れることも今後の課題として考えられる。