- 著者
-
スルダノヴィッチ イレーナ
- 出版者
- 国立国語研究所
- 雑誌
- 国立国語研究所論集 (ISSN:2186134X)
- 巻号頁・発行日
- vol.6, pp.135-161, 2013-11
近年,日本語のコロケーション辞典など,コロケーションを記載したリソースも現れてきたが,現代日本語の大規模コーパスを用いた記述的コロケーションデータはまだない。また,直感と経験に基づいて作成された日本語教科書などの教育用の教材においても,コロケーションに関しては注目度が低い。そこで本稿では,「形容詞+名詞」の組み合わせによるコロケーションに焦点を当て,BCCWJ・JpTenTenという2つの現代日本語コーパスからコロケーションを取り出し,1)「形容詞と名詞のコロケーションデータ」,2)「日本語教育のための形容詞と名詞のコロケーション辞書」の2種のリソースの作成方法を提示し,「高い」を記述モデルの一例として日本語教育への応用方法を示すことを目的とする。1)の「形容詞と名詞のコロケーションデータ」は,500語の形容詞を対象にして,シンタクスを考慮に入れて抽出した名詞とのコロケーションおよびその前後文脈をコーパスごとに整理し,比較できるようにするものである。現時点では,100億語のコーパスJpTenTenから取り出した500語の形容詞とその名詞とのコロケーションデータ(23247語)を取り出すことができ,BCCWJからの抽出は進行中である。2)の「日本語教育のための形容詞と名詞のコロケーション辞書」は,すべての形容詞の62%をカバーする25語の基本的な形容詞について詳細に記述することを目指す。そこで,高頻度の形容詞「高い」を取り上げ,コロケーションデータの分析結果を提示し,前述の「形容詞と名詞のコロケーションデータ」を基にした「日本語教育のための形容詞と名詞のコロケーション辞書」の基盤作りを示す。能力レベルによって分類された辞書項目は,被修飾名詞の語彙マップを作成したり,ジャンルごとの特有な情報を併記したりして,学習者の学習困難なコロケーションに焦点を当てて記述する。最後に,これらのデータが示唆する様々な理論的・応用的研究の発展可能性について検討する。このような形容詞のコロケーションデータが整備されることにより,従来,日本語を対象としては作成されてこなかったデータを提供し,今後の日本語学の語彙と文法の研究や資料作成,および日本語教育用教材・シラバス作成のために資することが期待できる。