著者
Srdanović Irena Hodošček Bor Bekeš Andrej 仁科 喜久子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.16, no.4, pp.4_29-4_46, 2009 (Released:2011-07-28)
参考文献数
23
被引用文献数
1

日本語におけるモダリティ形式および推量副詞と文末モダリティ形式との共起についての体系的な研究は自然言語処理の分野において不十分である.さらに,このような情報は日本語教育の分野においても十分カバーされていない.本稿では,コーパス検索ツール Sketch Engine (SkE) を利用した日本語の推量副詞とモダリティ形式の遠隔共起の抽出を可能にすることとその日本語教育,特に日本語学習辞典への応用の可能性を示すことを目的とする.そのためにまず,複数のコーパスを分析した結果として,モダリティ形式とそのバリエーションの網羅的なリストを作成した.このモダリティ形式は ChaSen でどのように形態素解析されているかを調査し,各モダリティ形式の様々な形態素を新しいモダリティのタグとしてまとめることによって,ChaSen で形態素解析されている JpWaC という大規模ウェブコーパスから抽出した 2 千万語のサンプルへタグの再付与を行った.最後に,新しくタグ付けされたコーパスをコーパス検索ツール SkE に載せ,「文法関係ファイル」の内容を変更することで,推量副詞と文末モダリティの共起の抽出を可能にした.抽出された共起の結果は 93% 以上の精度で高く評価された.得られた結果は言語資源を利用しての日本語教育への応用の一例として,日本語教育における辞書編集をはじめ様々な教育資源の作成のために,あるいは教室における直接的に利用可能となることを示した.