- 著者
-
岩間 太
中村 大賀
竹内 広宜
- 出版者
- 日本ソフトウェア科学会
- 雑誌
- コンピュータ ソフトウェア (ISSN:02896540)
- 巻号頁・発行日
- vol.29, no.4, pp.4_258-4_277, 2012-10-25 (Released:2012-11-25)
半形式的な記述や半構造的な自然文を含むテキスト文書のためのパーサーを形式言語/自然言語処理パーサーを組み合わて構築するためのシステムを提案する.特に,形式言語/自然言語処理パーサーを柔軟に組み合わせるためのパーサーコンビネータを設計することで,宣言的な文法記述からテキスト文書用のパーサーを作成するシステムを実現する.現状のパーサーコンビネーターは主にプログラミング言語用のパーサー構築を目的としており,自然文を含むテキスト文書のためのパーサーを構築するには不十分である.特に,既存の様々な自然言語処理パーサーは,形式言語のためのパーサーとは異なった性質をもっており,既存の枠組みでは柔軟に組合わせることが難しい.本論文では,自然言語処理パーサーと形式言語用のパーサーの組合せを可能にし,かつ,部分的なパージングや情報抽出部分の指定など,テキスト文書の処理において有用な機能を実現する演算子を含んだパーサーコンビネーターをParsing Expression Grammarsを基に設計する.また,導入したパーサーコンビネーターを用いて,宣言的な記述から,種々の自然言語処理を部分的に含むパーサーを自動生成するためのシステムを構築し,実際の適用例の一端を示す.このようなパーサーコンビネーションシステムはソフトウエア開発時に作成される文書成果物に対する解析に有用である.