著者
岩間 太 中村 大賀 竹内 広宜
出版者
日本ソフトウェア科学会
雑誌
コンピュータ ソフトウェア (ISSN:02896540)
巻号頁・発行日
vol.29, no.4, pp.4_258-4_277, 2012-10-25 (Released:2012-11-25)

半形式的な記述や半構造的な自然文を含むテキスト文書のためのパーサーを形式言語/自然言語処理パーサーを組み合わて構築するためのシステムを提案する.特に,形式言語/自然言語処理パーサーを柔軟に組み合わせるためのパーサーコンビネータを設計することで,宣言的な文法記述からテキスト文書用のパーサーを作成するシステムを実現する.現状のパーサーコンビネーターは主にプログラミング言語用のパーサー構築を目的としており,自然文を含むテキスト文書のためのパーサーを構築するには不十分である.特に,既存の様々な自然言語処理パーサーは,形式言語のためのパーサーとは異なった性質をもっており,既存の枠組みでは柔軟に組合わせることが難しい.本論文では,自然言語処理パーサーと形式言語用のパーサーの組合せを可能にし,かつ,部分的なパージングや情報抽出部分の指定など,テキスト文書の処理において有用な機能を実現する演算子を含んだパーサーコンビネーターをParsing Expression Grammarsを基に設計する.また,導入したパーサーコンビネーターを用いて,宣言的な記述から,種々の自然言語処理を部分的に含むパーサーを自動生成するためのシステムを構築し,実際の適用例の一端を示す.このようなパーサーコンビネーションシステムはソフトウエア開発時に作成される文書成果物に対する解析に有用である.
著者
岩間 太 中村 大賀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告 : 信学技報 (ISSN:09135685)
巻号頁・発行日
vol.111, no.282, pp.67-72, 2011-11-10

要求・仕様書や設計書などの上流文書成果物に対応して計画・実施される統合・システムレベルのテスト設計では,コードを対象とした単体・結合レベルのテストに比べ自動化技術が進んでおらず効率面・品質面から問題となっている.このような状況を改善することを目的とし,我々は,上流文書成果物からのテストケース設計作業を自動化するための課題を整理し,それらを解決する手法を汎用的な枠組として提案したい.提案手法では,テストケースを定義する際に重要であり,かつ現実の多様な文書から取得することが可能な情報のモデルを実プロジェクトからの洞察をもとにまとめ,これを構造的なタグとして定義する.その上で,対象文書からの情報をRDF形式のデータとして抽出しRDFストアに一元的にまとめ,抽出されたRDFリソースデータに対して上記モデルで定義されたタグを付加する.その後,このタグ情報を用いて文書からテストケースを一様な手続きのもと生成する.本論文ではこの手法とその実装システム,実プロジェクトへの適用結果の概要を示す.
著者
竹内 広宜 中村 大賀 荻野 紫穂 水野 謙 岩間 太 鎌田 真由美
出版者
日本ソフトウェア科学会
雑誌
コンピュータ ソフトウェア (ISSN:02896540)
巻号頁・発行日
vol.30, no.1, pp.1_53-1_64, 2013-01-25 (Released:2013-03-25)

ソフトウェア開発プロジェクトにおいて文書成果物は重要な役割を担っている.一方,大規模なシステム構築プロジェクトでは様々な文書成果物が大量に作られ,人手による品質分析には限界がある.近年,開発プロジェクトで作成される文書成果物に対して,文書構造分析,文字列解析,自然言語処理といった技術を適用する研究が行われている.本論文では,これらの技術によって実現される文書成果物の分析と活用方法について概観する.