- 著者
-
養老 真一
- 出版者
- 大阪大学
- 雑誌
- 基盤研究(C)
- 巻号頁・発行日
- 2006
インターネット上で検索エンジンを利用すれば多くの法情報が得られるが、そこには多くの不要な情報(ノイズ)が含まれているのが現状である。これらから法情報のみを取り出し、さらに自動的にカテゴリーに分類し提供できれば、利用者の検索効率を上げることができるであろう。本研究では、Support Vector Machine(以下、SVM)と呼ばれる手法を使ってコンピュータによる法情報の自動分類を試み、これが効率的な法情報検索を支援する手段として利用できないか、検討した。まず、平成18年度において、研究に必要な実験を行うためのシステムの開発を行った。このシステムは分類さた、学習用のデータを用意しておけば、形態素解析、文書ベクトルの生成、SVMによる学習までを自動的に行う。学習結果に基づいて、文書が適切に分類されるかどうかについても、別途、判別用のデータを用意しておけば、学習結果に基づいて正解率を自動的に計算する。平成19年度は、実際に法情報の自動分類の実験を行なった。その結果は以下のとおりである。まず、一般の法情報以外の情報と法情報の分類実験をおこなった。具体的には一般の情報のサンプルとして新聞記事のデータを、法情報として判例や法令の情報を収集して実験をおこなった。その結果、かなりの精度で一般情報と法情報を分類することができた。この結果はインターネットから法情報のみを選択的に収集する可能性を開くものである。