著者
佐野 智也 外山 勝彦 駒水 孝裕 増田 知子
出版者
デジタルアーカイブ学会
雑誌
デジタルアーカイブ学会誌 (ISSN:24329762)
巻号頁・発行日
vol.7, no.s2, pp.s142-s145, 2023 (Released:2023-10-20)
参考文献数
9

国家・社会制度に関する政策は、法令を通して制度化されるため、日本社会の動きは、法令情報を介して捉えることができる。本研究は、制定・改正などを通じた法令の連続的変遷を把握し、日本の国家・社会運営の長期的変化を調査するための研究基盤の確立を目指すものである。その最初の目標として、明治以降の全法令を検索可能なオープンデータベースシステムの構築を進めているが、現在、明治 19(1886)年から平成 29(2017)年までに公布された法律と勅令のXML文書化を完了し、それらの全文検索が可能なデータベースの構築を終えた。本報告では、既存のデータベースの問題点について述べた上で、構築したデータベースを説明する。
著者
山腰 貴大 小川 泰弘 駒水 孝裕 外山 勝彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.35, no.1, pp.H-J53_1-14, 2020-01-01 (Released:2020-01-01)
参考文献数
20
被引用文献数
3

We propose a method that assists legislation drafters in finding inappropriate use of Japanese legal terms and their corrections from Japanese statutory sentences. In particular, we focus on sets of similar legal terms whose usages are strictly defined in legislation drafting rules that have been established over the years. In this paper, we first define input and output of legal term correction task. We regard it as a special case of sentence completion test with multiple choices. Next, we describe a legal term correction method for Japanese statutory sentences. Our method predicts suitable legal terms using Random Forest classifiers. The classifiers in our method use adjacent words to a target legal term as input features, and are optimized in various parameters including the number of adjacent words to be used for each legal term set. We conduct an experiment using actual statutory sentences from 3,983 existing acts and cabinet orders that consist of approximately 47M words in total. As for legal term sets, we pick 27 sets from legislation drafting manuals. The experimental result shows that our method outperformed existing modern word prediction methods using neural language models and that each Random Forest classifier utilizes characteristics of its corresponding legal term set.
著者
小川 泰弘 佐藤 充晃 駒水 孝裕 外山 勝彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.4E2OS7a02, 2019 (Released:2019-06-01)

本研究の目標は,日本法令の要約を提供することである.そのためにランダムフォレストによる重要文抽出に基づく自動要約を提案する. 従来の自動要約に関する研究においては,原文書の情報のみが用いられてきた.近年では機械学習に基づく手法なども提案されている. しかし,そうした機械学習において利用される学習データの量は,特に日本語においては,充分でなかった. それに対し,本研究の法令の要約においては,政府が作成する「法令のあらまし」を利用することにより,この問題を解決する. さらに,従来利用されてきた決定木やSVMを使った手法に代えて,ランダムフォレストを用いた重要文抽出を提案し,その性能が従来手法を上回ることを示す. 本論文の貢献は,従来よりもサイズの大きな要約用コーパスを作成した点と,重要文抽出におけるランダムフォレストの有効性を確認した点にある.
著者
木村 優介 駒水 孝裕 波多野 賢治
雑誌
研究報告情報基礎とアクセス技術(IFAT) (ISSN:21888884)
巻号頁・発行日
vol.2022-IFAT-148, no.24, pp.1-6, 2022-09-02

深層学習を用いた文書分類は従来の手法と比べて高精度を達成してきた.文書分類は固有表現抽出とのマルチタスク学習によりその精度を向上させることが可能であると報告されている.単語に基づいた特徴量を基本とする手法において,意味のまとまりとしてのフレーズは文書分類の精度に寄与することが知られている.一方で,深層学習においてサブワードは一般的に使われているが,単語とは異なり,意味のまとまりを表すとは限らない.そのため,サブワードで構成されるフレーズを文書分類に応用する研究はされてこなかった.そこで,本研究では文書分類の精度向上を目的に,サブワードフレーズ抽出と文書分類のマルチタスク学習を行う文書分類フレームワークを提案する.従来の単語に基づくフレーズ抽出手法が出現頻度を用いてきた点に倣い,本稿では高頻度なサブワードのフレーズをサブワードフレーズとして定義し抽出する.
著者
駒水 孝裕 外山 勝彦 河口 信夫 佐野 智也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会第二種研究会資料 (ISSN:24365556)
巻号頁・発行日
vol.2022, no.SWO-057, pp.04, 2022-08-05 (Released:2022-08-10)

本稿では,法令間の関係を用いた法令検索について述べる.特に,モビリティに関連する法令を対象として,その検索方法および検索結果を示す.法令データのオープンデータ化は徐々に進みつつある.これまでに,法令オープンデータのハブとなる法令の Linked Open Data (LOD) としてのデータ化をはじめに,種々の法令文書,国会での会議録や議案に関するデータのオープン化が進められてきた.一方で,その応用については十分に研究されていない.本稿では,モビリティを題材に,関連する法令を検索する方法について示す.具体的には,法令に関する LOD から法令間の関係を抽出し,グラフにおける検索技術であるPersonalized PageRank を用いて,関連法令を検索する.この検索を通して,現状の法令オープンデータの限界を明らかにするとともに,今後の展開について議論する.
著者
山腰 貴大 駒水 孝裕 小川 泰弘 外山 勝彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.4P3OS805, 2020 (Released:2020-06-19)

法令文書には,「者」「物」「もの」や「規定」「規程」のように互いに類似している法令用語が出現する.このような法令用語は,法制執務(法令の起草・制定・改廃など法令文書の作成・管理に関する業務)の慣習や規則によって使用法とともに定義されている.法令において,これらの法令用語はそれに従い,厳密に書き分ける必要がある.契約書や約款などの広義の法令文書においても,誤解を防ぐために,法令に準じて正しく書き分けることが望ましい.そこで,本研究では,与えられた法令文から法令用語を検出し,誤用と思われるものに対してその修正案を出力することにより,法令文書の作成を支援する手法を提案する.本手法では,このタスクを選択肢付き穴埋め問題とみなし,分類器により解決する.分類器は,一般文によって事前学習したBERTモデルから構築する.このとき,(1)法令文によるドメイン適応,(2)訓練データのアンダーサンプリング,(3)分類器の統一の三つの工夫を施すことにより性能向上を図る.実験の結果,ランダムフォレストやニューラル言語モデルによる分類器よりも本手法の方が高い性能を発揮することを明らかにした.