著者
佐野 智也 外山 勝彦 駒水 孝裕 増田 知子
出版者
デジタルアーカイブ学会
雑誌
デジタルアーカイブ学会誌 (ISSN:24329762)
巻号頁・発行日
vol.7, no.s2, pp.s142-s145, 2023 (Released:2023-10-20)
参考文献数
9

国家・社会制度に関する政策は、法令を通して制度化されるため、日本社会の動きは、法令情報を介して捉えることができる。本研究は、制定・改正などを通じた法令の連続的変遷を把握し、日本の国家・社会運営の長期的変化を調査するための研究基盤の確立を目指すものである。その最初の目標として、明治以降の全法令を検索可能なオープンデータベースシステムの構築を進めているが、現在、明治 19(1886)年から平成 29(2017)年までに公布された法律と勅令のXML文書化を完了し、それらの全文検索が可能なデータベースの構築を終えた。本報告では、既存のデータベースの問題点について述べた上で、構築したデータベースを説明する。
著者
外山 勝彦 小川 泰弘 松原 茂樹 角田 篤泰 BENNETT F・GEROGE Jr. 松浦 好治
出版者
名古屋大学
雑誌
萌芽研究
巻号頁・発行日
2005

本研究は,計算機による法制執務支援システムの開発を目的とし,特に,膨大な数の法令文書の構造化により,法令改正に伴う法令統合作業の自動化,高度化,迅速化が可能であることを明らかにする.本年度は,法令自動統合システムの実現と検証に関して,次の研究を行った.1.法令文書用DTDの拡充前年度に引き続き,わが国の法令文書の構造化のための文書型定義(DTD)を拡充した.特に,表,改正規定など,法令文書中に出現する複雑な構造を定式化する手法を明らかにした.2.法令文書自動タグ付けツールの拡充前年度までに開発した法令文書自動タグ付けツールを拡充したDTDに対応させるとともに,スクリプト化により使い勝手を向上させた.3.法令自動統合システムの実現と検証法令自動統合システムのプロトタイプを開発した.また,同システムの動作検証のために,法律17本(改め節965,改正箇所4,355)の新規制定時バージョンから一部改正法令に従って自動統合を繰り返し,現行バージョンと比較する実験を実施したところ,原データの誤植に伴うエラー,文字列の置換において,置換箇所の前後の文脈に注意して実行しなければならない場合を除き,良好な結果を得た.4.構造化法令データの蓄積主要法令101本の日本語原文および英訳,および,昭和22〜23年に新規制定された法律約300本について,構造化法令データを作成,蓄積した.なお,前者の構造化には,上述のタグ付けツールを用いた.
著者
山腰 貴大 小川 泰弘 駒水 孝裕 外山 勝彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.35, no.1, pp.H-J53_1-14, 2020-01-01 (Released:2020-01-01)
参考文献数
20
被引用文献数
3

We propose a method that assists legislation drafters in finding inappropriate use of Japanese legal terms and their corrections from Japanese statutory sentences. In particular, we focus on sets of similar legal terms whose usages are strictly defined in legislation drafting rules that have been established over the years. In this paper, we first define input and output of legal term correction task. We regard it as a special case of sentence completion test with multiple choices. Next, we describe a legal term correction method for Japanese statutory sentences. Our method predicts suitable legal terms using Random Forest classifiers. The classifiers in our method use adjacent words to a target legal term as input features, and are optimized in various parameters including the number of adjacent words to be used for each legal term set. We conduct an experiment using actual statutory sentences from 3,983 existing acts and cabinet orders that consist of approximately 47M words in total. As for legal term sets, we pick 27 sets from legislation drafting manuals. The experimental result shows that our method outperformed existing modern word prediction methods using neural language models and that each Random Forest classifier utilizes characteristics of its corresponding legal term set.
著者
外山 勝彦 小川 泰弘 角田 篤泰 松浦 好治
出版者
名古屋大学
雑誌
基盤研究(B)
巻号頁・発行日
2011-04-01

本研究の目的は,法令文作成支援と法令英訳支援のために,法令のターミノロジーおよび翻訳メモリの構築と利用のための手法と環境を確立することである.研究の結果,戦後のすべての日本語法律からなるコーパス(法律10,067本),戦後占領期における文対応付き日英対訳法律コーパス(法律1,624本,日英対訳156,562文)),法令翻訳メモリ(法令259本,日英対訳147,119文)を構築した.また,チャンキングや文書出現頻度を用いて法令用語を抽出する手法,対訳文からの対訳語彙意味カテゴリ自動抽出手法,法令用語とその語義文や法令用語間の関係を抽出する手法などを開発した.
著者
渡邉 浩崇 養老 真一 外山 勝彦 小塚 荘一郎 佐藤 靖
出版者
大阪大学
雑誌
基盤研究(B)
巻号頁・発行日
2021-04-01

本研究は、「冷戦終結が日本宇宙政策にどのような影響を与えたか」を明らかにするために、政治外交史を主としながらも、国際法、科学技術史、法情報学などの学際融合的アプローチによって、冷戦期、冷戦終結前後、冷戦後の日本宇宙政策を再検証するものである。日米両国の一次資料(政府内部文書等)を徹底して収集・分析・整理することで、日本宇宙政策の歴史と資料の一つの総括を行う。その成果を発表・共有し発展させる場として、国際研究会を開催するとともに、収集資料の内容・属性や資料間の関係を分析・整理した「宇宙政策法文書データベース(リンクド・オープン・データ、LOD)」の構築と公開を試みる。
著者
小川 泰弘 佐藤 充晃 駒水 孝裕 外山 勝彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.4E2OS7a02, 2019 (Released:2019-06-01)

本研究の目標は,日本法令の要約を提供することである.そのためにランダムフォレストによる重要文抽出に基づく自動要約を提案する. 従来の自動要約に関する研究においては,原文書の情報のみが用いられてきた.近年では機械学習に基づく手法なども提案されている. しかし,そうした機械学習において利用される学習データの量は,特に日本語においては,充分でなかった. それに対し,本研究の法令の要約においては,政府が作成する「法令のあらまし」を利用することにより,この問題を解決する. さらに,従来利用されてきた決定木やSVMを使った手法に代えて,ランダムフォレストを用いた重要文抽出を提案し,その性能が従来手法を上回ることを示す. 本論文の貢献は,従来よりもサイズの大きな要約用コーパスを作成した点と,重要文抽出におけるランダムフォレストの有効性を確認した点にある.
著者
角田 篤泰 松浦 好治 外山 勝彦 小川 泰弘
出版者
名古屋大学
雑誌
基盤研究(A)
巻号頁・発行日
2012-04-01

e-Legislation(電子立法)の方法論の研究とこれに基づく支援システムの提供を行った。その結果として、条例・規則(=例規)のデータベース・システムを開発・提供し、全国の約半数の自治体で利用されるようになった。これによって自治体の立法作業に役立つことができた。このデータベースは我が国で初めての大規模な例規データベースであり、実際にその統計情報なども発表して、例規を定量分析できる学問的基盤を与えることにもなった。このシステムにはスーパーコンピュータを利用した例規分類機能や立法作業の支援機能も装備されている。さらに、この研究過程で法政策の形式的記述方法や定義条項の執筆方法論も提案した。
著者
外山 勝彦 小川 泰弘 大野 誠寛 中村 誠 角田 篤泰 松浦 好治
出版者
名古屋大学
雑誌
基盤研究(A)
巻号頁・発行日
2014-04-01

本研究の目的は,日本法の動きに関する情報を即時に,分かりやすく国際発信するための支援環境の構築である.特に,統計的機械翻訳の利用とターミノロジーの構築により,法令の要約である「法令のあらまし」の翻訳・理解・発信を支援する手法とその有効性を示す.本研究の結果,「法令のあらまし」に対する日英統計的機械翻訳手法と文書構造化手法,複単語表現対訳辞書の構築手法とそれを用いた統計的機械翻訳手法の開発,法令改正に伴う法令ターミノロジーの経時変化の抽出・可視化手法などを開発した.また,「英文官報」からの対訳法令用語2,750語の抽出や,現在有効な定義語6,890語からなる法令ターミノロジーの構築も行った.
著者
萩原 正人 小川 泰弘 外山 勝彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.26, no.3, pp.440-450, 2011 (Released:2011-04-01)
参考文献数
32
被引用文献数
1 1

Extraction of named entitiy classes and their relationships from large corpora often involves morphological analysis of target sentences and tends to suffer from out-of-vocabulary words. In this paper we propose a semantic category extraction algorithm called Monaka and its graph-based extention g-Monaka, both of which use character n-gram based patterns as context to directly extract semantically related instances from unsegmented Japanese text. These algorithms also use ``bidirectional adjacent constraints,'' which states that reliable instances should be placed in between reliable left and right context patterns, in order to improve proper segmentation. Monaka algorithms uses iterative induction of instaces and pattens similarly to the bootstrapping algorithm Espresso. The g-Monaka algorithm further formalizes the adjacency relation of character n-grams as a directed graph and applies von Neumann kernel and Laplacian kernel so that the negative effect of semantic draft, i.e., a phenomenon of semantically unrelated general instances being extracted, is reduced. The experiments show that g-Monaka substantially increases the performance of semantic category acquisition compared to conventional methods, including distributional similarity, bootstrapping-based Espresso, and its graph-based extension g-Espresso, in terms of F-value of the NE category task from unsegmented Japanese newspaper articles.
著者
佐野 智也 外山 勝彦 増田 知子
出版者
デジタルアーカイブ学会
雑誌
デジタルアーカイブ学会誌 (ISSN:24329762)
巻号頁・発行日
vol.6, no.s3, pp.s226-s229, 2022 (Released:2022-11-02)
参考文献数
6
被引用文献数
1

「日本研究のための歴史情報」プロジェクトでは、明治以降の近代法体系に基づく全法令のオープンデータベースシステムの構築を目指している。その最初の作業として、日本国憲法施行以前の法律と勅令のデータベース化に取り組んでいる。日本政府の「e-Gov法令検索」は、データ利活用の観点から、法令標準XMLスキーマに従った現行法令のデータを提供している。本プロジェクトでも、共通規格として、このスキーマに準拠する方針である。しかし、このスキーマは、その策定時(2017年)において有効な法令の文書構造を記述できるように設計されたため、日本国憲法施行以前の法律や勅令に適合することは担保されていない。本報告は、明治19年から大正10年までの法律・勅令の文書構造を分析した結果をもとに、法令標準XMLスキーマに対して追加・変更が必要な事項と、同スキーマが対象としていない上諭の構造化に必要な事項を示す。
著者
駒水 孝裕 外山 勝彦 河口 信夫 佐野 智也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会第二種研究会資料 (ISSN:24365556)
巻号頁・発行日
vol.2022, no.SWO-057, pp.04, 2022-08-05 (Released:2022-08-10)

本稿では,法令間の関係を用いた法令検索について述べる.特に,モビリティに関連する法令を対象として,その検索方法および検索結果を示す.法令データのオープンデータ化は徐々に進みつつある.これまでに,法令オープンデータのハブとなる法令の Linked Open Data (LOD) としてのデータ化をはじめに,種々の法令文書,国会での会議録や議案に関するデータのオープン化が進められてきた.一方で,その応用については十分に研究されていない.本稿では,モビリティを題材に,関連する法令を検索する方法について示す.具体的には,法令に関する LOD から法令間の関係を抽出し,グラフにおける検索技術であるPersonalized PageRank を用いて,関連法令を検索する.この検索を通して,現状の法令オープンデータの限界を明らかにするとともに,今後の展開について議論する.
著者
山腰 貴大 駒水 孝裕 小川 泰弘 外山 勝彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.4P3OS805, 2020 (Released:2020-06-19)

法令文書には,「者」「物」「もの」や「規定」「規程」のように互いに類似している法令用語が出現する.このような法令用語は,法制執務(法令の起草・制定・改廃など法令文書の作成・管理に関する業務)の慣習や規則によって使用法とともに定義されている.法令において,これらの法令用語はそれに従い,厳密に書き分ける必要がある.契約書や約款などの広義の法令文書においても,誤解を防ぐために,法令に準じて正しく書き分けることが望ましい.そこで,本研究では,与えられた法令文から法令用語を検出し,誤用と思われるものに対してその修正案を出力することにより,法令文書の作成を支援する手法を提案する.本手法では,このタスクを選択肢付き穴埋め問題とみなし,分類器により解決する.分類器は,一般文によって事前学習したBERTモデルから構築する.このとき,(1)法令文によるドメイン適応,(2)訓練データのアンダーサンプリング,(3)分類器の統一の三つの工夫を施すことにより性能向上を図る.実験の結果,ランダムフォレストやニューラル言語モデルによる分類器よりも本手法の方が高い性能を発揮することを明らかにした.
著者
片桐 秀樹 河口 信夫 外山 勝彦 稲垣 康善
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告モバイルコンピューティングとユビキタス通信(MBL) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.110, pp.63-70, 1998-12-04
被引用文献数
5

我々はこれまでに,ユーザが携帯端末を持ち寄るだけで端末がお互いを認識し自律的にモバイルアドホックネットワークを構築する手法を提案してきた.しかし,従来の手法ではネットワーク構築中のトポロジの変更や通信エラーなどに対する考慮が十分ではなかった.本稿では,頑健なアドホックネットワークを構築する手法を提案する.本手法では,従来の手法に加えて,各端末が隣接ノードを発見する手続きを定期的に行い,ネットワーク構築中の動的なトポロジ変化に対応する.また,様々なイベントに対応することによって,通信エラーからの復帰処理を行う.We have proposed an autonomous communication protocol for an ad-hoc network. But we have supposed no dynamic change of the the network topology while mobile hosts construct a network, and no communication errors. In this paper, we propose a new approach that each mobile hosts autonomously deal with dyanmic changes of network topology by doing periodic discovery while constructing a network. It enables mobile hosts to recover from communication errors.
著者
松浦 好治 鈴木 賢 宇田川 幸則 樋口 範雄 BENNETT F. G. Jr. 姜 東局 岡 克彦 外山 勝彦 小川 泰弘 角田 篤泰 増田 知子 中村 誠 佐野 智也 SHEE Huey-Ling HWANG Ren-Hung DING Xiang-shun LEE Heejeoung
出版者
名古屋大学
雑誌
基盤研究(S)
巻号頁・発行日
2011-04-01

本研究は、日中韓台・漢字文化圏の法情報について、深い相互理解と比較法研究の推進を目的とし、次の成果を得た。法情報共有の環 境整備として、各国研究者と共同で、中韓台法令とその英訳の対訳約14万文、英文官報の画像と日英対訳約16万文を集積するとともに、4法域法令用語標準対訳辞書の項目候補約13,000語の検討を推進した。また、日本法令の機械翻訳や文書構造化の手法を開発した。一方、分かりやすい法情報の提供事例として韓国とEUを調査するとともに、特定分野の理解を促進する法情報パッケージLawPackの例を構築した。また、地方自治体例規約98万本を蓄積・横断検索するシステムeLenを開発した。
著者
萩原 正人 小川 泰弘 外山 勝彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.22, pp.71-78, 2005-03-11
参考文献数
16
被引用文献数
2

大規模コーパスから語の類似関係を得るためには,語の共起関係や文脈などの特徴を利用する方法が一般的である.しかし,語に関する表層的な特徴をそのまま用いる手法には,ノイズの混入やスパースネスなどの問題がある.本稿では,確率論・情報理論に基づく潜在意味モデルであるPLSIを用い,語の潜在意味を推定することによって名詞間の類似関係を求める.評価実験の結果,tf・idfやLSIなどの従来手法と比較してPLSIの性能が最も高く,シソーラス自動構築におけるPLSIの有用性を明らかにした.また,PLSIを類義語の自動獲得へ適用する際の様々な基礎的利用技術についても報告する.A common way to obtain synonym relationships from large corpora is to utilize the features such as cooccurrence and words' context. However, methods based on direct use of surface information concerning to words suffer from noises and sparseness. This paper describes how to utilize PLSI, which is a latent semantic model based on probability theory and information theory, to infer the meaning of words and obtain synonym relationships between nouns. An experiment has shown that PLSI achieves the best performance compared to conventional methods such as tf・idf and LSI, which shows the effectiveness of PLSI for automated construction of thesauri. Various useful techniques when applying PLSI to automatic acquisition of synonyms are also discussed.