著者
増田 知子 角田 篤泰 中村 誠 佐野 智也 小川 泰弘
出版者
名古屋大学
雑誌
挑戦的萌芽研究
巻号頁・発行日
2015-04-01

本研究は「昭和天皇実録」を用い、情報の抽出・加工を行うことで、天皇を頂点とする権威的秩序と明治期から戦後まで続いた寡頭政の変遷を分析することを目的とする。(a)宮内庁から入手したデータからテキストデータを作成し、拝謁者等の氏名・肩書の抽出を行った。結果、44322種類の肩書と人名のセットを抽出できた。出現回数の多い肩書を見ると、親王、内大臣、宮内大臣が上位に来ることがわかった。また、1941-44年について、人物ごとに月ごとの拝謁回数をグラフ化したところ、歴史的事件との相関関係が見いだせる可能性が高いとわかった。(b)(a)に関連し、『法律新聞』のデータ整備を行い検索データベースを完成させた。
著者
石田 壽一 小野 一隆 佐藤 芳治 小川 泰輝
出版者
公益社団法人 日本コンクリート工学会
雑誌
コンクリート工学 (ISSN:03871061)
巻号頁・発行日
vol.52, no.8, pp.659-665, 2014 (Released:2015-08-01)
参考文献数
1
被引用文献数
1

東日本大震災において被害を受けた東北大学青葉山キャンパスの3つの実験研究棟(約7500~10000m2)の建替え工事が進捗している。復興のビジョンとして掲げた災害に強いレジリエントキャンパスの構築に向け,新しい実験研究棟には基礎免震構造を採用するとともに省エネやBCPにも対応している。復興建物の計画概要および大規模災害からの復興過程における建設需要の偏在による設計・施工時の課題をレポートする。
著者
外山 勝彦 小川 泰弘 松原 茂樹 角田 篤泰 BENNETT F・GEROGE Jr. 松浦 好治
出版者
名古屋大学
雑誌
萌芽研究
巻号頁・発行日
2005

本研究は,計算機による法制執務支援システムの開発を目的とし,特に,膨大な数の法令文書の構造化により,法令改正に伴う法令統合作業の自動化,高度化,迅速化が可能であることを明らかにする.本年度は,法令自動統合システムの実現と検証に関して,次の研究を行った.1.法令文書用DTDの拡充前年度に引き続き,わが国の法令文書の構造化のための文書型定義(DTD)を拡充した.特に,表,改正規定など,法令文書中に出現する複雑な構造を定式化する手法を明らかにした.2.法令文書自動タグ付けツールの拡充前年度までに開発した法令文書自動タグ付けツールを拡充したDTDに対応させるとともに,スクリプト化により使い勝手を向上させた.3.法令自動統合システムの実現と検証法令自動統合システムのプロトタイプを開発した.また,同システムの動作検証のために,法律17本(改め節965,改正箇所4,355)の新規制定時バージョンから一部改正法令に従って自動統合を繰り返し,現行バージョンと比較する実験を実施したところ,原データの誤植に伴うエラー,文字列の置換において,置換箇所の前後の文脈に注意して実行しなければならない場合を除き,良好な結果を得た.4.構造化法令データの蓄積主要法令101本の日本語原文および英訳,および,昭和22〜23年に新規制定された法律約300本について,構造化法令データを作成,蓄積した.なお,前者の構造化には,上述のタグ付けツールを用いた.
著者
小川 泰寛
出版者
北海道大学大学院メディア・コミュニケーション研究院
雑誌
メディア・コミュニケーション研究 (ISSN:18825303)
巻号頁・発行日
vol.55, pp.1-38, 2009-03-25

We may be given to understand that the story of the three caskets in The Merchant of Venice has a remarkable affinity with a folk tale of marriage proposal involving difficult questions in which a beautiful princess puts riddles to a suitor who will lose his life on the spot in case he turns out to be incapable of solving them. While in the Shakespearean canon the initial portion of Pericles most exactly fits in with this motif, our story seems to be a disguised and yet impressive variation upon it. Considering that they are deprived of the opportunity of begetting legitimate heirs thereafter, the lifelong celibacy to which Portia subjects unsuccessful suitors corresponds, in a symbolic way, to the deadly disaster that awaits the losers of the game in the folk tale as well as in the Shakespearean romance. The supposedly puzzling inscriptions attached to the caskets manifest themselves as difficult questions in the tale of marriage proposal in question. Each suitor actually addresses himself to deciphering them one by one. What is crucial with this schematized picture is that riddling is latent in the controversial episode of a song about "fancy" being sung. As is notorious, only Bassanio, the hero of this story, with whom Portia has fallen in love at first sight, is blessed with this vitally important musical design. By appropriately taking the cue offered in the shape of a sort of a riddle, he succeeds in choosing the correct casket. Portia proves inventive enough to solve her own dilemma where her desire to break the rule of the game and her absolute obligation to follow it clash with each other. Since she did not directly inform Bassanio of the correct casket, she is no way to blame. Riddling functioned as a clever stratagem to circumvent the strange will of the late lord of Belmont. At any rate, Bassanio wins, growing aware of the entrapping danger of deceptive. ornament, which ironically enough, he assumes himself, masquerading as something of a prince, while he is in actuality financially nothing, even less than nothing, as he has avowed to Portia. This nothing will organically relate to the nothing to which Antonio, his benefactor is to be financially brought, causing the pound of flesh court to be held.
著者
山腰 貴大 小川 泰弘 駒水 孝裕 外山 勝彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.35, no.1, pp.H-J53_1-14, 2020-01-01 (Released:2020-01-01)
参考文献数
20
被引用文献数
3

We propose a method that assists legislation drafters in finding inappropriate use of Japanese legal terms and their corrections from Japanese statutory sentences. In particular, we focus on sets of similar legal terms whose usages are strictly defined in legislation drafting rules that have been established over the years. In this paper, we first define input and output of legal term correction task. We regard it as a special case of sentence completion test with multiple choices. Next, we describe a legal term correction method for Japanese statutory sentences. Our method predicts suitable legal terms using Random Forest classifiers. The classifiers in our method use adjacent words to a target legal term as input features, and are optimized in various parameters including the number of adjacent words to be used for each legal term set. We conduct an experiment using actual statutory sentences from 3,983 existing acts and cabinet orders that consist of approximately 47M words in total. As for legal term sets, we pick 27 sets from legislation drafting manuals. The experimental result shows that our method outperformed existing modern word prediction methods using neural language models and that each Random Forest classifier utilizes characteristics of its corresponding legal term set.
著者
外山 勝彦 小川 泰弘 角田 篤泰 松浦 好治
出版者
名古屋大学
雑誌
基盤研究(B)
巻号頁・発行日
2011-04-01

本研究の目的は,法令文作成支援と法令英訳支援のために,法令のターミノロジーおよび翻訳メモリの構築と利用のための手法と環境を確立することである.研究の結果,戦後のすべての日本語法律からなるコーパス(法律10,067本),戦後占領期における文対応付き日英対訳法律コーパス(法律1,624本,日英対訳156,562文)),法令翻訳メモリ(法令259本,日英対訳147,119文)を構築した.また,チャンキングや文書出現頻度を用いて法令用語を抽出する手法,対訳文からの対訳語彙意味カテゴリ自動抽出手法,法令用語とその語義文や法令用語間の関係を抽出する手法などを開発した.
著者
小川 泰弘 稲垣 康善 ムフタル・マフスット
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1996, no.114(1996-NL-116), pp.7-12, 1996-11-18

日本語の膠着言語の性質と音韻論的性質に注目した清瀬の派生文法では、活用という考え方を用いないで動詞接尾辞を考えることにより、動詞語形の形成を単純かつ体系的に取り扱うことを可能としている。本稿では、派生文法に基づく日本語形態素解析法を提案し、不規則動詞を含む各種の動詞語形の変化を簡単に解析できることを示す。また従来異形態の登録で対処されてきた音便形に対して、後方からの検索と子音の補完により余分な辞書登録をしないで解析する手法を提案し、その有効性を示す。
著者
木谷強 小川 泰嗣 石川 徹也 木本 晴夫 中渡瀬 秀一 芥子 育雄 豊浦 潤 福島 俊一 松井 くにお 上田 良寛 酒井 哲也 徳永 健伸 鶴岡 弘 安形 輝
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.2, pp.15-22, 1998-01-19
被引用文献数
33

日本語情報検索システム評価用テストコレクションBMIR-J2は、情報処理学会データベースシステム研究会内のワーキンググループによって作成されている。BMIR-J2は1998年3月から配布される予定であるが、これに先立ち、テスト版としてBMIR-J2が1996年3月からモニタ公開された。J1は50箇所のモニタに配布され、多数の研究成果が発表されている。BMIR-J2では、J1に対するモニタユーザからのアンケートの回答と、作成にあたったワーキングループメンバの経験をもとに、テストコレクションの検索対象テキスト数を大幅に増やし、検索要求と適合性判定基準も見直した。本論文では、BMIR-J2の内容とその作成手順、および今後の課題について述べる。BMIR-J2, a test collection for evaluation of Japanese information retrieval systems to be released in March 1998, has been developed by a working group under the Special Interest Group on Database Systems in Information Processing Society of Japan. Since March 1996, a preliminary version called BMIR-J1 has been distributed to fifty sites and used in many research projects. Based on comments from the BMIR-J1 users and our experience, we have enlarged the collection size and revised search queries and relevance assessments in BMIR-J2. In this paper, we describe BMIR-J2 and its development process, and discuss issues to be considered for improving BMIR-J2 further.
著者
小川 泰嗣 喜連川 優
雑誌
全国大会講演論文集
巻号頁・発行日
vol.39, pp.1110-1111, 1989-10-16

本論文では、スーパーデータベースコンピュータ(SDC)における結合演算の並列実行法を検討する。SDCは複数のCPUが密結合した処理モジュールを相互結合網により疎結合したハイブリッドアーキテクチャを採用した並列ベータベースマシンである。相互結合網には図1のようなオメガネットワークを用いる。また、各リレーションは水平分割され複数の処理モジュールのディスクに格納される。関係データベースの処理のなかで負荷の重い結合演算に対してハッシュを用いたアルゴリズムが有効であることが知られている。ハッシュ結合演算法では、バケットを処理するモジュールを静的に割り当て、バケットをそのバケットに割り当てられたモジュールに集中して格納すること(バケット集中方式)で簡単に並列処理が実現できる。しかし、データ分布が不均一な場合に各処理モジュールの処理負荷も不均一となるため処理の並列度が低下し、データ分布が均一な場合程の性能が期待できない。これに対し、本論文で提案するバケット分散方式では、各バケットを処理モジュールに分散格納し、各バケットを処理モジュールをデータ分布に基づいて動的に割り当てる。そのためデータ分布が不均一な場合でも各処理モジュールの負荷を等しくするように調整することができ、効率的処理が実現される。以下、2章で従来からの方式であるバケット集中方式の問題点を指摘し、3章でバケット分散方式を提案する。4章でシミュレーションによる性能予測の結果を示し、5章で全体をまとめる。
著者
小川 泰
出版者
物性研究刊行会
雑誌
物性研究 (ISSN:05272997)
巻号頁・発行日
vol.51, no.1, pp.A110-A125, 1988-10-20

この論文は国立情報学研究所の電子図書館事業により電子化されました。
著者
小川 泰弘
出版者
Osaka Prefecture University (大阪府立大学)
巻号頁・発行日
2020-03-31

学位記番号:論保第42号, 指導教員:高畑 進一
著者
小川 泰弘 佐藤 充晃 駒水 孝裕 外山 勝彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.4E2OS7a02, 2019 (Released:2019-06-01)

本研究の目標は,日本法令の要約を提供することである.そのためにランダムフォレストによる重要文抽出に基づく自動要約を提案する. 従来の自動要約に関する研究においては,原文書の情報のみが用いられてきた.近年では機械学習に基づく手法なども提案されている. しかし,そうした機械学習において利用される学習データの量は,特に日本語においては,充分でなかった. それに対し,本研究の法令の要約においては,政府が作成する「法令のあらまし」を利用することにより,この問題を解決する. さらに,従来利用されてきた決定木やSVMを使った手法に代えて,ランダムフォレストを用いた重要文抽出を提案し,その性能が従来手法を上回ることを示す. 本論文の貢献は,従来よりもサイズの大きな要約用コーパスを作成した点と,重要文抽出におけるランダムフォレストの有効性を確認した点にある.
著者
角田 篤泰 松浦 好治 外山 勝彦 小川 泰弘
出版者
名古屋大学
雑誌
基盤研究(A)
巻号頁・発行日
2012-04-01

e-Legislation(電子立法)の方法論の研究とこれに基づく支援システムの提供を行った。その結果として、条例・規則(=例規)のデータベース・システムを開発・提供し、全国の約半数の自治体で利用されるようになった。これによって自治体の立法作業に役立つことができた。このデータベースは我が国で初めての大規模な例規データベースであり、実際にその統計情報なども発表して、例規を定量分析できる学問的基盤を与えることにもなった。このシステムにはスーパーコンピュータを利用した例規分類機能や立法作業の支援機能も装備されている。さらに、この研究過程で法政策の形式的記述方法や定義条項の執筆方法論も提案した。
著者
外山 勝彦 小川 泰弘 大野 誠寛 中村 誠 角田 篤泰 松浦 好治
出版者
名古屋大学
雑誌
基盤研究(A)
巻号頁・発行日
2014-04-01

本研究の目的は,日本法の動きに関する情報を即時に,分かりやすく国際発信するための支援環境の構築である.特に,統計的機械翻訳の利用とターミノロジーの構築により,法令の要約である「法令のあらまし」の翻訳・理解・発信を支援する手法とその有効性を示す.本研究の結果,「法令のあらまし」に対する日英統計的機械翻訳手法と文書構造化手法,複単語表現対訳辞書の構築手法とそれを用いた統計的機械翻訳手法の開発,法令改正に伴う法令ターミノロジーの経時変化の抽出・可視化手法などを開発した.また,「英文官報」からの対訳法令用語2,750語の抽出や,現在有効な定義語6,890語からなる法令ターミノロジーの構築も行った.
著者
萩原 正人 小川 泰弘 外山 勝彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.26, no.3, pp.440-450, 2011 (Released:2011-04-01)
参考文献数
32
被引用文献数
1 1

Extraction of named entitiy classes and their relationships from large corpora often involves morphological analysis of target sentences and tends to suffer from out-of-vocabulary words. In this paper we propose a semantic category extraction algorithm called Monaka and its graph-based extention g-Monaka, both of which use character n-gram based patterns as context to directly extract semantically related instances from unsegmented Japanese text. These algorithms also use ``bidirectional adjacent constraints,'' which states that reliable instances should be placed in between reliable left and right context patterns, in order to improve proper segmentation. Monaka algorithms uses iterative induction of instaces and pattens similarly to the bootstrapping algorithm Espresso. The g-Monaka algorithm further formalizes the adjacency relation of character n-grams as a directed graph and applies von Neumann kernel and Laplacian kernel so that the negative effect of semantic draft, i.e., a phenomenon of semantically unrelated general instances being extracted, is reduced. The experiments show that g-Monaka substantially increases the performance of semantic category acquisition compared to conventional methods, including distributional similarity, bootstrapping-based Espresso, and its graph-based extension g-Espresso, in terms of F-value of the NE category task from unsegmented Japanese newspaper articles.
著者
小川 泰弘
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.16, no.6, 2001-11-01

本論文は, 膠着語の特徴に着目した派生文法を利用することによる日本語形態素解析処理および, 日本語-ウイグル語機械翻訳について論じたものであり, 6章よりなる.第1章の「まえがき」に続き, 第2章の「日本語文法概説」では, 日本語文法について, 動詞の活用の扱い方を中心に簡単に紹介する.特に従来の学校文法の問題点を指摘するとともに, Bloch, 寺村の文法および清瀬の派生文法について比較しながら説明する.第3章の「派生文法に基づく形態素解析」では, 本研究で開発した日本語形態素解析システムMAJOについて述べる.MAJOは, 派生文法の特徴を活かすことで, 従来よりも文法規則が単純な解析を実現している.また, EDRコーパスを用いた形態素解析実験を通じて, MAJOの性能を評価している.第4章の「派生文法に基づく日本語動詞句のウイグル語への翻訳」では, 日本語-ウイグル語機械翻訳における動詞句の逐語翻訳について, まず日本語一ウイグル語機械翻訳における派生文法の有用性について述べ, さらに単純な逐語訳では不自然な訳になる場合への対処法を示す.第5章の「形態素解析支援可視化と機械翻訳における訳語選択への応用」では, 本研究で開発した形態素解析の結果を可視化するシステムを示すとともに, それが日本語-ウイグル語機械翻訳における訳語選択にも応用可能であることを示す.量後に第6章で本論文のまとめと, 残された課題, 将来への展望について述べる.
著者
石山 大三 小川 泰正 広瀬 和世 武田 知己 中村 晋作 若狭 幸 オセニェング オラオツェ ステバノビッチ ゾラン
出版者
一般社団法人 資源・素材学会
雑誌
Journal of MMIJ (ISSN:18816118)
巻号頁・発行日
vol.139, no.2_3, pp.10-20, 2023-03-31 (Released:2023-03-31)
参考文献数
15

In the study area of eastern Serbia, which includes the Bor and Maidenpek mining areas of the Republic of Serbia, a research of environmental evaluation of the study area was carried out by means of field survey for environment and satellite image analysis in order to establish and improve methods for assessing the environmental impact of mining areas by satellite image analysis. The results of this study showed that it was possible to efficiently determine the distribution of overburdens and tailings in a wide area based on the distribution of points having jarosite spectra, and that it was possible to distinguish waste rocks such as overburdens and tailings with high environmental impact from those waste rocks with relatively low environmental impact based on the mineral assemblage of the waste rocks estimated from satellite image analysis. In addition, if topographical data before and after mining development are obtained from the satellite image analysis, the volume of the waste rocks can be estimated, and the quantitative estimation of the amount of toxic elements dissolved from the waste rocks could be possible by combining the experimental data on the extraction of toxic elements from the waste rocks. In addition, the predicted hazardous area (Type I), where high concentration of Cu may be leached from the waste rocks revealed by the surface survey, corresponds to the area where waste rocks such as overburdens and tailings is distributed around the mine and the area where waste rocks such as tailing is distributed along the river downstream of the mine as estimated by the satellite image analysis. These results indicate that it is possible to predict the environmental impact in advance of the survey in the mining area, and to predict the environmental impact in the mining area where it is not possible to go directly to the survey and to consider guidelines for countermeasures.