著者
新森 昭宏
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.21, no.1, 2006-01-01

特許の内容を記述する特許明細書で最も重要な箇所は, 特許請求項である.特許請求項は, 1文で発明内容を記述するという制約と, 独特の記述形式により, 専門家以外の人にとっては極めて読みにくいものになっている.本論文では, 特許請求項の可読性向上のための言語処理手法を提案している.特許文書は広大かつ多様な分野における新技術を扱っており, 部分言語の処理で多用される語彙的制約の利用が困難である.特許文書の言語処理は法律文の言語処理に近いとも考えられるが, 法律文は少数の専門家が作成するのに対して, 特許文書はより多くの専門家(弁理士や知的財産専門家)が作成するものであり, その性格が異なる.まず, 修辞構造理論(RST)の考え方を応用して, 手がかり句を用いた特許請求項の構造解析手法を提案している.記述スタイル分析に基づいて六つの関係を定義し, 定型的な表現を手がかり句として用い構造解析を行う手法を提案している.次に, 構造解析の結果を用いて, 特許請求項と「発明の詳細な説明」中の文を対応付けする手法を提案している.対応付けにより, 1)特許請求項の作用(機能)と効果を明確化する, 2)特許請求項の重要箇所を明確化する, 3)特許請求項中の表現の言換えを取得する, ことが可能になる.国立情報学研究所による「NTCIR3特許データコレクション」を用いて, 提案手法の評価を行い, その有効性を確認している.
著者
新森 昭宏 奥村 学
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 = Journal of natural language processing (ISSN:13407619)
巻号頁・発行日
vol.12, no.3, pp.111-128, 2005-07-10
参考文献数
16
被引用文献数
2 4

特許明細書には, 特許請求項と「発明の詳細な説明」が記述される.特許請求項は特許明細書において最も重要な部分であるが, 構成的または結合的に記述されるため, 可読性が低い.「発明の詳細な説明」と, 特許請求項を対応付けることにより, (1) 特許請求項に対する作用 (機能) と効果を明確化する, (2) 特許請求項の重要箇所を明確化する, (3) 特許請求項で使われている表現に関する言い換えを取得する, 等の効果が得られ, 特許請求項の読解支援につながる.本稿では, 特許請求項を構造解析し, その結果を用いて, 「用言文節を起点としたローカルアラインメント」を行うことにより, 「発明の詳細な説明」との対応付けを行う手法を提案する.NTCIR3の特許データコルクションからランダムに抽出した100件のうち88件の特許明細書を対象として評価を行い, その有効性を確認した.
著者
丸川 雄三 岩山 真 奥村 学 新森 昭宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.87, pp.23-28, 2002-09-17
被引用文献数
1

従来のDPマッチングでは難しかった交差の存在するテキスト間の対応付けを行う手法を提案する.提案手法の特徴は以下の二点である.まずはテキスト間における部分文字列同士のアラインメント,すなわちローカルアラインメントの概念と,その計算手法としてローカルアラインメントDPマッチングを導入した点であり,もう一点はローカルアラインメントの順位付けを行い,対応付けに利用した点である.前者の工夫により,DPマッチングの利点である類似度の最適化と計算量の削減を実現し,後者の工夫により,交差にも対応したテキスト間の柔軟な対応付けを実現した.提案手法の適用例として,公開特許公報全文における「請求項」と「発明の詳細な説明」との対応付けを紹介し,本手法の有効性を議論する.A method of aligning a text with another text, in which the partial alignments include crossovers and overlaps, is proposed. This method has the following two characteristics. One is to introduce the concept of the local alignment between sub-strings and use the dynamic programming to enumerate the possible local alignments. Another is to extract sub-optimal local alignments in addition to the optimal one. The former realizes efficient enumeration of local alignments and the latter realizes flexible text matching, where the partial alignments have crossovers and overlaps. We show an example of applying the method for finding alignments between "claims" and "embodiments" in a patent application, and discuss its effectiveness.