著者
坪田 匡史 宮村 祐一 神津 友武
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.4Q3GS903, 2020 (Released:2020-06-19)

特許情報は企業の事業戦略の策定や提携先の模索等に有用であり、膨大な特許情報に基づいて技術動向把握を行なううえで、特許技術の俯瞰マップは不可欠なツールである。俯瞰マップ上では、各発明がベクトルとして、発明間の類似度がベクトル間の距離として、それぞれ表現される。従来、発明のベクトル表現化には、単語の出現頻度をベースとするTF-IDF法が広く用いられてきた。しかし、TF-IDF法は、単語間類似度を考慮することが難しく、比較的少数(1000件程度)の特許文献からなる分析対象母集団について、特許請求項を用いてマップ上でクラスタが形成されにくいという課題があった。 本研究では、特許請求項に基づく新規の類似発明判別タスクによってLSTMモデルを訓練し、訓練済みモデルから得られる発明のベクトル表現を俯瞰マップ作成に用いる。請求項中の単語は、類義語等の情報を考慮するため、明細書データなどから獲得した単語分散表現に変換したうえでモデルへのインプットとする。本稿では、上記手法により、1000件未満の比較的少数の特許文献からなる母集団について作成した俯瞰マップにおいても、技術クラスタが明確となることを確認する。