著者
高岡 恵理 安藤 俊幸
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第12回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.67-71, 2015 (Released:2015-12-04)
参考文献数
10

特許公報間の技術の類似度を評価する手法として、発明の名称、要約、請求項等の文章情報をテキストマイニングし、切り出した用語の出現頻度、出現文書数から重み付けを行った上で公報間類似度を計算した。各公報間の類似度は非計量多次元尺度法により距離に換算し二次元空間にプロットする類似度マップを作成、評価した。 テスト集合に電動歯ブラシ関連公報を、用語の切り出しでは、専門用語(複数の名詞が結合した複合語)として抽出した場合と、形態素解析MeCabにて品詞単位で用語を抽出した場合とで比較したところ、形態素解析にて作成した公報間類似度マップの方が、目視判断に近い結果となった。これは、公報文内において使用される専門用語の揺れが、形態素単位で細かく分割したことで修正された為と考えられる。 目視による結果に近い類似度マップ作成手法について、用語の統制、特許分類の利用の観点等からも考察を進めたので報告する。