著者
田畑 文也
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第17回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.37-42, 2020 (Released:2020-06-19)

AI(人工知能)を用いて特許調査の効率化が検討されているが、なかなか思ったように精度が出ない場合も多い。本検討では、アイ・ピー・ファイン(株)のDESKBEE®を用いて、特許調査精度を向上させる手段を検討した。半導体薬液特許を母集団とし、フッ酸の有無で正解・ノイズと分け、どのようにすれば精度が向上するか調べた。今回の特徴量であるフッ酸について、同義語の用語統制を行ったが、まだ十分な精度が得られず、その原因が形態素解析起因の問題であると考えた。そこで、DESKBEEで用いられている形態素解析システム(MeCab)が、日本語処理において、アルファベットの文字列を一塊の文字列として処理する特性を利用して、フッ酸を“AAAA”などと、一塊のアルファベットの文字列に置き換え(カプセル化)、形態素解析起因の問題を回避し、劇的に精度を向上できることを見出した。また、特徴量の重み付けとして、カプセル化した“AAAA”を、“AAAA、BBBB” や “AAAA、BBBB、CCCC”などと、複数の形態素が近くに存在するような形に読点”、“で区切って連続させると、正解・ノイズの分離精度が上がり、特徴量を重み付けることができることを見出した。これらの精度向上方法は、DESKBEEだけでなく、いろいろなAI系ツールでも同様に使える可能性あるので、ここに報告する。

言及状況

外部データベース (DOI)

Twitter (1 users, 2 posts, 0 favorites)

INFOPRO2020Plus 1日目 Webにて開催中! 14:45より口頭発表②「特徴量のカプセル化と重み付けによる特許調査精度向上検討」が始まります。 発表者:⽥畑⽂也、座長:⼭中とも⼦ 予稿集はP37(https://t.co/4stfGWXknE)をご参照ください。(kh
INFOPRO2020予稿集 特徴量のカプセル化と重み付けによる特許調査精度向上検討: DESKBEEにおける形態素解析の問題回避と重み付け 田畑 文也 https://t.co/4stfGWXknE (kh

収集済み URL リスト