著者
安藤 俊幸
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.52, no.1, pp.20-31, 2009 (Released:2009-04-01)
参考文献数
26
被引用文献数
3 2

近年,企業における特許情報活用の重要性はますます高まっている。膨大な特許情報の中からエンドユーザーにとって必要な情報を迅速に抽出することが求められている。テキストマイニングツールと統計解析言語Rを用いて下記2種類の特許情報の可視化を検討した。(1)類似度による特許公報群の解析・可視化,(2)発明者,特徴語のネットワーク分析。商用特許データベースの検索集合に本手法を適用することで特許情報の分析・評価支援や戦略的特許情報活用に応用できる。
著者
安藤 俊幸 桐山 勉
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第14回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.83-88, 2017 (Released:2017-11-01)
参考文献数
6

ニューラルネットワークを利用した機械学習を用いて効率的な特許調査方法を検討した。特に先行技術調査を念頭に特許検索競技大会2016の化学・医薬分野の問2(ガスバリア性包装用フィルム)を例題として選択しデータセットを作成して前半ではスクリーニング過程の再現率曲線に影響を与える要因を実験的に検討した。 後半はニューラルネットワークの機械学習を用いて単語の分散表現で文書の固定長ベクトルが得られるdoc2vecの学習モデルを使用して公報の類似度を計算する手法を検討した。その結果単語の出現頻度と出現順序を考慮したモデルPV-DMを使用すると非常によい類似度計算ができることがわかった。公報の類似度計算精度が向上すると特許調査において効率的なスクリーニングが可能となる。 本報で検討した分散表現ベクトル(doc2vecの出力ベクトル)を使用して各特許公報間の関係の可視化もできるので精度の高い動向調査に応用可能である。特許調査の精度を上げるには前処理の形態素解析による「分かち書き」が重要になる。
著者
平川 雅彦 安藤 俊幸
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第12回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.79-84, 2015 (Released:2015-12-04)
参考文献数
10

最近、自動ブレーキが軽自動車にも搭載されるようになってきた。そこで、自動ブレーキに関して日本国内での主要技術を調べ、中国国内と技術動向を比較するため、特許情報を活用し、テキストマイニングを用いて解析を実施した。自動ブレーキに用いられる特徴語の全体像をKHCoderの多次元尺度法で解析し、レーダなどによる障害物認知手段と速度関連のKWに特徴があることが分った。これらのKWと出願人の対応分析を特定のKWが指定できるMiningAssistantを用いて実施した。その結果、富士重工業とトヨタでは自動ブレーキに対する姿勢が異なることが判明した。富士重工業はアイサイトで象徴される前方障害物に対する制動制御を実施しピタリと止める技術を志向している。一方、トヨタでは自動運転の一部として制動制御を目指していた。中国国内では駐車場のパーキング用自動ブレーキ、坂道発進でのすべり下り防止用ブレーキなどが多く、これらを除き衝突防止の自動ブレーキに関する特許を抽出し解析した。一般的な特許が多く、特徴的な特許は少なかった。
著者
安藤 俊幸
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第20回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.43-48, 2023 (Released:2023-06-28)

近年、知財業務で機械学習をベースにした人工知能(AI)使用して、特許調査の効率化や洞察力を加味する取り組みが始まっている。既に複数のAI利用特許調査ツールが商用利用されている。最近、世界的にもChatGPTをはじめとした対話型AI(生成系AI)がポジティブ・ネガティブ両面で大変注目を集めている。インフォプロにもこれらの新しいAIツールへの対応が求められる。最初に特許調査の分野においてBERTとGPTの共通点と相違点、対話型AIの問題点等に関して具体的に事例を示す。次に商用のAI利用特許調査ツールと比較しながらBERT、GPTによる特許調査の効率化検討を行った。より具体的には特許文書の類似文書検索、分類、俯瞰可視化を検討した。調査目的に応じてBERT、GPT等の特徴を理解して使いこなすことが重要である。
著者
桐山 勉 安藤 俊幸
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.67, no.7, pp.340-349, 2017-07-01 (Released:2017-07-01)

人工知能の第三次ブームによりこの2~3年で巷の会話の中にでも頻繁に人工知能(AI)という言葉が聞くようになった。畳込み深層学習の進歩によりイメージネット大規模視覚認識コンテストの正解率が95%を超えた。更に,画像を見て言葉概念を理解する高度なレベルの研究が盛んになりつつある。AIの多方面への応用研究が急激に加速され,特許情報をその研究対象にすることに着目されるまでに至った。米国特許商標庁での先行技術調査への活用研究が盛んになって来た。プロバイダーでもその応用を特許情報サービスに活用しようと盛んになって来た。ここで,特集号にちなみ総論を纏める。
著者
安藤 俊幸
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第17回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.43-48, 2020 (Released:2020-06-19)

特許調査の上流工程である予備検索課程に特許調査と機械学習の観点から着目して自分でできる調査の効率化の基礎検討を行うものである。ブラックボックス化を避ける為にも特許調査は、最近のAIシステムに丸投げという方向性は目指さず、「人」が行うべきところと機械学習で行った方が良いところを仕分けする。性能評価方法の考え方は商用のシステムの性能評価にも応用可能である。特許調査の観点からは予備検索は調査範囲の確定と検索キー(特許分類、特徴キーワード)の抽出が重要である。検討対象としては過去にも検討を行い正解が分かっているガスバリア性フィルムの分野の問題を対象とした。機械学習の観点からは、文書のベクトル化手法としてBag of Word(BoW)モデル、TF・IDFモデル、分散表現ベクトルのモデルとしてAve-word2vec、doc2vec、Ave-fastTextを検討した。文書ベクトルのソースとして大別してテキスト(タイトル、要約、請求項)と特許分類(特にFターム)による文書ベクトルを作成・比較した。機械学習による文書分類の手法としてはXGBoost(eXtreme Gradient Boosting)パッケージを利用した。XGBoostの他に7種類の文書分類アルゴリズムを検討した。文書のベクトル化手法と文書分類モデルの性能は交差検証した。結果は概ねTF・IDF文書ベクトルを用いてXGBoostによる文書分類モデルが良い傾向を示した。
著者
西尾 潤 安藤 俊幸
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第16回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.37-42, 2019 (Released:2019-06-14)

特定技術分野における「特許請求の範囲」を入力文とし、人為的に分類ラベルを付与したデータセットを自作し、教師あり機械学習で文書分類を行うとき、機械学習モデルに入力する文書ベクトルの違いが精度に及ぼす影響について報告する。機械学習モデルは、TensorflowをバックエンドとするKerasで1次元CNNを使用するニューラルネットワークと、非線形SVMとを実装した。形態素解析はMeCabとsentencepieceとを比較検討した。また、入力ベクトルは辞書ID列をKerasのエンベッド層に入力する方法、形態素頻度情報、TF-IDF、Word2Vecによる分散表現のそれぞれをKerasの全結合層に入力する方法及びSVMに入力する方法を比較検討した。また、入力文字列の長さがが文書によってまちまちである点について着目し、文字列の後方をカットしたときの影響についても考察する。本検討はアジア特許情報研究会における2018年のワーキングである。
著者
安藤 俊幸 桐山 勉
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第16回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.31-36, 2019 (Released:2019-06-14)

ニューラルネットワークを利用した単語・文書の分散表現学習を用いて効率的な特許調査方法を検討した。特にSDI調査を念頭に約3000件のインクジェット関連特許を人手で分類付与した実験用データセットを作成して文書のベクトル化方法とその用途として次元圧縮による文書の俯瞰可視化、文書分類への応用、類義語の抽出支援を検討した。文書のベクトル化手法としてOneHotベクトルのBag of Word(BoW)モデル、TF・IDFモデル、分散表現ベクトルのモデルとしてAve-word2vec、doc2vec、SCDV(Sparse Composite Document Vectors)4)、Ave-fastText、fastText-SCDVを検討した。機械学習による文書分類の手法としてはBoostingとRandom Forestsを組み合わせて集団学習させるPython用XGBoost(eXtreme Gradient Boosting)パッケージを利用した。XGBoostの他に7種類の文書分類アルゴリズムを検討した。各モデルを交差検証した結果SCDVによる文書ベクトルを用いてXGBoostによる文書分類モデルが一番良かった。これは調査目的や調査の活用シーンに合わせて使えば十分特許調査実務に応用可能である。機械学習を用いて公報を文書分類する場合、教師データ(作成)を考慮した分類体系の設計が重要である。
著者
安藤 俊幸
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第13回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.139-144, 2016 (Released:2016-11-17)
参考文献数
17

機械学習を利用した効率的な特許調査方法を実務ベースに重きを置いて検討した。特に動向調査と先行技術調査への機械学習の応用に関して実務上どこまで使えるかを念頭に検討した。 機械学習を大別すると教師データなし学習と教師データあり学習がある。教師データなし学習の一つの技法としてクラスタリングがある。動向調査の一例として人工知能分野で全体の俯瞰可視化から技術動向を抽出する方向で行った。俯瞰可視化として特許公報間の類似度を用いたクラスタリング検討を行った。 教師データあり学習の先行技術調査への応用として即席麺の直近10年を母集団として検討した。教師データとして審査官が拒絶理由に採用した文献の中から拒絶理由の条文コードを利用して新規性(カテゴリーX文献)、進歩性(カテゴリーY文献)欠如に該当する文献を選択して使用した。 動向調査への応用は従来からよく行われている書誌事項の統計解析(パテントマップソフト等)と併用することで実務上十分に有用である。先行技術調査への応用検討では網羅性(再現率)は母集団を大きくして対応するとしても精度(適合率)と学習コスト上(教師データの準備、学習の手間等)課題があり詳細に報告する。
著者
安藤 俊幸 桐山 勉
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第11回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.31-36, 2014 (Released:2014-11-17)
参考文献数
12

特許調査においては調査目的により程度の差はあれ再現率(網羅性)重視で検索集合を作ることを前提としている。ただし再現率重視だとノイズは増加する。 本報告では再現率重視の検索集合からテキストマイニング手法を応用して適合率重視で抽出/ソートを行い、スクリーニングを支援する手法として下記検討を行った。(1)キーワードのネットワーク分析による重要語(特徴語)抽出(2)キーワードを用いて計算した公報の類似率によるネットワーク分析(3)適合率を重視した特許調査への応用 キーワード解析は iPS 細胞をテーマにして日・中文で比較検討した。中国特許公報より抽出したキーワードをネットワーク分析して重要な中国語キーワードセットを選択する。重要な中国語キーワードセットを用いることで検索集合の適合率向上に有用である。さらにダウンロード集合の類似率ソートを用いた手法を提案する。
著者
安藤 俊幸
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.52, no.1, pp.20-31, 2009
被引用文献数
1 2

近年,企業における特許情報活用の重要性はますます高まっている。膨大な特許情報の中からエンドユーザーにとって必要な情報を迅速に抽出することが求められている。テキストマイニングツールと統計解析言語Rを用いて下記2種類の特許情報の可視化を検討した。(1)類似度による特許公報群の解析・可視化,(2)発明者,特徴語のネットワーク分析。商用特許データベースの検索集合に本手法を適用することで特許情報の分析・評価支援や戦略的特許情報活用に応用できる。
著者
安藤 俊幸
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.72, no.7, pp.245-250, 2022-07-01 (Released:2022-07-01)

最近では知財情報業務への人工知能(AI: Artificial Intelligence)の適用も身近な存在になってきている。商用のAIを利用した特許調査ツールも複数登場している。ただ,これら商用のAI調査ツールをユーザーが使いこなす上で押さえておくべき基本事項や限界・課題も多いのも現実である。本報では,特許調査でのAI活用について,過去の概念検索の導入過程を振り返り,概念検索とAI検索との比較を,特許調査と機械学習の観点から特許調査システムのユーザーの立場として述べる。また,現在の深層学習(第3世代AI)の限界も指摘され,第4世代AIと言うべき提案もなされている。商用のAI利用特許調査システムにおいても,第4世代AIを目指すツールが出現しており注目している。
著者
安藤 俊幸
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第18回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.13-18, 2021 (Released:2021-06-21)

SDI特許調査への応用を目的に教師有りクラス分類について機械学習と特許調査の観点から調査の効率化の基礎検討を行った。SDI特許調査への応用として最初に人が査読/ノイズに仕分けた過去分の公報を教師データとして学習させ、新着公報を同様に2値分類させるタスクを想定し分類性能を検証した。SDI調査検討は、機械学習を組み込んでいる商用のAI利用特許調査ツール2種類とオープンソースソフトウエア(OSS)の機械学習ライブラリを使用した。検討対象として出願件数が多く、SDI調査事例として検証しやすい顔料系インクジェットインクの分野を対象とした。SDI調査結果の性能の指標として正解が分かっている集合の公開年毎の混同行列を集計して正解率、適合率、再現率、F値を算出した。結果は商用のAI利用特許調査ツール2種類とも適切に教師データを設定すれば概ね、正解率、再現率は80%を超え、適合率はさらに良い結果を示した。教師あり機械学習には良質な教師データの準備が重要である。
著者
安藤 俊幸
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.70, no.4, pp.203-207, 2020-04-01 (Released:2020-04-01)

特許等の調査業務にプログラミングを活用することで調査効率(精度)や網羅性(再現率)の向上が期待できる。本報ではDoc2Vecを用いて調査対象の特許文書集合を学習し,文書・単語ベクトルを求め,指定文書・単語に対し類似度の高い文書・単語を表示する手順を紹介する。文書ベクトルを次元圧縮して2次元表示して特許群の俯瞰可視化によるパテントマップ化も可能である。最近では有用なプログラミングライブラリがフリーで公開されていることも多くこれらのライブラリを使うと意外に簡単に各種調査業務の効率化が可能となる。プログラミングは参考になるサンプルプログラムを探してそれを改良するのが早道である。自分でできる特許調査のための一連のプログラムを説明する。
著者
平川 雅彦 安藤 俊幸
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第13回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.83-88, 2016 (Released:2016-11-17)
参考文献数
6

自動ブレーキの周辺技術を自動ブレーキの特許情報のテキストマイニングを用いて調べた。周辺技術は中心に位置する自動ブレーキより最も遠い所に位置し、その代表として歩行者認識技術を解析候補とし、特徴技術の抽出を行った。 始めに歩行者認識技術に関してその動向を技術間の距離を図化できる非計量多次元尺度法で調べた。対象物の認識技術では自動ブレーキでは表面化しなかったセミミリ波レーダが抽出でき、周辺技術も重要であると認識した。次に、歩行者認識を適切に分類すれば、その中に代表的な特徴語が現れると考え、分類方法を検討した。その結果、認識センサなど意味的分類が最適な分類で、その中に代表的な特徴語を抽出できた。また、分類できなかった残渣を非計量多次元尺度法で図化することにより、予測アルゴリズムの利用、歩行者の特徴点解析など萌芽的な特徴技術を見つけることができた。
著者
袁 方 小林 義典 安藤 俊幸
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第13回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.77-82, 2016 (Released:2016-11-17)
参考文献数
5

昨今、中国での特許出願件数は世界第一位に成長するとともに、在華企業による出願も顕著になり、かつ国内の市場規模も依然巨大であることから、中国特許に対する注目度は年々高くなってきている。 日本企業のみならず中国マーケットで事業を行う企業にとっては如何に効率的に膨大な特許情報を読み解くかが重要課題のひとつであり、そのソリューションのため「商用」も含め様々なツールの開発が加速されている。 本報では、それらの分析ツールの中から、中文テキストマイニング機能を有し、ランドスケープ図などの可視化機能を有するとともに、日文・英文での特許分析での実績があり、かつ中国語分析機能が追加された「KHCoder」にフォーカスし、その実務視点での利用可能性評価について論じる。 対比評価においては、既に全件内容を確認済みの中国特許を母集合として用い、精度、活用性等の観点で評価を行った。 またKHCoder等を用いて特定対象分野の特許に対して分析を行い、実務面でどのような分析ができるのかについて検討した結果について紹介する。特に1種類の分析ツールだけではなく、その組み合わせにより、より効果的な分析が出せないか、実務上有益な情報が引き出せないか、について検討した。
著者
高岡 恵理 安藤 俊幸
出版者
一般社団法人 情報科学技術協会
雑誌
情報プロフェッショナルシンポジウム予稿集 第12回情報プロフェッショナルシンポジウム
巻号頁・発行日
pp.67-71, 2015 (Released:2015-12-04)
参考文献数
10

特許公報間の技術の類似度を評価する手法として、発明の名称、要約、請求項等の文章情報をテキストマイニングし、切り出した用語の出現頻度、出現文書数から重み付けを行った上で公報間類似度を計算した。各公報間の類似度は非計量多次元尺度法により距離に換算し二次元空間にプロットする類似度マップを作成、評価した。 テスト集合に電動歯ブラシ関連公報を、用語の切り出しでは、専門用語(複数の名詞が結合した複合語)として抽出した場合と、形態素解析MeCabにて品詞単位で用語を抽出した場合とで比較したところ、形態素解析にて作成した公報間類似度マップの方が、目視判断に近い結果となった。これは、公報文内において使用される専門用語の揺れが、形態素単位で細かく分割したことで修正された為と考えられる。 目視による結果に近い類似度マップ作成手法について、用語の統制、特許分類の利用の観点等からも考察を進めたので報告する。