著者
尾崎 花奈 十河 泰弘
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022) (ISSN:27587347)
巻号頁・発行日
pp.4D3GS602, 2022 (Released:2022-07-11)

特許情報は、企業が技術潮流や競合他社の状況を把握する上で重要な情報である。特許の俯瞰解析は、着目する技術分野の特許集合のクラスタリングと可視化により、特許を俯瞰的に観察し、自社の位置づけや競合企業の動向の把握を支援する。各クラスタにおいては、クラスタラベルと呼ばれる代表的なキーワードをユーザに示すことで、クラスタ内の特許の技術的な特徴を捉えることが可能である。しかし、同一分野に属する特許集合をクラスタリングした場合、どのクラスタにも高頻度で出現する単語が存在するため、クラスタ内で高頻度の単語をラベルとすると、ラベルがクラスタ間で重複してしまうという課題があった。そこで本報告においては、特許文書中の複合語をラベルの対象として、他クラスタとラベルの重複を防ぐクラスタラベリング方法を提案する。実験において特許公報を対象とした評価を行い、本手法の有効性を確認した。