- 著者
-
CHEN HONG
- 出版者
- 電気通信大学
- 巻号頁・発行日
- 2020-03-25
グラフは複雑なシステムを記述する強力なツールとして,ソーシャルネットワーク分析,生物情報科学,化学情報科学などの多くの分野で幅広く使用されている.例えば,分子の生物活性を予測するなどのパターン認識がグラフ分類問題に帰着できる.しかし,グラフに適用する数学ツールが少ないため,グラフ分類問題は伝統的な機械学習のベクトル分類問題より難しい.そこで,グラフデータを既存の機械学習アルゴリズムに適用するために,グラフデータを数値特徴ベクトルに変換する技術が注目されいる.特に近年,ニューラルネットワークを用いたグラフの特徴ベクトル(分散表現とも呼ばれる)を学習する課題が盛んである. 近年提案されたニューラルネットワークを用いて,グラフの分散表現を獲得する手法ではノード特徴のみを活用し.エッジ特徴を扱えない手法が多い.そこで, 本研究では,エッジ特徴を用いてグラフの特徴ベクトルを改良することを目指す. 提案手法では,まずライングラフを用いて,元のグラフのエッジをノードに変換する.この操作により,元のグラフのエッジ特徴がライングラフのノード特徴となるため,ノード特徴しか取り扱えない手法を利用して,元のグラフのエッジ特徴を反映したグラフ分散表現を獲得する. この方針に基づき,ノード特徴のみを使う既存の2つのグラフ分散表現学習手法を改良した. 1つ目はGraph2vec である.Graph2vec はノードラベル付きのグラフ集合から,教師なしでグラフの分散表現を獲得する手法である.本論文では,まず従来手法Graph2vec の(1)エッジラベル情報を扱えないことと,(2)グラフ間構造の類似性が適切に表現できないという欠点を指摘して,それを対処するため,ライングラフを利用して補う手法 GL2vec を提案した. 2つ目は GIN(Graph Isomorphism Network)である.GIN はノード属性付きのグラフ集合から,教師ありでグラフの分散表現を獲得する.GIN はノード間で情報伝搬することによって,End-to-End で特徴ベクトル及び分類器を一気に学習させる.しかし,GIN もエッジの属性情報を使用していない.本論文では,ライングラフを用いて,GIN が生成するグラフの特徴ベクトルにエッジの特徴を補完できる手法GLIN を提案した. 実験によって,エッジ特徴とノード特徴両方とも考慮した提案法が従来法よりもグラフ分類性能を改善することを示した.上記の二つ改良例から,ノード属性しか扱えないグラフ分散表現学習のモデルの一族に対し,ライングラフはエッジ属性を活用できる有効なツールであることを確認できた.なお,エッジ特徴がグラフ分類タスクに役に立つことも確認できた.