- 著者
-
浅井 達哉
有村 博紀
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理 (ISSN:09151915)
- 巻号頁・発行日
- vol.87, no.2, pp.79-96, 2004-02-01
- 被引用文献数
-
15
最近,ウェブページやXMLデータなどの半構造データに対するデークマイニングが注目を集めている.本論文では,半構造データマイニングにおける主要な技術の一つである,グラフ構造データからの部分構造パターン発見技法について,主に木パターンマイニングとグラフマイニングの観点から,近年の研究動向を紹介する.はじめに,半構造データマイニングの萌芽期の研究として,Subdue及び,GBI,Nestrovらのスキーマ発見,DehaspeらのWarmrを紹介する.次に,木パターンとグラフパターンのマイニングに関する現在の研究動向を概観する.木パターンの発見アルゴリズムとして,浅井らのFREQTとUNOT,ZakiのTreeMiner.安部らのOPTTなどを説明し,一般のグラフマイニングアルゴリズムとして,猪口らのAGMとYanらのgSpanなどを説明する.最後に,新しいデークマイニングの方向性を示すものとして,半構造データストリームからのマイニングアルゴリズムStreamTについて述べる.