著者
齋藤 裕明 古賀 久志 渡辺 俊典 横山 貴紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.106, no.97, pp.7-12, 2006-06-08
被引用文献数
1

木は半構造データや遺伝子情報など多様なオブジェクト表現に用いることが出来るデータ構造であり、パターン認識や情報検索を行う為には木間の類似度を求める技術が重要である。木間類似度としては、2つの木をノードの挿入、削除、置換によって一致させる際の木編集距離を非類似度とする方法がある。木編集距離は木の構造の類似性と内容(ラベル)の類似性を含む非類似度であるが,木データを分類する際、構造の類似性と内容の類似性のどちらを重視するかはアプリケーションやデータによって真なる。そこで本論文では、木編集距離を内容非類似度と構造非類似度の2つに分離し、適用対象の特徴やユーザーの目的を適切に反映するクラスタリング結果を得る方法を提案する。