著者
社本 基宏
出版者
Waseda University
巻号頁・発行日
2004

データマイニングの研究分野の一つとして頻出パターン抽出問題がある.しかし,抽出される頻出パターン数も膨大になる可能性があるため,膨大な頻出パターンから有用な知識を発見しやすいように情報を絞り込んだ制約付き頻出パターン抽出手法が求められている.制約付き頻出パターン抽出手法とは,トランザクション内に出現する各アイテムが持つ数値を利用して,ユーザが指定した制約条件と最小サポート値を同時に満たした頻出パターンを抽出する方法である.本論文では,最小サポートを満たし,制約の計算値が上位となる頻出パターンをユーザに順次返す手法を提案する.従来手法の制約付き頻出パターン抽出の実行には3つの入力が必要であったが,提案手法の実行は,上位となる頻出パターンから抽出することにより,閾値の入力をユーザに求めず,「最小サポート」と「制約の種類」の2つのみの入力で可能にし,ユーザビリティの向上を実現した.