- 著者
-
槫松 理樹
- 出版者
- Japan Society for Fuzzy Theory and Intelligent Informatics
- 雑誌
- 知能と情報 (ISSN:13477986)
- 巻号頁・発行日
- vol.32, no.4, pp.778-781, 2020-08-15 (Released:2020-08-15)
- 参考文献数
- 9
本論文では,可読性の高い文書分類モデルを構築するためにラフセット理論を用いる手法を提案する.本手法では,縮約によって絞り込んだ語句を用い,上近似集合,下近似集合それぞれから抽出した決定ルールと新規文書を照合する.その際,成立した上近似集合からの決定ルールおよび下近似集合からの決定ルールの評価値の最大値の和が最大となる分類を推定結果とする.評価値としては,正確度SI,被覆度CI,リフト値を用いる.専門家の協力のもと,特許公報を題材とした検証の結果,専門家が納得できる決定ルールの抽出に成功するとともに,単純な分類方法よりも高い分類精度を示すことができた.しかし,専門家が納得できたルールは抽出したルールの約25%にとどまり,精度,Kappa係数ともまだ改善の余地がある.また比較対象としたナイーブベイズ分類に対する優位性を示すには至らなかった.今後の課題としては,実験結果を分析し,アルゴリズムを改善することが挙げられる.