著者
良川 太河 山極 綾子 楊 添翔 後藤 正幸
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第35回全国大会(2021)
巻号頁・発行日
pp.3G1GS2g05, 2021 (Released:2021-06-14)

機械学習分野においてラベル分類の代表的な手法の一つである決定木は解釈性が高い識別器である.しかし過学習を起こしやすく,十分なデータ数がない場合予測精度が悪化する恐れがある.一方,アンサンブル識別器は過学習を防ぎ高い予測精度を示すが,複数の決定木を合成しているため解釈性が失われてしまう.そのため,アンサンブル識別器に近い予測性能を持つ単一の決定木を学習できれば,予測性能と解釈性を備えた有益なモデルとなる. そこで,学習データの生成により予測精度が高い単一の決定木を学習する手法が研究されている.その代表的な手法にBorn Again Treesがある.しかし,データ生成の際に膨大な計算量が必要となる上に,対象データの分布から外れたデータも多数生成してしまうため,学習した決定木が複雑になり解釈性が低下する恐れがある. そこで本研究では,生成モデルであるAutoencoderとオーバーサンプリング手法であるSMOTEを用いて対象データの分布に従うデータを少ない計算量で生成し,高い予測精度を持つシンプルな決定木の学習方法を提案する.最後に実データを用いた評価実験を行い,提案手法の有効性を示す.