著者
谷本 啓 坂井 智哉 竹之内 高志 鹿島 久嗣
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第35回全国大会(2021)
巻号頁・発行日
pp.3G2GS2h03, 2021 (Released:2021-06-14)

どの介入行動がより良い結果につながるかを予測することは、意思決定支援システムの中心的な課題である。実環境での予測モデルを構築するためには、ランダム化比較試験(RCT)データがないため、サンプリングバイアスのある観測データからの学習に頼らざるを得ない。これに対するための近年の因果推論及び反事実機械学習では、薬を投与するかどうかなど二値の行動空間上の潜在アウトカムとその差、すなわち条件付き期待因果効果を推定することに注力している。しかし、本発表で示すように、大きな行動空間(個々の患者に対し適切な薬の組み合わせを選択するなど)になると、潜在アウトカムの回帰精度だけでは実用的にはもはや十分な意思決定性能を得ることができなくなる。提案する損失関数は、予測精度と同時に、個々の状況(患者)に対して過去の平均的な意思決定者(医者)の行動よりも相対的に良い行動であるかどうかの判別誤差を最小化することで、学習されたモデルに基づく意思決定性能を向上させる。半合成データセットで実験により、広い行動空間に対する提案法の優位性を実証する。