著者
成田 悠輔 矢田 紘平
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回 (2020)
巻号頁・発行日
pp.2I5GS205, 2020 (Released:2020-06-19)

機械学習を利用した意思決定を行う際、過去に使われたことのない新しい意思決定アルゴリズムの性能を予測したい場面が多々ある。私たちは、過去に使われたアルゴリズムの下で蓄積されたデータを用い、新たなアルゴリズムの評価を行う方法を提案する。この方法は次の観察に基づく。機械学習を利用して意思決定を行う場合、そこから生成されるデータには、選択がランダムに行われるA/Bテスト的状況が含まれるという観察だ。例えば、多くの確率的な強化学習・バンディットアルゴリズムは選択をランダムに行うため、ほとんどA/Bテストそのものである。また、教師付き学習で予測された何らかのスコアがある基準値を上回るかどうかで選択を変えるアルゴリズムを考える。この場合、基準値付近では、ほぼ同じ状況であるにもかかわらず異なった選択が行われるため、同じくA/Bテスト的状況とみなせる。私たちはこの観察を一般の機械学習アルゴリズムについて定式化し、アルゴリズムが自然に生成したデータを用いてアルゴリズムを改善する手法を提示する。この手法が使える場面は、ウェブ広告配信から裁判の判決や金融機関の審査、そしてデータ駆動教育・医療まで多岐にわたる。
著者
成田 悠輔
出版者
東京大学
雑誌
特別研究員奨励費
巻号頁・発行日
2011

交付申請書に記載した研究計画にほぼ沿った研究が進行している。この研究計画は「人々はそれぞれ異なった時点に生まれ死ぬため、社会的意思決定のための投票が行われる各時点で人々が持つ利害の規模は人それぞれに異なる。そのような状況を明示的に考慮した場合に動学的に望ましい投票制度は何か?」という問いを、世代重複モデル上の動学的投票制度の下で人々がプレイするゲームとして定式化・分析しようとするものである。今年度は人々のインセンティブや戦略的行動を捨象した場合に望ましいと考えられる投票制度を見つけるという予備的理論分析を予定している。この予備的理論分析はすでに終えつつあり、当初の研究計画通りの進捗であると考えている。また、当初の研究計画には含まれていなかった公立学校選択制の制度設計に関する新しい研究に着手し、論文"Promoting School Competition Through School Choice:A Market Design Approach"(小島武仁氏(Stanford大学助教授)、John William Hatfield氏(Stanford大学助教授)との共同研究)をまとめた。この研究は、公立学校選択制の制度選択が公立学校の自己改善インセンティブにもたらす影響を分析し、公立学校に自己改善による競争を促すような公立学校選択制の制度を提案するものである。この論文についてはすでに共著者の小島武仁氏が東京大学経済学部および公正取引委員会で招待講演を行っており、今年度中に英文国際学術誌に投稿する予定である。