著者
位田 奨 松井 藤五郎
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022) (ISSN:27587347)
巻号頁・発行日
pp.1A5GS202, 2022 (Released:2022-07-11)

本研究では、複利型深層強化学習において、投資比率を最適化する方法と報酬の分散(リスク)を考慮して行動を習得する方法を提案する。現在、強化学習を金融取引に応用する研究が盛んに行われている。複利型強化学習は、利益率の複利効果を最大化する行動を習得することを目的とした強化学習の枠組みであり、パラメータとして投資比率が存在する。この投資比率を最適化することで利益率の複利効果を最大化できる。深層強化学習を複利型に拡張した研究が存在するが、その研究では投資比率が0以上1以下の範囲で適当な値に設定されており、利益率の複利効果を最大化することができない。そこで本研究では、複利型深層強化学習に投資比率を最適化するネットワークを追加する手法を提案する。また、複利型強化学習においては行動選択の際にリスクを考慮することができないという問題がある。そこで本研究では、報酬の分散をリスクとして考慮して行動を取得する方法を提案する。