shohei_botter (Twitter) - ユーザ詳細

ショウヘイ@エンジニア (@shohei_botter)

世界モデルの強化学習を開発するためのフレームワークとして、Pixyzなるものがあるそうなよく分からないが、とりえずメモ φ(=ω= ) https://t.co/CIoaMi0az0

ABCD-Forecast: 今朝の読書物として読解に挑戦「データセットに対して任意の関数変換をおこなって、N個のデータ拡張＆モデル学習をおこない、個々のモデルの出力値を逆関数変換して、アンサンブルする」という手法は斬新に思えた https://t.co/LnPJtmHTPx

強化学習における投資比率を最適化するための手法投資比率を算出するためのニューラルネットワークを特設しているらしく、学習を進めると、どうやらケリー基準で算出した値に近づくらしい

オラクル方策蒸留という手法による強化学習か教師役エージェントと異なる評価をおこなった場合に、生徒役エージェントに罰則を加える感じで、過学習を防ぎつつ正解の執行に近づけていく……って発想？ https://t.co/JZKKYG90u2

学会に発表する前（？）の論文の方には、機会損失の概念についての図があったから、こちらの方が意図は分かりやすいね https://t.co/7xDvwhakfK https://t.co/Y3evcRnY5d

複利型の強化学習という概念があるそうで取引で得た収益を複利運用することを前提にして、報酬式を改変している感じなんだ論文を読んだ感じでは、相対終値と相対標準偏差という特徴量を採用しているから、候補としてメモメモ https://t.co/ym7o3sF0Vn

[bot]シミュレーション系メモ https://t.co/cwaJzgNIXm

そういえばABCD Forecastの論文いつのまにか見れるようになってたhttps://t.co/T47KVzOZpY