ショウヘイ@エンジニア (@shohei_botter)

投稿一覧(最新100件)

世界モデルの強化学習を開発するためのフレームワークとして、Pixyzなるものがあるそうな よく分からないが、とりえずメモ φ(=ω= ) https://t.co/CIoaMi0az0
ABCD-Forecast: 今朝の読書物として読解に挑戦 「データセットに対して任意の関数変換をおこなって、N個のデータ拡張&モデル学習をおこない、個々のモデルの出力値を逆関数変換して、アンサンブルする」 という手法は斬新に思えた https://t.co/LnPJtmHTPx
強化学習における投資比率を最適化するための手法 投資比率を算出するためのニューラルネットワークを特設しているらしく、学習を進めると、どうやらケリー基準で算出した値に近づくらしい
オラクル方策蒸留という手法による強化学習か 教師役エージェントと異なる評価をおこなった場合に、生徒役エージェントに罰則を加える感じで、過学習を防ぎつつ正解の執行に近づけていく……って発想? https://t.co/JZKKYG90u2
学会に発表する前(?)の論文の方には、機会損失の概念についての図があったから、こちらの方が意図は分かりやすいね https://t.co/7xDvwhakfK https://t.co/Y3evcRnY5d
複利型の強化学習という概念があるそうで 取引で得た収益を複利運用することを前提にして、報酬式を改変している感じなんだ 論文を読んだ感じでは、相対終値と相対標準偏差という特徴量を採用しているから、候補としてメモメモ https://t.co/ym7o3sF0Vn

お気に入り一覧(最新100件)

[bot]シミュレーション系メモ https://t.co/cwaJzgNIXm
そういえばABCD Forecastの論文いつのまにか見れるようになってたhttps://t.co/T47KVzOZpY

フォロー(279ユーザ)の投稿一覧(直近7日間)

フォロワー(538ユーザ)の投稿一覧(直近7日間)