著者
中本 光彦 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2021論文集
巻号頁・発行日
vol.2021, pp.160-165, 2021-11-06

部分観測環境における深層強化学習の適用は困難である.また,複雑なタスクにおいては適切な報酬関数を設計することも難しいとされている.本研究では,これらの課題を解決するために,部分観測環境における教師なし強化学習のアルゴリズムを提案する.部分観測性に対処するためにエージェントに外部の記憶機構を与え,外部報酬を用いる代わりに相互情報量に基づいた内発的報酬を提案する.提案する内発的報酬は,エージェントに観測情報が非常に限られている状態空間を優先的に探索しながら,有効な記憶を学習させることを可能にする.実験では,HalfCheetah エージェントに限られた観測だけで,外部報酬を一切使用せずに,前後に走ることを習得させることができた.
著者
藤野 良孝 梶山 俊仁 中本 光彦 庄司 直人 井上 元輝
雑誌
情報学研究 = Studies in Information Science (ISSN:24322172)
巻号頁・発行日
vol.27, pp.45-51, 2018-03-31

本研究では、ラグビー指導の「楽しさ」の要素を明らかにするために、女子学生が「楽しさ」で表現される句要素の関係性を調査し、テキストマニング分析を行った。結果、次のことが明らかになった。(1)名詞と形容詞、動詞の係り受け関係は、スクラムや試合など実技から生まれる楽しさが主たる要素になることが示された。(2)楽しいが含まれる内容表現には、「成功する」「集う」「動く」「解る」「分かる」「知る」「挑戦する」「ゲームする」「上達する」の9要素含まれることが分かった。(3)樹形図による分析では、実際にプレーしスクラムなどの専門的な動きを経験することが、ワクワクと結びつき、結果、楽しさに集約されることが示された。