著者
星野 孝総 亀井 且有
出版者
日本知能情報ファジィ学会
雑誌
日本ファジィ学会誌 (ISSN:0915647X)
巻号頁・発行日
vol.13, no.6, pp.626-632, 2001-12-15
被引用文献数
1

熟練者の技術を習得する手法として, 機械学習が研究されている.熟練者による教師データがない場合, 機械学習で用いられるエージェントは試行錯誤によって学習を進めなければならない.試行錯誤によって学習する手法として, 教師なし学習の一種である強化学習がある.しかし, 強化学習では, 状態と行動を対としたif-thenルールを用いているため, 状態と行動の組み合わが膨大になり, 大きな問題環境では学習が進まない.これらの問題に対し, ファジィ環境評価ルールにより遷移先状態の報酬見積値を計算し, 学習を進める新しい強化学習を提案する.本手法は, ファジィ環境評価, 環境シミュレータ, MinMax探索アルゴリズムから構成されており, 環境シミュレータを用いて行動集合を生成, MinMax探索アルゴリズムで行動を決定する.さらに, 提案手法をチェスに適応し, GNUチェスとの対戦をさせながら, 学習を行なった.その結果GNUチェスを上回る成績を上げることができ, 本提案手法の有効性を示すことができた.

言及状況

はてなブックマーク (1 users, 1 posts)

[algorithm][programming]

収集済み URL リスト