著者
難波 脩人 辻 順平 能登 正人
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.1F3OS17a04, 2019 (Released:2019-06-01)

近年,熟練農家の知見を再現するために教師あり学習を用いた研究が盛んにおこなわれている.一方で,農業のような複雑な要因が絡む作業において農家が行っている農作業が最適かどうか判断することは困難であり,農家の知見から集めた訓練データを用いて学習した結果が最適解かどうかの判断は難しい.我々は熟練農家の知見に依存せずに学習を実行する強化学習によって栽培の最適化を行うことを目的とした.植物に対して強化学習を適用する際に重要な点として状態の定義があげられる.植物の状態は時間とともに変化することから同じ状態は1試行の中に1度しか現れず,Qテーブルを作成することが現実的ではない.また,植物は短期間に何度も栽培できないため,学習に必要なデータが十分に集まらず,学習が収束しない恐れがある. 本研究ではQ関数の作成にニューラルネットワークによる関数近似を用いる手法を採用した.さらに,学習が収束しない可能性を考慮し,experience replayによる過去の経験を再利用することでデータ数の少なさをカバーした.結果として,植物は自らの背丈に合わせて潅水量を決定する行動をとる様子が確認できた.
著者
辻 順平 能登 正人
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.33, no.2, pp.C-H98_1-9, 2018-03-01 (Released:2018-03-01)
参考文献数
14

In the theme park problem, it is important to find a coordination algorithm that effectively shortens the visiting time of an entire theme park while guaranteeing individual optimality for each visitor. In a previous study, a coordination algorithm, called statement-based cost estimate (SCE), was proposed that allows individual visitors to select plans that minimize a visitor’s visiting time while shortening the visiting time of the entire theme park. However, the improvement in visiting time was not sufficient from their experiment using SCE. We thought it necessary to relax the premise constraint “minimize individual visiting time” to further improve SCE. In this paper, we propose a framework to further reduce visiting time by considering Pareto optimality. In the proposed framework, each visitor determines several Pareto optimal plans based on the evaluation value calculated using SCE and presents them to a coordination system. Then, the coordination system searches for the entire optimal plan that minimizes the predicted value of the total visiting time of the entire theme park among the Pareto optimal plan candidates. The proposed framework guarantees visitors’ “personal optimality” in the meaning of Pareto optimality, and there is a possibility that the framework will shorten the visiting time of the entire theme park. We conducted a simulation experiment using a coordination algorithm based on the proposed framework and clarified the effectiveness of the framework.