著者
飯間 等 黒江 康明
出版者
京都工芸繊維大学
雑誌
萌芽研究
巻号頁・発行日
2007

通常の強化学習では一つのエージェントのみを用いて学習を行うので複雑な問題では学習に時間がかかりすぎるという欠点がある。したがって、強化学習の実用化に向けて学習を高速に行う新しい方法を開発することが必要不可欠である。本研究では、短時間で学習を行うために複数のエージェントを用意し、各エージェントが通常の強化学習法で学習を行うとともに、エージェント間の情報交換により他のエージェントの学習成果を参照して学習を行う群強化学習法を提案した。本年度は、鳥の群れ行動にヒントを得た最適化手法であるParticle Swarm Optimizationを用いた群強化学習法におけるエージェント間の情報交換方法を提案した。また、各エージェントが行う個別学習法として、SarsaやActor-Criticを用いた方法を提案した。また、より複雑な問題に対する群強化学習法の有効性を検証するために、倒立振子制御問題、サッカーゲーム問題、マルチエージェント環境の問題に群強化学習法を適用し、これらの問題に対しても短時間に良い方策を獲得できることを確認した。さらに、蟻の群れ行動にヒントを得た最適化手法であるアントコロニー最適化法を用いた群強化学習法を提案した。この群強化学習法では他のエージェントの学習成果を行動選択に利用する新しい枠組みを用いている。以上の成果より、従来の1エージェント強化学習法より短時間に良い方策を獲得できる群強化学習法を開発することができた。
著者
福井 敦彦 飯間 等 三宮 信夫
出版者
一般社団法人 システム制御情報学会
雑誌
システム制御情報学会論文誌 (ISSN:13425668)
巻号頁・発行日
vol.10, no.3, pp.107-115, 1997-03-15 (Released:2011-10-13)
参考文献数
8
被引用文献数
1 3

This paper deals with assigning N operations on parallel H machines. The earliest start time, the latest finish time and the processing time are defined for each operation. The problem is to minimize the deviation of each processing time from the desirable time interval. We propose two autonomous decentralized scheduling algorithms to solve this problem. In these algorithms, an operation is transferred from one machine to another machine on the basis of information exchanges and cooperation among subsystems. By examining numerical results, a comparison is made between two algorithms from the viewpoints of accuracy and computation time. Consequently, abetter algorithm is found to be the one based on negotiations of one subsystem with the others.
著者
飯間 等 三宮 信夫
出版者
一般社団法人 電気学会
雑誌
電気学会論文誌. C (ISSN:03854221)
巻号頁・発行日
vol.122, no.3, pp.409-416, 2002
被引用文献数
1

This paper deals with modified scheduling problems in manufacturing systems. Recently optimization is required for not only basic scheduling problems but also scheduling problems modified in such a way that some constraints are added or are removed. Genetic algorithm (GA) is considered to be a promising method for solving the modified scheduling problems, because change of the procedure is small for the modification. In GA the problems can be solved only by adding (removing) the modules related to the added (removed) constraints. In this paper, a module type GA (MTGA) is proposed based on this idea, and the MTGA is designed for solving a mixed problem of machine scheduling and worker allocation. In a factory, both skillful workers and untrained workers work together, and the efficiency of operations depends on the allocation of workers to machines. The effectiveness of the proposed algorithm is investigated through a numerical result for a job-shop scheduling problem.