著者
山田 和明 大倉 和博
出版者
一般社団法人 日本機械学会
雑誌
日本機械学会論文集C編 (ISSN:18848354)
巻号頁・発行日
vol.78, no.792, pp.2950-2961, 2012 (Released:2012-08-25)
参考文献数
17

Reinforcement learning approaches attract attention as the technique to construct the mapping function between sensors-motors of an autonomous robot through trial-and-error. Traditional reinforcement learning approaches make use of look-up table to express the mapping function between the grid state space and the grid action space. However the grid size of the state space affects the learning performances significantly. To overcome this problem, many researchers have proposed algorithms using neural networks to express the mapping function between the continuous state space and actions. However, in this case, a designer needs to appropriately set the number of middle neurons and the initial value of weight parameters of neural networks to improve the approximate accuracy of neural networks. This paper proposes a new method to automatically set the number of middle neurons and the initial value of the weight parameters of neural networks, on the basis of the dimensional-number of the sensor space, in Q-learning using neural networks. The proposed method is demonstrated through a navigation problem of an autonomous mobile robot, and is evaluated by comparing Q-learning using RBF networks and Q-learning using neural networks whose parameters are set by a designer.
著者
大倉 和博 保田 俊行
出版者
広島大学
雑誌
基盤研究(C)
巻号頁・発行日
2010

近年,スワームロボティクス(SR)と呼ばれる群ロボットの行動制御に関する研究が大きな注目を浴びるようになってきている.しかし,SR の自己組織化原理に基づく行動制御方式では,「定点に集合する」「互いに離れる」などの非常に限定的な単純タスクしか達成できないのが現状である.本研究では,これを打破すべく,研究代表者が提案している構造進化型人工神経回路網 MBEANN にベースとして可塑的群知能システムを構築するための新理論を開発し,従来法では不可能であった高難易度タスクを達成することに挑戦して SR の新段階を切り開く.
著者
竹中 貴治 保田 俊行 大倉 和博 松村 嘉之 棟朝 雅晴
出版者
公益社団法人 精密工学会
雑誌
精密工学会学術講演会講演論文集
巻号頁・発行日
vol.2013, pp.775-776, 2013

スワームロボットシステムとは多数のロボットが局所的な環境・状況下での相互作用を通して群行動を創発するシステムである.本稿ではニューラルネットをCMA-ESにより最適化するCMA-NeuroESを制御器の設計に運用する.その際,進化の過程で膨大な計算コストが必要となるため,SMP Cluster型の大規模並列計算機で並列・高速化を図る.その上で,並列化を行う上で発生する同期待ち時間に着目し,実行時間短縮について考察する.
著者
大礒 正嗣 松村 嘉之 保田 俊行 大倉 和博
出版者
Japan Society for Fuzzy Theory and Intelligent Informatics
雑誌
知能と情報 : 日本知能情報ファジィ学会誌 : journal of Japan Society for Fuzzy Theory and Intelligent Informatics (ISSN:13477986)
巻号頁・発行日
vol.23, no.1, pp.18-28, 2011-02-15
被引用文献数
4

多数の演算器を持ち並列計算可能な Graphic Processing Units(GPU)は,近年,CPU をはるかに上回る演算性能を持つようになり,GPU を用いて数値計算を高速化する研究が多くなされている.進化計算の計算量に対しても GPU 計算が注目されており,遺伝的アルゴリズム(GA)の分野において,集団の並列化についていくつかの議論が緒についた.本稿では,GPU 向け開発計算環境である CUDA を利用して,集団の並列化だけでなく個体単位での並列化を行うことによりGAの高速化とオーバーヘッドの隠蔽を行う実装手法を提案する.進化計算のベンチマークである関数値最小化問題とアプリケーションである進化ロボティクス問題に対して提案実装手法を適用し,計算機実験を行った.結果として,提案実装手法は従来の CPU による計算に対して 7.6~23.0 倍の高速化を達成した.
著者
門田 貴章 保田 俊行 大倉 和博
出版者
日本知能情報ファジィ学会
雑誌
日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集 第27回ファジィシステムシンポジウム
巻号頁・発行日
pp.108, 2011 (Released:2012-02-15)

遺伝的アルゴリズム(Genetic Algorithms:GAs)は生物の進化の過程をモデル化した最適化手法である.島モデル型GAは単一母集団で行うGAと比較して精度の高い解を得ることができる.しかし,一般的にGAを用いた探索には計算コストが膨大になるという問題がある.一方,高い並列処理能力を持つGPU(Graphics Processing Unit)が注目を集めている.GPUはグラフィックス処理に特化したデバイスである.しかし,GPU向けの統合開発環境であるCUDAの登場によりプログラミングが容易となり,汎用的な用途への適用が盛んに行われている.本研究では, 島モデル型GAを二重倒立振子制御問題に適用し,進化的探索能力の向上,および,GPUによる計算処理の高速化を試みる.
著者
小粥 勇作 松村 嘉之 大谷 毅 高寺 政行 星野 雄介 保田 俊行 大倉 和博
出版者
一般社団法人 日本繊維製品消費科学会
雑誌
繊維製品消費科学 (ISSN:00372072)
巻号頁・発行日
vol.58, no.7, pp.590-598, 2017

<p><tt>繊維・アパレル産業の企業間取引ネットワークにおいて,</tt>8 <tt>分野(総合アパレル,レディス,メンズ,デザイナー,ベビー・子供服,インナーウエア・靴下,スポーツウエア,ジーンズ・ユニフォーム)計</tt>1476 <tt>社について,複雑ネットワーク分析を実施した.全体</tt>1476 <tt>社についてと代表的な</tt>3 <tt>分野として,総合アパレル</tt>217 <tt>社,レディス</tt>603 <tt>社,メンズ</tt>202 <tt>社のそれぞれの取引関係数について,次数分布の両辺対数変換を施したところ,全体と</tt>3 <tt>分野それぞれにおいて,べき指数</tt> γ <tt>⋍</tt> -2 <tt>の自己相似的構造が確認された.また,全体と</tt>3 <tt>分野のそれぞれはネットワーク直径が</tt>6 <tt>次以下であるスモール・ワールド性も確認された.さらに,ネットワークの中心性に関する指標により,繊維・アパレル産業の多くの分野で,商社がネットワークの中心的な取引を展開していることが判明した.</tt></p>
著者
大礒 正嗣 松村 嘉之 保田 俊行 大倉 和博
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.23, no.1, pp.18-28, 2011-02-15 (Released:2011-05-10)
参考文献数
28
被引用文献数
2 4

多数の演算器を持ち並列計算可能な Graphic Processing Units(GPU)は,近年,CPU をはるかに上回る演算性能を持つようになり,GPU を用いて数値計算を高速化する研究が多くなされている.進化計算の計算量に対しても GPU 計算が注目されており,遺伝的アルゴリズム(GA)の分野において,集団の並列化についていくつかの議論が緒についた.本稿では,GPU 向け開発計算環境である CUDA を利用して,集団の並列化だけでなく個体単位での並列化を行うことによりGAの高速化とオーバーヘッドの隠蔽を行う実装手法を提案する.進化計算のベンチマークである関数値最小化問題とアプリケーションである進化ロボティクス問題に対して提案実装手法を適用し,計算機実験を行った.結果として,提案実装手法は従来の CPU による計算に対して 7.6~23.0 倍の高速化を達成した.
著者
大倉 和博 野村 冬星 保田 俊行 松村 嘉之
出版者
公益社団法人 精密工学会
雑誌
精密工学会学術講演会講演論文集
巻号頁・発行日
vol.2014, pp.1067-1068, 2014

スワームロボティックスシステム(SRS)は比較的均質な多数のエージェントを用いて局所的な知覚から群行動の創発を目的とする研究分野である.本稿では,分散AIの分野で古くから研究に用いられている追跡問題に対し進化型SRSを用い,トーラス状の連続空間をフィールドとして複数台のプレデターがプレイを取り囲んで捕捉する群れ行動の進化的獲得を試みる.
著者
山田 和明 保田 俊行 大倉 和博
出版者
一般社団法人 日本機械学会
雑誌
日本機械学会論文集 (ISSN:21879761)
巻号頁・発行日
vol.84, no.862, pp.17-00288, 2018 (Released:2018-06-25)
参考文献数
28

The field of multi-robot systems (MRSs), which deals with groups of autonomous robots, is recently attracting much research interest from robotics. MRSs are expected to achieve their tasks that are difficult to be accomplished by an individual robot. In MRSs, reinforcement learning (RL) is one of promising approaches for distributed control of each robot. RL allows participating robots to learn mapping from their states to their actions by rewards or payoffs obtained through interacting with their environment. Theoretically, the environment of MRSs is non-stationary, and therefore rewards or payoffs learning robots receive depend not only on their own actions but also on the action of other robots. From this point of view, an RL method which segments state and action spaces simultaneously and autonomously to extend the adaptability to dynamic environment, named Bayesian-discrimination-function-based Reinforcement Learning (BRL) has been proposed. In order to improve the learning performance of BRL, this paper proposes a technique of selecting either of two state spaces: one is parametric model useful for exploration and the other is non-parametric model for exploitation. The proposed technique is evaluated through computer simulations of a cooperative carrying task with six autonomous mobile robots.
著者
山田 和明 大倉 和博 上田 完次
出版者
公益社団法人 計測自動制御学会
雑誌
計測自動制御学会論文集 (ISSN:04534654)
巻号頁・発行日
vol.39, no.3, pp.266-275, 2003-03-31 (Released:2009-03-27)
参考文献数
27
被引用文献数
3

We describe a distributed approach to controlling autonomous arm robots. The robots need to acquire cooperative behaviors in order to smoothly lift an object. Each arm robot has its own reinforcement learning unit for decision-making. In investigating this task, we are primarily interested in the question of how to design a reinforcement learning control system for a multi-agent system. An applied reinforcement learning algorithm uses Bayesian discrimination method to segment continuous state and action spaces simultaneously, thereby generating of a set of effective rules. The proposed approach is examined empirically with two real arm robots. The basic dynamics of the reinforcement learning process are also analyzed.
著者
島谷 直規 保田 俊行 大倉 和博 松村 嘉之
出版者
一般社団法人 電気学会
雑誌
電気学会論文誌C(電子・情報・システム部門誌) (ISSN:03854221)
巻号頁・発行日
vol.134, no.9, pp.1355-1364, 2014 (Released:2014-09-01)
参考文献数
25

Evolutionary swarm robotics (ESR) is an artificial evolution approach to generating meaningful swarm behavior in multi-robot systems which typically consist of many homogenous autonomous robots in which the same robot controllers designed with evolving artificial neural networks are employed. Historically speaking, this approach has been thought to be a promising approach for swarm robotics systems (SRS), because the swarm behavior is an emergent phenomenon caused by many local interactions among autonomous robots and it is very hard to give a program to each robot for appropriate swarm behavior in advance. However, its realization is considered to be impractical even for a simulated SRS because the artificial evolution requires a very large computational cost. In this paper, in order to overcome this computational cost problem, a novel implementation method, i.e., the parallel problem solving using graphics processing units (GPUs) and OpenMP on a multi-core CPU, is introduced. The efficiency of the proposed method is demonstrated with the food-foraging problem with an evolving SRS.
著者
松村 嘉之 大倉 和博
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 : 日本知能情報ファジィ学会誌 : journal of Japan Society for Fuzzy Theory and Intelligent Informatics (ISSN:13477986)
巻号頁・発行日
vol.20, no.6, pp.972-980, 2008-12-15

本稿ではセル生産における自律分散的な作業現場において,作業者が持つ作業機械に関する情報について作業者機械評価表を用いて簡便に抽出することを試みる.そして,作業現場がフラットな組織に近く,リーダーが存在しない場合に,PM理論に基づく一定のリーダーシップを持つインフォーマル・リーダーを選出し,ナレッジ・マネジメントを促進する簡潔な方策を提案する.そして,実際のクリーニング工場のセル生産現場において,PM理論に基づくインフォーマル・リーダーを中心にして作業者から作業機械情報を抽出し,それに基づくナレッジ・マネジメントによって作業時間を短縮することによって,心理的見地に基づく情報共有の有用性を実証した.
著者
大倉 和博 松村 嘉之 上田 完次
出版者
一般社団法人 システム制御情報学会
雑誌
システム制御情報学会論文誌 (ISSN:13425668)
巻号頁・発行日
vol.14, no.8, pp.409-417, 2001-08-15 (Released:2011-10-13)
参考文献数
17

Evolutionary Programming (EP) belongs to a class of general optimization algorithms based on the model of natural evolution. EP has also been applied to real-valued function optimization since the early 90's. However, recent research results have proved that EP is not so robust as expected; EP performs very well only when the lower bound of strategy parameters is adjusted to each problem. In order to overcome this difficulty, an extended EP, called Robust EP (REP), is proposed. A major feature of REP is that genetic drift is introduced as another source of changing strategy parameters. Computer simulations are conducted in order to illustrate the robust performance of REP against the lower bound on a set of popular benchmark problems. Some evolutionary characteristics of REP are also clarified by calculating basic statistical values.