著者
樋野 葉子 荒井 幸代
出版者
一般社団法人 人工知能学会
雑誌
JSAI大会論文集
巻号頁・発行日
vol.2014, pp.1C4OS13a1, 2018-07-30

<p>本論文では,災害発生時の帰宅難民対策の一環として.鉄道利用客が駅の最大収容人数を越えて滞留しないための経路統制法を提案する.具体的には利用客の目的地までの路線を制約充足解を得るためのバックトラック法をベースとし,利用客の移動時間を低減するためにDijkstra法を導入した探索法を示す.提案法による経路統制の効果は,容量の異なる駅から構成されるいくつかの鉄道網を用いて計算機実験によって評価する.</p>
著者
荒井 幸代
雑誌
人工知能
巻号頁・発行日
vol.33, 2018-05-01
著者
竹木 祥太 荒井 幸代
出版者
一般社団法人 人工知能学会
雑誌
JSAI大会論文集
巻号頁・発行日
vol.2017, pp.3I2OS13b3, 2018-07-30

<p>相互乗り入れによる他路線への遅延拡大抑制策の一つである折り返し運転を対象とする。折り返しは振替輸送による損失も伴うため,その開始タイミングは重要であるにもかかわらず,現状では経験によって決定されている。本研究では,ICカードや重量センサから得られるOD分布や各電車の混雑度を導入したマルチエージェントシミュレーションによって鉄道会社と利用客双方の損失を最小化する折り返し開始の決定法を提案する。</p>
著者
荒井 幸代 鈴木 香名子 大喜多 周
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.26, 2012

ナッシュ均衡が複数存在するゲームでは,エージェントが最適な唯一の解に収束するためのインセンティブが必要となる。本稿では,スタグハントゲームを用いてエージェントが協力してスタグ(鹿)を狙うように導く報酬関数を逆強化学習によって推定する方法を提案する.また,本手法に対して,通常のQ学習において「スタグを狙う行動を獲得させる」報酬を試行錯誤的に設計する方法とを比較し,提案手法の有用性を示す
著者
石田 亨 八槇 博史 溝口 理一郎 中小路 久美代 高田 司郎 中西 英之 荒井 幸代
出版者
京都大学
雑誌
基盤研究(A)
巻号頁・発行日
2003

セマンティックWebで提案されている基本技術は計算中心の技術であり,コンテンツを作成,利用するユーザ(人間側)への考察が欠けている.セマンティックWebの成功のためには,人間社会のWeb利用とセマンティックWebの計算中心のアプローチとのギャップを埋める人間中心の技術開発が必要である.このような問題意識に基づき,本研究では以下の三拠点に分かれて研究を展開した.京都大学では,厳密なオントロジーを人が記述することは容易でないとの立場から,人間が既に表現したコンテンツからオントロジーを抽出する研究を進めた.Web情報に関しては,既存データからのオントロジーの抽出に取り組み,カテゴリを特徴付けるキーワードの自動抽出や,表データからのオントロジーの抽出などを行った.また,既存オントロジーを整理して一覧とし,新しいオントロジーの設計を支援する研究を行った.大阪大学では,人間中心のセマンティックWebのためのオントロジー開発には小規模で分散したオントロジーを状況に応じてマージしたり,マッピングしたりする技術が不可欠であるとの考えから,オントロジー分散開発過程を包括的に支援する計算機環境を開発した.東京大学では,異なる「文化」に属するメンバ間の協調作業における,協調・交渉オントロジーの発現と発展に着目して研究が進められた.上記の研究と並行して,この分野を推進する活動も行った.人工知能学会にセマンティックWebとオントロジー研究会を継続的に発展させると共に,2004年にはセマンティックWeb国際会議(ISWC)をわが国で開催する中心的役割を果たした.また,2003年にElsevierから出版が始まったJournal of Web Semanticsの初代共同編集長を務めた.
著者
三股 歩夢 荒井 幸代
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回 (2020)
巻号頁・発行日
pp.2J6GS203, 2020 (Released:2020-06-19)

近年,監視カメラの普及が進み,幅広い分野における行動記録の活用が期待されている.その中でも行動履歴からの不審行動の検出は防犯やトラブル防止に重要である.しかし,監視者による検出は,その膨大な作業量はもちろん,経験に負う部分が大きいため,高精度な自動検出法への要請は大きい.自動不審行動検出の既存法は出現確率の低い行動を不審行動とみなすが,これでは実際は不審ではないが出現確率が低い行動が不審行動として誤検出され問題である.これを踏まえ,本研究は不審行動のデータ不要,リアルタイム検出可能,かつ既存法よりも高精度な自動不審行動検出の実現を目的とする.本研究は,多くの人がもつ「一般的な」意図に沿わない行動を不審行動とする.行動軌跡から報酬を推定可能な逆強化学習により人物動線データから導出される行動価値には,動線に潜在する意図が定量的に反映されるとして,導出された行動価値をもとに行動の不審さを評価する.擬似動線データにより実験した結果,既存法が誤評価する行動に対しても提案法は正確に評価可能であることを確認した.また,四つの指標により評価したところ,提案法は高い性能を示し有用なことを確認した.
著者
荒井 幸代 宮崎 和光 小林 重信
出版者
一般社団法人 人工知能学会
雑誌
人工知能 (ISSN:21882266)
巻号頁・発行日
vol.13, no.4, pp.609-618, 1998-07-01 (Released:2020-09-29)
被引用文献数
1

Most of multi-agent systems have been developed in the field of Distributed Artificial Intelligence (DAI) whose schemes are based on plenty of pre-knowledge of the agents' world or organized relationships among the agents. However, these kind of knowledge would not be always available. On the other hand, multi-agent reinforcement learning is worth considering to realize the cooperative behavior among the agents with littls pre-knowledge. There are two main problems to be considered in multi-agent reinforcement learning. One is the uncertainty of state transition problem which is owing to concurrent learning of the agents. And the other is the perceptual aliasing problem which is generally held in such a world. Therefore, the robustness and flexibility are essential for the multi-agent reinforcement learning toward these two problems. In this paper, we evaluate Q-learning and Profit Sharing as the method for multi-agent reinforcement learning through some experiments. We take up the Pursuit Problem as one of the multi-agent world. In the experiments, we do not assume the existence of any pre-defined relationship among agents or any control knowledge for cooperation. Learning agents do not share sensation, episodes and policies. Each agent learns through its own episodes independent of the others. The result of experiments shows that cooperative behaviors emerge clearly among Profit Sharing hunters who are not influenced by concurrent learning even when the prey has the certain escaping way against the hunters. Moreover, they behave rational under the perceptual aliasing areas. On the other hand, Q-learning hunters can not make any policy in such a world. Through these experiments, we conclude that Profit Sharing has the good properties for multi-agent reinforcement learning because or its rubustness for the change of other agents' policies and the limitation of agent's sensing abilities.
著者
山本 慶佑 荒井 幸代
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集
巻号頁・発行日
vol.2018, pp.4D2OS18c02, 2018

<p>実世界における多くの問題は,複数の競合する目的からなる多段階・多目的最適化問題(MOP)として定式化することができる.そのため,あらかじめ十分な解候補を提示しなければ妥協解を見つけることは困難である. そこで,本稿ではパレート最適解を網羅的に発見する手法を提案する.本研究のアプローチは,実世界の問題は報酬を獲得するまでに複数の行動の評価値を必要とするため,多目的強化学習に基づいている.本研究では,「収集車の容量」と「収集時間」の2つの目的からなる「ごみ収集問題」に適用して評価した.</p>
著者
本木 雄斗 荒井 幸代
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

マルチエージェント系のうち,各々のタスク達成の過程で行動の競合が生じる問題を対象とする.譲歩含む協調行動を強化学習によって獲得させるには,他者の行動や状態の共有が必要となるが状態空間が膨大となる.そこで本論文では,協調行動を報酬関数の設計によって獲得させることを考える.具体的には,Abbeelの逆強化学習をマルチエージェント系に導入する際に生じる問題を指摘し,これらの問題を回避する方法を提案する.
著者
齋竹 良介 荒井 幸代
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.29, 2015

本研究では,地震発生後に逐次得られる実被害情報を活用した水道管被害推定法を提案する。管路をネットワークとみなし,被害ノードを中心とした被害の広がり具合を推定する指標であるコミュニティ濃度を導入する。情報を得るたびにコミュニティ濃度を用いてデータを更新し,サポートベクターマシンを用いて被害推定を行う。東日本大震災時のデータを用いて計算機実験を行い,情報を得るたびに推定精度が向上することを確認した。
著者
加賀谷 駿 荒井 幸代
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J96-D, no.12, pp.3000-3008, 2013-12-01

新たなエネルギー供給と消費の形態として注目されているマイクログリッドは,既存の電力系統からの送電に極力依存せずに,エネルギー供給源と消費施設をもつ小規模なエネルギーネットワークである.供給が不安定な自然エネルギー活用を前提とするため,グリッド内での電圧均衡を実現し,逆潮流による大停電を回避する必要がある.そこで本研究では,マイクログリッドを,複数のエージェントからなるネットワークとしてモデル化し,需給の不安定をエージェント間での電力融通によって吸収することを考える.具体的には,太陽光発電をもつ需要家エージェントの強化学習モデルを提案する.エージェントは,太陽光発電・定常発電・電力需要・需要制御・蓄電の五つのモジュールから構成され,不安定要素である太陽光発電と電力需要の二つを需要制御と蓄電によって安定化する.需要制御に用いる強化学習には,連続値をとる電力制御問題に対応するために,Actor-Criticとタイルコーティングを導入する.実験では,5体のエージェントからなる完全グラフにおいて需給の安定化が学習できることをシミュレーションで示し,電力融通における提案モデルの有効性を示す.
著者
荒井 幸代 吉村 忍 丸山 喜久
出版者
千葉大学
雑誌
基盤研究(C)
巻号頁・発行日
2010

情報提供が人間の意思決定戦略を変化させ,交通流に大きな影響を与えることを示し,これを改善する方法を提案した.具体的成果は3つに大別される.1)不完全情報下で運転者の経路選択モデルの提案,2)1)のモデルが大域的な交通流に与える影響の検証,および,3)実世界データを用いた1)2)の妥当性検証である.交通網変化時の過渡現象の混乱から収束の様子を再現し,東北地方太平洋沖地震後に東京都で取得されたタクシープローブデータを分析し,利用者均衡配分によってリンク交通量を予測し運転者の経路選択行動に関する分析も実施した.