著者
宮崎 和光 木村 元 小林 重信
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.14, no.5, pp.800-807, 1999-09-01
被引用文献数
42

1・1 工学の視点からみた強化学習 強化学習とは, 報酬という特別な人力を手がかりに環境に適応した行動決定戦略を追求する機械学習システムである. 強化学習の重要な特徴に, 1)報酬駆動型学習であること, 2)環境に対する先見的知識を前提としないこと, の2点がある. このことは, 「何をして欲しいか(what)」という目標を報酬に反映させるだけで, 「その実現方法(how to)」を学習システムに獲得させることを意味する. 強化学習システムは, 人間が考えた以上の解を発見する可能性がある. 加えて, 環境の一部が予め既知な場合には, 知識を組み込むことも可能である. この場合, 知識ベースが不完全であってもあるいは多少の誤りが含まれていても構わない. また, 強化学習は, ニューロやファジィなどの既存の手法との親和性が高い. さらに, 緩やかな環境変化には追従可能である. これらの理由から, 強化学習は工学的応用の観点から非常に魅力的な枠組と言える.
著者
安藤 剛寿
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.16, no.6, 2001-11-01

コンピュータを用いたゲームは, 以前から学術的な研究の素材として取り上げられることが多く, 近年, チェス, オセロなどの完全情報ゲームのいくつかでは, コンピュータが人間のチャンピオンに勝つという成果を納めた.しかし, 不完全情報ゲームには, 特有の問題が数多く存在するため, 完全情報ゲームの手法をそのまま不完全情報ゲームに適用することは難しい.本研究では不完全情報ゲームの一つであるコントラクトブリッジのビッドを例題として, 仮説推論機能をもつエージェントを用いて, そのような問題の解決に挑戦した.本論文では, まず, 不完全情報ゲームの新しいモデルを提案した.このモデルでは, ゲームを行うプレイヤをエージェントとし, このエージェントはゲームに関する知識と, 隠された情報をアブダクションにより推論を行う能力, 推論した情報から行動を決定するための判断基準をもつものとした.次に, 提案したモデルに基づいて, コントラクトブリッジのビディングをマルチエージェントシステムとしてモデル化した.ここでは, 各エージェントは, パートナーと協力して利益を最大にし, 敵と競合して損失を最小にするように振る舞う.そして, 制約論理プログラムを用いて, このモデルの完全な実装を行った.商用のコンピュータブリッジとの対戦や, さまざまな条件下での実験を行い, 人間的な柔軟性と, 商用のシステムに勝るとも劣らない実力を確認し, モデルの有効性を示した.また, エージェント間の推論の入れ子構造や協調のための接近原理, 競合のための情報交換阻止など, ほかの不完全情報下でのマルチエージェントシステムにも有用と思われる知見を得ることができた.
著者
大須賀 節雄
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.7, no.5, pp.796-809, 1992-09-01
被引用文献数
4
著者
大須賀 節雄 冨山 哲男 上田 春康 西田 豊明
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.8, no.1, pp.37-45, 1993-01-01

「AIマップ-AI研究のあり方」(Vol.7, No.5, pp.796-809に掲載)についていろいろな方から御質問やコメントをいただいた.筆者は「AIマップ」という名のもとに,現在行われている多くの研究がそのなかに要素研究として位置づけられるようなAI技術の体系(の一つ)を提案することを試みたわけであるが,その意図は,現在のAI研究のあり方に多少危惧ないしは疑問を持っており,筆者なりにその対案を示すことであった.今日,AI研究の多くは要素研究として行われ,傾向としてはますます理論的な側面が強くなってきた反面,これらの研究成果は必ずしも直接的に利用されにくくなっている.応用分野の人々からのAIへの関心は大きく,応用研究の必要性がいわれているが,応用研究というとともすると「特定の」応用問題として受け取られ,論文にはなりにくいと思われている.その結果,学会誌が難しいといわれているのが現状である.実際には現在行われている要素研究を現実の応用に結びつけるためには,この間に別の「普遍的な」方法論が必要であり,それを実現する情報技術が存在すべきである.AI研究者にそのことが気づかれておらず,したがってAI研究がバランス良く行われていないように見える.「AIマップ-AI研究のあり方」(以下,本文中では本稿と表記)では,体系化を通してそのことを述べたかったのであるが,表現が不十分であり,紙面の制約もあってこの意図が必ずしも理解されなかったかもしれない.いただいた質問も,体系化を議論するうえで必要最少限に留めた個々の要素研究に対する筆者の考え方に対するものが多かった.もちろん,体系化をにらんだうえでの要素研究のあり方に関するものもあり,このような体系化の研究をいかに進めるかという研究の進め方に関する質問もあった.この意味では,問題点を全般的にカバーしているといってもよいかもしれない.それらのなかで,重複を避けた最少限のご質問・コメントを選んで回答させていただいた.
著者
鍋島 英知 宋 剛秀
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.25, no.1, pp.68-76, 2010-01-01
被引用文献数
6