著者
宮崎 和光 木村 元 小林 重信
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.14, no.5, pp.800-807, 1999-09-01
被引用文献数
42

1・1 工学の視点からみた強化学習 強化学習とは, 報酬という特別な人力を手がかりに環境に適応した行動決定戦略を追求する機械学習システムである. 強化学習の重要な特徴に, 1)報酬駆動型学習であること, 2)環境に対する先見的知識を前提としないこと, の2点がある. このことは, 「何をして欲しいか(what)」という目標を報酬に反映させるだけで, 「その実現方法(how to)」を学習システムに獲得させることを意味する. 強化学習システムは, 人間が考えた以上の解を発見する可能性がある. 加えて, 環境の一部が予め既知な場合には, 知識を組み込むことも可能である. この場合, 知識ベースが不完全であってもあるいは多少の誤りが含まれていても構わない. また, 強化学習は, ニューロやファジィなどの既存の手法との親和性が高い. さらに, 緩やかな環境変化には追従可能である. これらの理由から, 強化学習は工学的応用の観点から非常に魅力的な枠組と言える.
著者
片寄 晴弘 平田 圭二 宮田 一乗 原田 利宣 西田 豊明 諏訪 正樹 安部 明典 Haruhiro Katayose Keiji Hirata Kazunori Miyata Toshinobu Harada Toyoaki Nishida Masaki Suwa Akinori Abe
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence (ISSN:09128085)
巻号頁・発行日
vol.24, no.3, pp.434-444, 2009-05-01
参考文献数
4

非言語メディアは本質的に曖昧かつ主観的な記述でしか表現できないという性質がある.これまで,音楽,絵画,造形,モーションといった非言語メディアのデザイン支援の研究は,人工知能とあまり関連づけることなく,また互いにも関連づけることなく進展してきた.しかし,非言語メディアのデザイン支援の研究事例を俯瞰してみると,意外にも共通点が多いことに気づく.例えば,デザイン対象である非言語メディアの表現・記述の階層構造,すでに存在するコンテンツをいずれかのレベルで再利用して新しいコンテンツを生成する方法論,デザインプロセスにおける創造性支援などが共通点としてあげられる.本近未来チャレンジテーマ「事例に基づくデザイン支援と評価基盤の構築」は,「事例」の再利用・転写に焦点を当てて,非言語メディアのデザイン支援評価基盤に取り組むものとして,2002年に提案,採択された.2003年から,5年間のセッションの実施,サバイバルを果たし,今回,卒業となった.この間,「事例」の再利用・転写の技術,アプリケーションに関するテーマを中心に,メディア記述の定式化,「事例」参照デザインの社会インフラストラクチャ構成,評価手法を扱った38件の研究発表がなされ,2006年には,本チャレンジの提案者の一人平田圭二(NTT)の発表が本学会の全国大会優秀賞に選ばれた.本チャレンジ「事例に基づくデザイン支援と評価基盤の構築」が無事卒業となったことで,記念行事を執り行おうというお話がもち上がり,2008年10月4日に2名のゲストディスヵッサント西田豊明氏(京都大学),諏訪正樹氏(慶應義塾大学)をお迎えして,関西学院大学梅田キャンパスで座談会を執り行うこととなった.本稿では,その模様について報告する.
著者
大内 東 栗原 正仁 加地 郁夫 Azuma Ohuchi Masahito Kurihara Ikuo Kaji
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence (ISSN:09128085)
巻号頁・発行日
vol.3, no.5, pp.599-606, 1988-09-20
被引用文献数
4

The bottleneck in the process of building expert systems is retrieving the appropriate problem solving knowledge from the human expert. Method of developing an understanding of complex situations from systems engineering based on Interpretive Structural Modeling(ISM)is applied to this process. A theoretical framework of the lnteractive Knowledge Structural Modeling(IKSM) is described which interactively developing the knowledge structures by computer asistence. IKSM process is devided into two main phases, embedding phase and analytic phase. The embedding phase is to elicit the knowledge needed to solve analysis problems. Three implication rules are derived and applied to effectively execute the embedding phase. The analytic phase then arranges the knowledge to a hierarchy structure. This process extracts equivalence class, partial ordering, covering, and connected parts from the knowledge. The result is presented by some figure easily understood by the human expert.
著者
北村 泰彦 寺西 憲一 辰巳 昭治 Yasuhiko Kitamura Ken-ichi Teranishi Shoji Tatsumi
雑誌
人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence (ISSN:09128085)
巻号頁・発行日
vol.11, no.3, pp.470-477, 1996-05-01
参考文献数
9
被引用文献数
7

Real-Time A^*(RTA^*) is an on-line search scheme in which look-ahead searches and moves are interleaved. It does not guarantee to find an optimal solution but it finds a semi-optimal solution with less search effort. To improve the quality of solution, Knight has proposed Multi-Agent Real Time A^*(MARTA^*), in which multiple agents concurrently and autonomously execute RTA^* for a given problem. In this scheme, agents do not coordinate their moves, but each agent just randomly chooses its move when the candidates look equally good. In this paper, we have interest in how agents should coordinate their moves to find a better solution faster. We propose two organizational approaches based on scattering and gathering. Each agent measures the distances from other agents and chooses its move in the direction of departing or approaching. These two approaches strengthen the discovery effect to find more undiscovered solutions and the learning effect to find more good solutions of MARTA^* respectively. We evaluate them through simulation experiments on maze and 15-puzzle problems and analyze why they work well or not from a point of heuristic depression, which is a local hollow of heuristic state evaluation values on paths to goal states. Once an agent falls into a depression, it cannot escape without filling in the depression, namely updating the state evaluation values. In a maze problem, in which deep depressions are scattered in its state space, scattered agents show better performance than gathered agents because less agents fall into depressions. On the other hand, in a 15-puzzle problem, in which shallow depressions are ubiquitous, gathered agents show better performance because they are better at cooperating to fill in the depressions. As a result, it is shown that we can get better search performance in MARTA^* by using an appropriate organization of agents depending on the characteristic of heuristic depressions of the given problem.
著者
植野 研
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence (ISSN:09128085)
巻号頁・発行日
vol.21, no.1, 2006-01-01

演奏家や体操選手などの技芸実践者は, 長い年月をかけて高度な運動スキルを獲得し, 通常は成し遂げることのできない技を実演することができる.しかしながら, 多大な労力と時間をかけて磨き上げた技芸スキルは, 一般に, 個人差や筋骨格の冗長性・流派などの違いから, 言葉で説明することが困難であり, これを正しく理解することが困難であることが知られている.本研究では, このような身体知の構築問題に対し, 身体制御のタイミングに着目し, 高度なスキルをピークタイングシナジー(PTS)としてモデル化する方法を提案する.PTSとは, 身体各部のタイミングの協調制御に関する動作一貫性制約で, 運動タスクにおいて遵守すべき身体知のことである.次に, このPTSを, 身体計測データから自動構築するアルゴリズムPRESTO (Phasic Relation Extraction for Skill Training and Optimization)を提案する.PRESTOは, 多角形近似を用いて波形の変化ピークとその時間ずれを特徴点とし, 時系列マイニングによりタイミングの法則性を導き出す.本方法により, 多変量時系列波形から身体各部の連鎖動作を点と線で捉えるPTSのモデル化が可能となる.本論文では, チェロ演奏における運弓動作をとりあげ, 計測データからPTSを構築する検証実験を行った.この検証実験により, 熟練者に共通する共通スキル, 特定の熟練者に特化した個性スキルをモデル化でき, 解釈可能な身体知を構築することを確認した.技芸スキル教育におけるスキル解析の一つの道具立てを提供することができ, 技芸スキル理解における足がかりをつけることができた点で, 本研究は大きな意義をもっていると考えられる.
著者
大島 千佳
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence (ISSN:09128085)
巻号頁・発行日
vol.20, no.1, 2005-01-01

本研究は,クラシック音楽に見られるような「再現演奏」を行う奏者が,作品に対する内的感動をより良く表現できるようにすることを目的とする.まずピアノレッスンのケーススタディを行い,生徒の演奏データ(MIDIデータ)を生徒のブラインドによる主観評価と照らし合わせた分析を試みた.その結果,主観評価では明示されていない生徒の音楽的理解度や技術習得上の問題点を推定することができた.次に,MIDIシーケンスデータの「2段階式作成システム」を構築し,音楽表情に関わらない「音高の再現」をシステムが直接に支援することで,音楽表情の表出を間接的に支援できることを示した.さらに,このシステムを応用して誰でもすぐにピアノ連弾ができる「Family Ensemble」を提案した.また,複数の奏者による演奏構築支援を目的に,ピアノ連弾の練習中の対話で使用された「楽器奏」の機能を基盤化の理論を用いて分析した.本論文では,奏者に対しての何らかの支援を目的としているが,音楽表情を高めることを阻害するような行き過ぎた支援を行わないように特に配慮している.そのためには「音楽」を知るとともに,多くの分野の学問を結集させることが必要であった.このように本論文は,各分野の知識を結集した知識科学的なアプローチによって,演奏構築における音楽表情の形成過程の解明と支援に取り組んだ最初の試みとして位置づけられよう.