著者
山村雅幸 亀田祥平
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.64, pp.65-68, 2006-06-15

報技術の急速な発展とインフラ化に伴って、さまざまなソースからの時系列データが大量に蓄積されはじめている。時系列データの適切な解析手法の整備が急務である。従来、時系列のクラスタリングにおける類似性は系列間のユークリッド距離をベースに定義されてきたが、多変数に関する情報が失われる欠点がある。本研究では、時系列クラスタリングのために、クモの生態系にヒントを得た新しいアルゴリズムを提案する。そこでは、生態系を通じたクモの棲み分けによって、時系列データの特徴点を巣の位置として抽出し、それらの特徴点の順序相関に基づいてデータ間の距離を定義しクラスタリングに役立てる。オーストラリアの手話の軌跡データを用いて、分類性能が従来の方法より高いことを実験的に調べた。
著者
朴聖俊 高田 彰二 山村 雅幸
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.46, no.3, pp.898-910, 2005-03-15

爆発的に増加するタンパク質立体構造を比較することは構造ム機能相関の解析にきわめて重要である.既存の立体構造比較手法はタンパク質全体を剛体として扱う.しかし,進化的に新しい機能を獲得する際にタンパク質構造は部分的特異的に変形を受けるため,剛体としての取扱いには限界がある.本論文では機能進化過程において,構造変形を受けにくいビルディングブロックと構造変形が顕著なループ部分が存在することを考慮に入れた立体構造比較手法を開発する.提案手法は部分構造比較と全体構造比較を2層で並列探索し,遺伝的アルゴリズムの集団探索性能を活用してタンパク質の機能進化における構造変形の柔軟性を可視化する.2層比較の基本的なアイデアと実装について説明したうえで探索アルゴリズムと評価関数の特徴と性能について述べ,構造-機能相関の解析ツールとしての有効性を示す.
著者
山村 雅幸 小野 貴久 小林 重信 Masayuki Yamamura Takahisa Ono Shigenobu Kobayashi
雑誌
人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence (ISSN:09128085)
巻号頁・発行日
vol.7, no.6, pp.1049-1059, 1992-11-01

Genetic Algorithms (GA) is a new learning paradigm that models a natural evolution mechanism. The framework of GA straightly corresponds to an optimization problem. They are classified into functional optimization and combinatorial one, and have been studied in different manners. GA can be applied to both types of problems and moreover their combinations. According to generations, GA will discover and accumulate building blocks in the form of schemata, and find the global solution as their combinations. It is said GA can find the global solution rapidly if the population holds sufficient varieties. However, this expectation has not been confirmed rigidly. Indeed, there are some problems pointed out such as the early convergence problem in functional optimization, and the encode/decode-crossover problem in combinatorial one. In this paper, we give a solution to the encode/decode-crossover problem for traveling salesman problems (TSP) with a character-preserving GA. In section 2, we define the encode/decode-crossover problem. The encode-decode problem is to define a correspondence between GA space and problem space. The crossover problem is to define a crossover method in GA space. They are closely related to the performance of GA. We point out some problems with conventional approaches for TSP. We propose three criteria to define better encode/decode ; the completeness, soundness and non-redundancy. We also propose a criterion to define better crossover ; character-preservingness. In section 3, we propose a character-preserving GA. In TSP, good subtours are worth preserving for descendants. We propose a subtour exchange crossover, that will not break subtours as possible. We also propose a compress method to improve efficiency. In section 4, we design an experiment to confirm usefulness of our character-preserving GA. We use a double-circled TSP in which the same numbers of cities are placed on two concentrated circles. There are two kinds of local solutions ; "C"-type and "O"-type. The ratio between outer and inner radius determines which is the optimum solution. We vary the radius ratio and see how much optimal solutions are obtained. In the result, character-preserving GA finds optimal solutions effectively.
著者
山村 雅幸 小野 貴久 小林 重信
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.7, no.6, pp.1049-1059, 1992-11-01
被引用文献数
105

Genetic Algorithms (GA) is a new learning paradigm that models a natural evolution mechanism. The framework of GA straightly corresponds to an optimization problem. They are classified into functional optimization and combinatorial one, and have been studied in different manners. GA can be applied to both types of problems and moreover their combinations. According to generations, GA will discover and accumulate building blocks in the form of schemata, and find the global solution as their combinations. It is said GA can find the global solution rapidly if the population holds sufficient varieties. However, this expectation has not been confirmed rigidly. Indeed, there are some problems pointed out such as the early convergence problem in functional optimization, and the encode/decode-crossover problem in combinatorial one. In this paper, we give a solution to the encode/decode-crossover problem for traveling salesman problems (TSP) with a character-preserving GA. In section 2, we define the encode/decode-crossover problem. The encode-decode problem is to define a correspondence between GA space and problem space. The crossover problem is to define a crossover method in GA space. They are closely related to the performance of GA. We point out some problems with conventional approaches for TSP. We propose three criteria to define better encode/decode ; the completeness, soundness and non-redundancy. We also propose a criterion to define better crossover ; character-preservingness. In section 3, we propose a character-preserving GA. In TSP, good subtours are worth preserving for descendants. We propose a subtour exchange crossover, that will not break subtours as possible. We also propose a compress method to improve efficiency. In section 4, we design an experiment to confirm usefulness of our character-preserving GA. We use a double-circled TSP in which the same numbers of cities are placed on two concentrated circles. There are two kinds of local solutions ; "C"-type and "O"-type. The ratio between outer and inner radius determines which is the optimum solution. We vary the radius ratio and see how much optimal solutions are obtained. In the result, character-preserving GA finds optimal solutions effectively.
著者
宮崎 和光 山村 雅幸 小林 重信
出版者
一般社団法人 人工知能学会
雑誌
人工知能 (ISSN:21882266)
巻号頁・発行日
vol.12, no.1, pp.78-89, 1997-01-01 (Released:2020-09-29)

Reinforcement learning is a kind of machine learning. It aims to adapt an agent to a given environment with a clue to rewards. Profit sharing (PS) can get rewards efficiently at an initial learning phase. However, it can not always learn an optimum policy that maximizes rewards per an action. Though Q-learning is guaranteed to obtain an optimum policy, it needs numerous trials to learn it. On Markov decision processes (MDPs), if a correct environment model is identified, we can derive an optimum policy by applying Policy Iteration Algorithm (PIA). As an efficient method for identifying MDPs, k-Certainty Exploration Method has been proposed. We consider that ideal reinforcement learning systems are to get some rewards even at an initial learning phase and to get mere rewards as the identification of environments proceeds. In this paper, we propose a unified learning system : MarcoPolo which considers both getting rewards by PS or PIA and identifying the environment by k-Certainty Exploration Method. MarcoPolo can realize any tradeoff between exploitation and exploration through the whole learning process. By applying MarcoPolo to an example, its basic performance is shown. Moreover, by applying it to Sutton's maze problem and its modified version, its feasibility on more realistic domains is shown.
著者
藤堂 健世 安田 翔也 山村 雅幸
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.3Rin469, 2020 (Released:2020-06-19)

機械学習における敵対的攻撃が注目を集めている。ブラックボックスなニューラルネットに対する普遍的かつ標的型の敵対的攻撃は困難と言われており、これを利用したニューラルネットの構造解析の知見は未だ十分とは言えない。本稿では,ブラックボックス・普遍的・標的型攻撃のための画像ノイズを遺伝的アルゴリズムによって作成し、これを適用した他クラスサンプルの圧縮空間上での遷移挙動から,ニューラルネットワークの特徴量構造の特性を調査した.その結果、あるクラスに対する標的型ノイズが、他クラスのサンプルに特徴的な遷移を誘導する「巻き込み」現象が観察された。巻き込みの発生度合いはクラスごとに異なったため、クラスごとに敵対的攻撃に対する耐性が異なることが示唆された。これらはクラスの距離に対応する何らかの指標と解釈することができ,ひいては特徴量空間の解析の糸口になると考えられる.
著者
青木 亮磨 北澤 正樹 高橋 聡 吉川 厚 山村 雅幸
出版者
一般社団法人 日本科学教育学会
雑誌
日本科学教育学会研究会研究報告 (ISSN:18824684)
巻号頁・発行日
vol.34, no.3, pp.159-164, 2019-12-21 (Released:2019-12-18)
参考文献数
7

教育においてデータを活用して教育施策に活用する動きが近年盛んになっており,多くの教育に関するデータが雑誌や本,WEB上で公開されている.本研究では大学入試に関するデータを用いた大学の入試難易度序列の決定手法を提案する.各高校の公開している大学合格実績データは高校の実力と大学入試の難易度に依存する系統的な欠損である.この系統的な欠損は高校がターゲットとする大学のみ合格率が高い性質を持つ.ここで,高校からの合格率の高い大学の入試難易度が似ていると考えると,合格率の高い部分にのみ注目することで系統的な欠損のあるデータで入試難易度を比較できる.この点から,距離を用いた並び替え手法,合格率を用いた並び替え手法,レイティングを用いた序列決定手法の3つの手法を作成した.得られた序列を塾が公開する偏差値による序列との順位相関で評価した結果,各手法での順位相関は0.83,0.85,0.89という値になった.今後は精度向上を目指して,同じ順位に分類された大学の更なる序列付けをする手法を検討していく.
著者
木村 元 山村 雅幸 小林 重信
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.11, no.5, pp.761-768, 1996-09-01
被引用文献数
60

Many conventional works in reinforcement learning are limited to Markov decision processes (MDPs). However, real world decision tasks are essentially non-Markovian. In this paper, we consider reinforcement learning in partially observable MDPs(POMDPs) that is a class of non-Markovian decision problems. In POMDPs assumption, the environment is MDP, but an agent has restricted access to state information. Instead, the agent receives observation containing some information about states of the MDP. Also we focus on a learnig algorithm for memory-less stochastic policies that map the immediate observation of the agent into actions: The memory-less approaches are suited for on-line and real-time adaptive systems that have limited memory and computational resources. Then, the following mathematical results are got. First, it can improve its policy to maximize immediate reward by stochastic gradient ascent without estimating any state or immediate reward. Second, it can improve the policy to maximize discounted reward in an initial state by stochastic gradient ascent without estimating any state, immediate reward or discounted reward. The above advantages are remarkably effective in POMDPs, because it is not required to estimate any states, immediate reward or discounted reward explicitly. Making use of these results, we present an incremental policy improvement algorithm to maximize the average reward in POMDPs. We ensure the rational behavior of the proposed algorithm in a simple experiment.
著者
土居 茂雄 山村 雅幸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. B, 通信 (ISSN:13444697)
巻号頁・発行日
vol.87, no.1, pp.48-59, 2004-01-01
被引用文献数
2

AntNetにおいて,一定時間ごとにフェロモンを揮発させるフェロモン揮発法DCY-AntNetが提案されている.そこでは,エージェントやパケットがリンクを移動するときの所要時間を考慮せずに一様にフェロモンを揮発させてしまうため,ネットワーク全体のトラヒックふくそうが起き,報酬が与えられない場合でもフェロモンを揮発させてしまう.このため,経路選択がランダムとなってしまい,系全体としてスループットの減少が起きてしまう.本論文では,これらを解決するために,ノードの局所的リンクコストを考慮に入れ,エージェントの移動に制約を加えたフェロモン揮発法を提案する.ベンチマーク問題や典型的なネットワークトポロジーでシミュレーションを行い,その有用性を確認した.