著者
呂 建軍 岸川 善紀 時永 祥三
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 (ISSN:09135707)
巻号頁・発行日
vol.89, no.12, pp.1142-1152, 2006-12-01
被引用文献数
6

ある基準で抽出・分割されたデータ集合(クラスタ)の特徴を,言語的に記述する手法が注目されている.本論文では,遺伝的プログラミング(Genetic Programming : GP)によるルール生成を用いたクラスタ特徴記述システムの構成手法を提案し,その応用について述べる.まず,それぞれのサンプルに対してカテゴリカルデータが与えられている場合に,データ全体から特定のクラスタを取り出す.次に,カテゴリカルデータに対する論理変数を仮定し,これら論理変数による論理式をクラスタ特徴記述のルールとしてとらえ,クラスタ内のサンプルに対してだけルールが真となる(ヒットする)方向にGP手法を用いて改善する.論理式はGP手法における個体として表現され,プールを構成するが,通常のGP手法とは異なり,個体の適合度をクラスタ内部のサンプルヘのヒット数に比例するだけではなく,クラスタ以外へのヒット数に反比例するような定義へと変更する.応用例として,人工的に与えたクラスタを用いた性能評価と,個人へのローン決定問題について述べ,これらのほかに8種類のデータ集合に対する適用結果を示す.
著者
呂 建軍 時永 祥三
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J88-A, no.7, pp.803-813, 2005-07-01

本論文では,遺伝的プログラミング(Genetic Programming:GP)の方法を用いて時系列の特徴(生成モデル)を集合として近似・記述する方法を提案し,これを時系列データの分類(クラスタリング)に応用する.具体的には,時系列データを用いて,GP手法により時系列が生成される関数の形(非線形モデル)を近似する方法であり,クラスタリングの方法が簡略化できる可能性がある.GPにより近似度が改善された時系列モデルを用いてクラスタリングを実施する場合において,適合度が相対的に高い個体がプールに残されていることを積極的に利用する.すなわち,時系列に含まれるノイズや,時間軸の伸長縮小の影響により,同じクラスタに属する時系列集合に対しても一つの非線形モデルでは認識できない可能性があるので,複数の近似度の良好な個体による推定を同時に実施し,最終的な分類確定に用いている.応用例として,人工的に生成された時系列に対して時間軸の伸長縮小及びノイズの重畳を実施した時系列のクラスタリング,及び実際の株価セグメントの分類を示す.
著者
呂 建軍 時永 祥三
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 (ISSN:09135707)
巻号頁・発行日
vol.88, no.7, pp.803-813, 2005-07-01
被引用文献数
18

本論文では, 遺伝的プログラミング(Genetic Programming: GP)の方法を用いて時系列の特徴(生成モデル)を集合として近似・記述する方法を提案し, これを時系列データの分類(クラスタリング)に応用する.具体的には, 時系列データを用いて, GP手法により時系列が生成される関数の形(非線形モデル)を近似する方法であり, クラスタリングの方法が簡略化できる可能性がある.GPにより近似度が改善された時系列モデルを用いてクラスタリングを実施する場合において, 適合度が相対的に高い個体がプールに残されていることを積極的に利用する.すなわち, 時系列に含まれるノイズや, 時間軸の伸長縮小の影響により, 同じクラスタに属する時系列集合に対しても一つの非線形モデルでは認識できない可能性があるので, 複数の近似度の良好な個体による推定を同時に実施し, 最終的な分類確定に用いている.応用例として, 人工的に生成された時系列に対して時間軸の伸長縮小及びノイズの重畳を実施した時系列のクラスタリング, 及び実際の株価セグメントの分類を示す.
著者
時永 祥三 呂 建軍
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SIS, スマートインフォメディアシステム (ISSN:09135685)
巻号頁・発行日
vol.104, no.307, pp.71-76, 2004-09-09

本報告では,遺伝的プログラミング(Genetic Programming:GP)の方法を用いて時系列の特徴(生成モデル)を記述する方法を提案し,これを時系列データの分類(クラスタリング)に応用する。時系列テータを用いて,時系列が生成される関数の形(生成のモデル)を記述する方法であり,特徴の記述が簡略化できる可能性がある。また,複数の関数近似表現を保有するクラシファイヤシステムを用いているので,ノイズの重畳や時間軸方向の伸長縮小などを変形に対応が可能となっている。GPにより,それぞれのクラスタについて与えられている個体表現された時系列モデルの近似度を改善する。応用例として,人工的に生成された時系列の分類と株価の分類を検討する。
著者
呂 建軍 時永 祥三
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLP, 非線形問題 (ISSN:09135685)
巻号頁・発行日
vol.105, no.417, pp.65-70, 2005-11-12

本報告では, ネットワーク・コミュニティ形成などメンバーのグループ化(クラスタ形成)の過程を分析する方法として, 遺伝的プログラミング(Genetic Programming : GP)による学習を行うマルチエージェントからなるセル平面のクラスタ形成分析を提案し, その応用について述べる。エージェントはセル平面において周辺の情報を入力として意思決定を行うが, まず, 基本モデルとして, エージェントを記述する状態変数が連続的な値をとることができる場合を考察し, エージェントが自己の利得を最適化する行動においても, 状態変数に均衡点が存在することを不動点定理を用いて整理する。次に, エージェントを記述する状態変数が1かゼロかの2値をとる場合には, 状態が1つの場合には, 周辺のエージェントの状態の期待値とあるしきい値を比較して行動を決定することが, 漸近的な意味での均衡条件であることを述べる。しかし, 状態が複数の場合や, エージェントが相互に学習的に行動する場合を記述するのには適していないので, エージェントモデルを基本とするシミュレーション分析を行う。応用例として, 人工的なエージェントによる事例, 企業内部における社員のクラスタ形成の特性分析などを示す。