著者
前田 康成 後藤 文太朗 升井 洋志 桝井 文人 鈴木 正清 松嶋 敏泰
出版者
バイオメディカル・ファジィ・システム学会
雑誌
バイオメディカル・ファジィ・システム学会誌 (ISSN:13451537)
巻号頁・発行日
vol.15, no.1, pp.69-81, 2013-06-28 (Released:2017-09-04)
参考文献数
14

従来からマルコフ決定過程(MDP)を用いたロールプレイングゲーム(RPG)のモデル化が行われている.しかし,RPGの攻略法を能動的に学習する研究は行われていない.そこで,本研究では,真のパラメータが未知のMDPで表現されたRPGにおける期待総利得をベイズ基準のもとで最大にする攻略法を求める能動的な学習方法を提案する.シミュレーションをとおして,提案方法の有効性を確認する.
著者
鈴木 誠 松嶋 敏泰 平澤 茂一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:03875806)
巻号頁・発行日
vol.41, no.1, pp.1-11, 2000-01-15
参考文献数
19
被引用文献数
1

人工知能(AI)における不確実性を含む推論の分野では,1980年代にBelief Network(BN)がPearlによって提案され,不確実性を含む推論の基礎理論として脚光を浴びるようになった.BNは人間にとって直感的に理解しやすい知識表現機能を備えており,不確実性を含む推論に携わるAI研究者の間で現在も活発に研究がなされている.しかし,BNをはじめとする従来手法は「なぜ不確実性が生じるのか」,「どのような不確実性を扱っているのか」などの不確実性の発生メカニズムやその種類が明確にされないまま推論方法が論じられているため,求められた推論結果の意味が明確でなかった.そこで本稿では,不確実性を含む推論の問題を多変量データ解析や情報理論的な視点から考察し,従来の手法を一般化した数理モデルと推論法を提案する.さらに,従来から多くの診断・予測型ESが扱ってきた不確実性を含む推論の問題が,一種の制約条件付き最適化問題としての性質を備えていることを明らかにする.
著者
前田 康成 後藤 文太朗 升井 洋志 桝井 文人 鈴木 正清 松嶋 敏泰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 (ISSN:09135707)
巻号頁・発行日
vol.96, no.8, pp.572-581, 2013-08-01

近年,遊び手である人間の負荷を軽減することを目的に,遊び手が操作するキャラクタであるプレイヤキャラクタ(PC)以外にコンピュータが操作するキャラクタであるノンプレイヤキャラクタ(NPC)が導入されたロールプレイングゲーム(RPG)が増えてきた.従来からマルコフ決定過程(MDP)を用いたRPGのモデル化が行われているが,NPCを伴うRPGのMDPを用いたモデル化はまだ行われていない.そこで,本研究では,MDPを用いてNPCを伴うRPGのモデル化を行う.更に,MDPの真のパラメータ未知の場合に相当するNPCを伴うRPGについて,報酬の期待値をベイズ基準のもとで最大にする攻略法を算出するアルゴリズムを提案する.
著者
前田 康成 後藤 文太朗 升井 洋志 桝井 文人 鈴木 正清 松嶋 敏泰
出版者
バイオメディカル・ファジィ・システム学会
雑誌
バイオメディカル・ファジィ・システム学会誌 (ISSN:13451537)
巻号頁・発行日
vol.15, no.1, pp.69-81, 2013
参考文献数
14

従来からマルコフ決定過程(MDP)を用いたロールプレイングゲーム(RPG)のモデル化が行われている.しかし,RPGの攻略法を能動的に学習する研究は行われていない.そこで,本研究では,真のパラメータが未知のMDPで表現されたRPGにおける期待総利得をベイズ基準のもとで最大にする攻略法を求める能動的な学習方法を提案する.シミュレーションをとおして,提案方法の有効性を確認する.
著者
桑田 修平 前田 康成 松嶋 敏泰 平澤 茂一
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.6, no.1, pp.20-30, 2013-03-12

推薦問題を扱うためのより一般化されたマルコフ決定過程モデルに対して,ベイズ基準のもとで最適な推薦ルールを履歴データから求める方法を提案する.推薦問題に関する研究において,これまで,ある商品を推薦した結果どの商品が買われたのか(推薦結果)や,さらには,一定期間内に行った複数の推薦結果が考慮されることはほとんどなかった.これに対して,マルコフ決定過程モデルを用いることで上記2点を初めて考慮した手法が提案されている.提案法は,その従来研究のモデルを一般化した点に新規性がある.また,もう1つの新規性として,推薦ルールを求めるためのプロセスを統計的決定問題として厳密に定式化した点がある.従来のモデルを一般化することで,マルコフ決定過程モデルを用いた推薦手法の適用領域が拡大され,かつ,推薦する目的に対して最適な推薦が行えるようになった.人工データを用いた評価実験により,提案する推薦手法の有効性を確認した.
著者
須子 統太 松嶋 敏泰 平澤 茂一
出版者
情報処理学会
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.1, no.1, pp.17-26, 2008-09-26

統計解析を行う際,得られたデータの中に外れ値が含まれることが多々ある.外れ値は少量であっても解析結果に大きく影響を与えることがあるため,従来から外れ値を含むデータに対する統計解析手法が数多く研究されている.従来,Boxらにより線形回帰モデルに対し混合分布を用いて外れ値の発生をモデル化する研究が行われている.同様のモデルに対し様々な研究が行われているが,いずれも外れ値の検出やパラメータの推定を目的としている.そこで本研究では,外れ値データの発生を含む回帰モデルに対する予測法について扱う.まず,このモデルに対しベイズ基準のもとで最適な予測法を示す.しかし,この方法はデータ数に対し指数的に計算量が増大してしまう.そこで,EMアルゴリズムを用いて計算量を削減した近似アルゴリズムを提案し,シミュレーションにより有効性を検証する.Outliers are often included in statistical data. A statistical analysis result is influenced from outliers. Therefore, there are many researches for a statistical analysis of data with outliers. Box modeled outliers using mixture distribution. There are many researches that aim parameter estimation or outlier detection about this model. In this paper, we treat prediction problem about this model. First, we present an optimal prediction method with reference to the Bayes criterion in this model. The computational complexity of this method grows exponentially with data size. Next, we propose an approximation algorithm reducing the computational complexity using EM algorithm, and evaluate this algorithm through some simulations.
著者
桑田 修平 前田 康成 松嶋 敏泰 平澤 茂一
雑誌
研究報告数理モデル化と問題解決(MPS)
巻号頁・発行日
vol.2012, no.8, pp.1-6, 2012-05-10

推薦問題を扱うためのより一般化されたマルコフ決定過程モデルに対して,ベイズ基準のもとで最適な推薦ルールを履歴データから求める方法を提案する.提案法の特徴は,ある商品を推薦した後に何が買われたのかを考慮していること,さらに,一回の推薦結果だけでなく一定期間内に行った複数の推薦結果を評価している点にある.ここで,従来の推薦手法と大きく異なる点は,推薦ルールを求めるためのプロセスを統計的決定問題として厳密に定式化したことにある.その結果,推薦する目的に対して最適な推薦が行えるようになった.人工データを用いた評価実験により,提案する推薦手法の有効性を示す.In this paper, we proposed a general markov decision process model for the recommendation system. Furthermore, based on the bayesian decision theory, we derived the optimal recommendation lists from the proposed model using historical data. Our method takes into account not only the purchased items but also the past recommended items within a given period. Here, the unique thing about this paper is that we formulate the process to get the recommendation lists as the statistical decision problem. As a result, we can obtain the most suitable recommendation lists with respect to the purpose of the recommendation. We show the experimental results by using artificial data that our method can obtain more rewards than the conventional method gets.
著者
松嶋 敏泰 平澤 茂一 平澤 茂一
出版者
早稲田大学
雑誌
基盤研究(C)
巻号頁・発行日
2006

本研究では, センサネットワークを含むネットワーク分散処理の問題に対して, 多端子情報理論と統計的決定理論に基づいた基礎モデルを構築し, 構築したモデル上での最適解の導出及び最適解またはその近似解を実現するアルゴリズムを設計した.