- 著者
-
須子 統太
松嶋 敏泰
平澤 茂一
- 出版者
- 情報処理学会
- 雑誌
- 情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
- 巻号頁・発行日
- vol.1, no.1, pp.17-26, 2008-09-26
統計解析を行う際,得られたデータの中に外れ値が含まれることが多々ある.外れ値は少量であっても解析結果に大きく影響を与えることがあるため,従来から外れ値を含むデータに対する統計解析手法が数多く研究されている.従来,Boxらにより線形回帰モデルに対し混合分布を用いて外れ値の発生をモデル化する研究が行われている.同様のモデルに対し様々な研究が行われているが,いずれも外れ値の検出やパラメータの推定を目的としている.そこで本研究では,外れ値データの発生を含む回帰モデルに対する予測法について扱う.まず,このモデルに対しベイズ基準のもとで最適な予測法を示す.しかし,この方法はデータ数に対し指数的に計算量が増大してしまう.そこで,EMアルゴリズムを用いて計算量を削減した近似アルゴリズムを提案し,シミュレーションにより有効性を検証する.Outliers are often included in statistical data. A statistical analysis result is influenced from outliers. Therefore, there are many researches for a statistical analysis of data with outliers. Box modeled outliers using mixture distribution. There are many researches that aim parameter estimation or outlier detection about this model. In this paper, we treat prediction problem about this model. First, we present an optimal prediction method with reference to the Bayes criterion in this model. The computational complexity of this method grows exponentially with data size. Next, we propose an approximation algorithm reducing the computational complexity using EM algorithm, and evaluate this algorithm through some simulations.