著者
五十川 直樹 坂本 亘 後藤 昌司
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.25, no.1, pp.1-13, 2012-12-12 (Released:2017-05-01)
参考文献数
12

Bayes流接近法の枠組みでは,状況に応じてさまざまな事前分布を設定できる利点があるが,評価すべきモデルの数は多くなる.そのため,モデル診断を行う場合には予め適用場面で表れるモデル診断法の特徴を理解しておく必要がある.本稿では予測に焦点を向けた数少ないモデル診断法であるBayes予測情報量基準と予測点検接近法に注目し,これらの接近法の特徴を明確にする.シミュレーションを通して効果的な診断方法を提示することを試みた.その結果,本稿で想定した場面では,事前平均が真値か否かに関わらず,全体的にBayes予測情報量基準は事前情報が多い場面で低い値を示し,予測点検接近法は事前情報が少ない場面で高い予測点検確率を示した.すなわち,診断法を適用する場面によっては事前平均が真値でないモデルが選択されることが危惧される.適切なモデルを選択するためには,適用場面における各Bayes流予測モデル診断法の特徴を明確にすることが必要であり,各診断法の併用を含む診断方法の検討がモデル評価を行う前に重要になる.
著者
大草 孝介 阿部 興 内藤 貴也 山口 直人 加田 拓磨 黒田 淑恵 佐藤 のぞみ 日高 明日香 森 健人 鎌倉 稔成
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.28, no.2, pp.147-154, 2015 (Released:2017-05-01)
参考文献数
3

本報告は, 経営科学系研究部会連合協議会主催, 平成24年度データ解析コンペティションにおける本研究チームの報告内容をまとめたものである. 同コンペティションでは, 物件情報サイト上の顧客の行動履歴に対する解析を行い, 消費者が将来閲覧するであろう物件を予測するという課題が提供された. この問題に際し, 本研究では顧客行動の中でも, ユーザの検索時の検索条件と, 実際に閲覧した物件の持つ条件の共起関係について重点を置いて解析を行い, ユーザが将来閲覧する物件の予測を行った. 結果として, 提案手法は単純に検索条件に基づいてリコメンドした場合に比べて, 高い予測精度を得ることに成功した.
著者
西島 啓二 鎌倉 稔成
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.22, no.1, pp.23-35, 2010-01-31 (Released:2017-05-01)
参考文献数
10

本研究では,再発事象の発現が定常ポアソン過程に従うと仮定し,再発事象の発現頻度が変化する点(変化点)の存在に関する仮説検定を考え,検定統計量の帰無分布について考察した.再発事象がn件発現した場合の検定統計量の帰無分布は,互いに独立でないn-2個の自由度1のカイ2乗分布(χ^2_1分布)の最大値の分布で与えられる.しかしながら,その分布を導出することは難しいため,帰無分布の下界及び上界が,それぞれ,独立なn-2個のχ^2_1分布の最大値の分布及びχ^2_1分布で与えられることを理論的に示し,下界及び上界を用いた線形結合により,帰無分布を近似することを検討した.本研究で導出した下界及び上界を用いた近似は,必ずしも近似が十分でないこともあることから,さらに,経験分布関数による近似について検討した.シミュレーション研究の結果,検定統計量の帰無分布は,発現件数nに応じたガンマ分布による近似が可能であると考えられ,ガンマ分布のパラメータを,発現件数nに基づき決定する回帰式を求めた.このガンマ分布を用いた経験分布による近似は,全ての領域で帰無分布の良い近似を与え,また,検定における第1種の過誤確率を名目の有意水準に保つ観点からも,下界及び上界を用いた近似に比べて,帰無分布の良い近似を与えることがわかった.
著者
野崎 俊貴 木村 拓海 川野 秀一
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.29, no.2, pp.117-131, 2016 (Released:2017-05-01)
参考文献数
20

オンライン学習とは, 近年機械学習の分野において注目を集めている学習法であり, その利点は, 逐次的にデータを学習しモデルを構成することにある. 本稿では, 適応正則化学習 (Adaptive Regularization of Weight Vectors; AROW) と呼ばれるオンライン学習モデルの特徴選択を可能にするために, スパース推定に基づく方法を提案する. 推定アルゴリズムには, 座標降下法 (coordinate descent method) を用い, これにより高速化も実現する. 提案手法は, いくつかのチューニングパラメータに依存しているため, これらの値を交差検証法を用いて客観的に選択する. ベンチマークデータに基づく数値実験を通して, 提案手法の有効性を検証する.
著者
下川 敏雄 後藤 昌司
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.23, no.1, pp.1-23, 2010-12-15 (Released:2017-05-01)
参考文献数
30
被引用文献数
1

医学分野では,適切に疾病の有無を予測するための臨床検査値の探索が重要な要件の一つである.このとき,有用な統計的方法の一つが受信者動作特性(ROC:Receiver Operating Characteristic)曲線である.そこでは,解釈の簡便さ,あるいはその後の統計的推測の観点から,正規分布に基づくROC曲線が広く用いられている.ただし,このような検査値が正規分布に従う現象は稀である.このとき,検査値の正規性を満たすために,検査値にベキ変換を施し,そのうえで正規分布に基づく方法が適用されている.しかしながら,この変換に基づく方法では,ROC曲線の推定から曲線の解釈までの一貫性を保持できない.本論文では,包括的な接近法として,検査値の潜在基礎分布にベキ正規分布を想定したベキ正規ROC曲線を提案した.そのうえで,疾病の有無を識別する最適カットオフ値を選定した.さらに,ベキ正規ROC曲線の性能を,事例および若干の数値検証により評価した.その結果,ベキ正規ROC曲線は,2群が異なる形状を示す場合にも適合結果が良好であった.
著者
野崎 俊貴 木村 拓海 川野 秀一
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.29, no.2, pp.117-131, 2016

オンライン学習とは, 近年機械学習の分野において注目を集めている学習法であり, その利点は, 逐次的にデータを学習しモデルを構成することにある. 本稿では, 適応正則化学習 (Adaptive Regularization of Weight Vectors; AROW) と呼ばれるオンライン学習モデルの特徴選択を可能にするために, スパース推定に基づく方法を提案する. 推定アルゴリズムには, 座標降下法 (coordinate descent method) を用い, これにより高速化も実現する. 提案手法は, いくつかのチューニングパラメータに依存しているため, これらの値を交差検証法を用いて客観的に選択する. ベンチマークデータに基づく数値実験を通して, 提案手法の有効性を検証する.
著者
池口 惠觀
出版者
日本計算機統計学会
雑誌
計算機統計学会 (ISSN:21895813)
巻号頁・発行日
vol.19, 2005

人間は、あらゆるものを生み出しました。そして、人間を煩雑な仕事、苦しい危険な仕事から解放してくれました。この利便性を享受できるのが現代社会と言ってもよい。しかし、機械に人間が使われているのではないか。すでに映画監督だったチャップリンが流れ作業に酷使される人間像を1930年代に描いております。そして今日、私たちがその真只中に暮らしております。あらゆる科学技術は、人間を楽にするために生み出されたわけですが、その生み出した科学に振り回されてはいないか。利便性は、逆に人間性の退化を促進していはしないか。それは、機械のみならず報道や統計・世論と言った「もの」に置き換えられない人間の感情にも影響を与えている。その目に見えない「心」をどうやって現代社会の人間性に役立てていくのか。青少年育成の環境が十分かどうか、一歩踏み止まって考えてみる必要があります。
著者
亀岡 瑶 船山 貴光 宗像 昌平 山田 実俊 八木 圭太 山本 義郎
出版者
日本計算機統計学会
雑誌
計算機統計学
巻号頁・発行日
vol.29, no.1, pp.57-64, 2016

アソシエーション分析は, トランザクションデータを活用し, 顧客の同時購入のパターンを抽出するための分析方法である. 分析対象を顧客の特定のグループに限定することによって, 全体に対するアソシエーションルールには見られなかったルールが抽出できることもある. 本研究では, これらを条件付きアソシエーション分析と呼び, 各集団の条件付きアソシエーションルールの抽出によって集団の特徴を調べることで, 優良顧客の購入傾向や年代・性別の差異について分析を行った.