著者
佐藤 一誠 中川 裕志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.48, no.19, pp.107-116, 2007-12-15

Unigram Mixtureは教師なし文書分類などで幅広く使われている確率的生成モデルである.Unigram Mixtureは,混合モデルであり,実際の適用にはユーザは混合数決定問題をつねにかかえている.近年,このような混合モデルにおいて,Dirichlet Processを用いたノンパラメトリックベイズモデルが注目を集めている.Dirichlet Processを用いることでデータに合わせてモデル構造(混合数)を変化させることができる.本研究では,Dirichlet Processにより拡張したUnigram Mixtureに対して,Collapsed変分ベイズ法を用いてモデル学習する手法を示す.対数尤度とF-scoreによる評価により従来手法に対する有効性を確認した.Unigram Mixture is a probabilistic generative model that is widely used in unsupervised clustering of documents. Unigram Mixture is a mixture model and have a problem of how to determine the number of clusters. Recently, a nonparametric Bayes model using Dirichlet Process has gotten a lot of attention in this problem. Models using Dirichlet Process can determine the number of cluster corresponding to data. In this paper, we expand Unigram Mixture by Dirichlet Process and present a scheme that learns the model by Collapsed Variational Bayes inference.

言及状況

はてなブックマーク (1 users, 1 posts)

[Unigram Mixture][ベイズ][ノンパラ][あとで読む]

Twitter (3 users, 3 posts, 5 favorites)

“Dirichlet Process Unigram Mixture Modelに対するCollapsed Variational Bayes Inferenceの適用” http://t.co/AZjvalbz
collapsed変分ベイズをやったのは当時数理輪講で @issei_sato さんの http://t.co/YVsilMr1 が紹介されたから

収集済み URL リスト