無限混合ディリクレ文書モデル

1 0 0 0 OA 無限混合ディリクレ文書モデル

著者: 持橋大地菊井玄一郎
雑誌: 情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日: vol.2006, no.36(2006-NL-172), pp.47-53, 2006-03-27

文書があるトピックの持つ確率分布から生成されたと仮定しその確率分布パラメータと文書のトピックへの帰属確率を求めるモデルにナイーブベイズ法を Polya 分布を用いてベイズ的に精密にとらえ直した混合ディリクレモデル(DM)があるがこの方法はトピック数を事前に与える必要があるという欠点があった.これに対し本論文では可算無限個の混合比にディリクレ過程事前分布を与えることによりデータの複雑さに合わせて混合数を自動推定するディリクレ過程混合モデルによる方法を検討する. モデル選択により混合数を決定する方法と異なりこの方法は混合数の事後分布をパラメータと同時に推定し期待値を取ることで予測を行うことができる. 実験の結果必要な混合数の上限を推測することができ特に小規模データに対しては性能がさらに上昇することがわかった.

2016-06-13 14:03:00
1 はてなブックマーク

http://id.nii.ac.jp/1001/00047941/

言及状況

はてなブックマーク (1 users, 1 posts)

[statistical modeling][natural language processing]

収集済み URL リスト

https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=47941&item_no=1&page_id=13&block_id=8 (1)