著者
DeyueDeng 大塚孝信 伊藤孝行
雑誌
研究報告知能システム(ICS)
巻号頁・発行日
vol.2013-ICS-171, no.2, pp.1-8, 2013-03-11

近年行われた情報フィルタリングの研究では,共起情報を導入し,フィルタリングの性能を上げるには,学習データが大規模となることで,膨大となる処理時間への対応が課題となっている.したがって,共起の単語数を増加させた場合,爆発的なデータ数となる共起を高速に処理する方法を考えることが必要である.ストレージの容量的問題もあるが,データの処理,プログラムとデータベース間協調の効率を向上することが重要となる.また,共起の増加に伴いノイズも増加するので,処理性能に支障をきたす可能性もある.本研究では既存手法では構築困難な大規模な共起データを本扱う手法を提案する.提案手法では,並列処理を用いて,実用的範囲で許容できる時間内学習過程や判定過程を実行できるフィルタリングを実装できる.

言及状況

はてなブックマーク (1 users, 1 posts)

[情報学] "「スピード」という単語が複数の意味で用いられている,負例の例で,有害な意味合い(麻薬)で使われている.本提案手法では共起を用い他の単語と組み合わせることで負例として判別できている."

Twitter (1 users, 1 posts, 0 favorites)

"「スピード」という単語が複数の意味で用いられている,負例の例で,有害な意味合い(麻薬)で使われている.本提案手法では共起を用い他の単語と組み合わせることで負例として判別できている." / “複数単語共起フィルタリングにより大規…” https://t.co/viQzLoCuiK

収集済み URL リスト