著者
白井 匡人 三浦 孝夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J99-D, no.4, pp.392-402, 2016-04-01

本研究では文書ストリームを対象としたマルチラベル分類手法を提案する.特徴の変化が起こる文書ストリームでは新たな文書が逐次発生し文書集合が動的に変化することから,あらかじめ決まった定常な確率分布によって分類を行うことは困難である.このため,ラベルに対応する文書集合の特徴を動的に学習して分類を行う必要があり,マルチラベルでの特徴の変化も考慮することが求められる.提案手法では,ラベルの定常的な特徴とストリーム中に発生する局所的な変動を考慮したトピックモデルを用いる.各文書集合の特徴を学習し,ラベル間の共起関係をラベリングに利用することで文書ストリームのマルチラベル分類を行う.
著者
白井 匡人 三浦 孝夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.113, no.214, pp.77-82, 2013-09-05

本研究ではオンライントピックモデルを用いた文書ストリームの分類手法を提案する.文書ストリームではクラスの特徴が動的に変化するため,特徴の変化に応じて適応的に分類基準を変更する必要がある.また,ニュース記事のようなストリームデータでは,話題のバーストにより発生する話題が大きく変化する.オンライントピックモデルによりクラスごとの動的学習を行い,クラスの出現確率に事前分布を設け出現確率を学習することで文書ストリームの分類を行う.
著者
上嶋 宏 三浦 孝夫 塩谷 勇
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理 (ISSN:09151915)
巻号頁・発行日
vol.87, no.2, pp.137-144, 2004-02-01
被引用文献数
2

本論文では,同義語,多義語を用い,単語のもつ意味のあいまい性を考慮した文書分類を提案する.本論文での文書分類は,シソーラスと単語がもつ複数の意味の使用頻度を用いる.これらを考慮することにより単語のもつ意味のあいまい性を排除し,分類精度を向上させる.本論文ではワードネットを用いて実験を行い,82%を超える高い分類正解率を得たことを示す.