著者
岩倉 友哉 岡本 青史 淺川 和雄
出版者
一般社団法人 電気学会
雑誌
電気学会論文誌C(電子・情報・システム部門誌) (ISSN:03854221)
巻号頁・発行日
vol.130, no.1, pp.83-91, 2010-01-01 (Released:2010-01-01)
参考文献数
26
被引用文献数
2

AdaBoost is a method to create a final hypothesis by repeatedly generating a weak hypothesis in each training iteration with a given weak learner. AdaBoost-based algorithms are successfully applied to several tasks such as Natural Language Processing (NLP), OCR, and so on. However, learning on the training data consisting of large number of samples and features requires long training time. We propose a fast AdaBoost-based algorithm for learning rules represented by combination of features. Our algorithm constructs a final hypothesis by learning several weak-hypotheses at each iteration. We assign a confidence-rated value to each weak-hypothesis while ensuring a reduction in the theoretical upper bound of the training error of AdaBoost. We evaluate our methods with English POS tagging and text chunking. The experimental results show that the training speed of our algorithm are about 25 times faster than an AdaBoost-based learner, and about 50 times faster than Support Vector Machines with polynomial kernel on the average while maintaining state-of-the-art accuracy.
著者
岡本 青史
雑誌
全国大会講演論文集
巻号頁・発行日
vol.53, pp.185-186, 1996-09-04

最小近傍法は,パターン認識の分野に起源を持つ分類手法であり,機械学習や情報検索等の広い分野に応用されている.最小近傍法は理論的にもよく研究されているが(例えば[1]),最小近傍法の正答率がノイズによってどのような影響を受けるかは明らかになっていない.本論文では,平均的解析の枠組を用いることにより,最小近傍法に対するノイズの影響を解明する.対象とするノイズは,関連属性ノイズ,非関連属性ノイズ,クラスノイズの3つのタイプである.本解析ではまず,既存の平均的解析の枠組を3つのタイプのノイズが扱えるように拡張し,最小近傍法の正答率を理論的に導出する.次に,この導出結果を用いて,各ノイズが最小近傍法の正答率に与える影響を明らかにする.