- 著者
-
中川 哲治
乾 健太郎
黒橋 禎夫
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
- 巻号頁・発行日
- vol.108, no.408, pp.25-30, 2009-01-19
本稿では,自動獲得されたラベル付きデータを利用して,統計的な分類器に基づく評価極性分類の精度を改善させる方法について述べる.正解ラベルの付与された訓練データは機械学習に基づく自然言語処理を行う上で非常に重要であり,これまでにラベル付きデータを自動的に収集する方法がいくつか提案されている.しかしながらそのようなデータは誤りを含んでいる可能性があるため,訓練データとして直接利用するには適さない可能性がある.そこでこの問題に対処するために,ラベルの確信度により事例の重み付けを行う方法を提案する.実験の結果,提案手法を用いて自動獲得されたラベル付きデータを利用することにより,評価極性分類の精度を向上させることができた.