著者
鍛治 伸裕 福島 健一 喜連川 優
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.92, no.3, pp.293-300, 2009-03-01
被引用文献数
1

テキストマイニングでは,自然言語処理分野の基礎技術である形態素解析がモジュールとして利用されることが多い.しかし,ウェブには口語体のテキストが多く,新聞記事のような整ったテキストを対象としてきた自然言語処理技術では,十分な精度で解析を行うことは難しい.本論文では,形態素解析の精度低下は「ググる」などの片仮名用言が一因となっていることに着目し,それを大規模なウェブテキストから自動獲得する手法を提案する.