- 著者
-
竹崎 あかね
大浦 裕二
河野 恵伸
木浦 卓治
林 武司
- 出版者
- 農業情報学会
- 雑誌
- 農業情報研究 (ISSN:09169482)
- 巻号頁・発行日
- vol.25, no.1, pp.47-58, 2016
- 被引用文献数
-
1
農産物関連の代表的なテキストデータであり,今後テキストマイニングの必要性が高まるであろうインターネット通販の野菜商品レビューを対象に,付属辞書を参照した形態素解析結果からレビュー内容を把握する際の問題点を明らかにした.付属辞書を参照した形態素解析では語の分割精度が低いこと,出現頻度が高い同義語が別語と扱われること,否定概念が欠落すること,形容詞の対象が不明確であることでテキストからの概念抽出精度が低くなると判断した.これらの問題解決のために,自然言語処理済みテキストから抽出すべき構文解析情報等を提案し,以下の概念抽出工程を提示した.1)解析対象に合致した参照辞書を構築して形態素解析を行う.2)構文解析後,動詞"する"は,その直前に出現する名詞と一語に集約し,具体的動作を示す動詞に変換する.3)否定概念を付与するために,助動詞"ぬ",接頭辞"無"・"不"・"低"・"未"・"非",接尾辞"ない"について語の変換,集約処理をする.4)同義語を正規化する.5)解析対象に合わせて係り受け関係の語を抽出する.