- 著者
-
舘野 昌一
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
- 巻号頁・発行日
- vol.2003, no.4, pp.105-112, 2003-01-20
- 被引用文献数
-
3
テキストに含まれる感性表現を抽出する方法を提案する。具体的には、コーパスの中で感性表現を含む文をタグ付けし、これと同類の文を抽出する規則を自動生成する。そのために、文は、構文としてあいまい性がない範囲までを木構造としてあらかじめ自動生成しておき、その中に含まれる感性表現を、要素間の依存関係として人手によりタグ付けする。このようにして表現されたタグ組から、自動的に抽出規則を生成し、その規則に基づいて、コーパス内の感性表現を抽出する。このようにして作成された抽出規則は、再現率と適合率により評価されるが、各規則が抽出するノイズや、各規則間の包含関係によって、規則の良し悪しを評価する方法を示した。以上に基づき、実験と評価を行い、評価方法の有効性を示した。We propose the method to extract Textual "Kansei" (ability to feel something happens) expression. The method includes tagging to the sentences with the Kansei expression and generating the rules to extract similar sentences to the tagged ones. Each sentence in the corpus is parsed to generate a tree that is not ambiguous as the syntax for the sentence and Kansei expressions are tagged as the dependencies by hand. The extracting rules are generated from the tagged corpus automatically, then they extract Kansei expressions from another corpus. We also showed the method to improve the rules by counting noises produced by the rules and by clustering all the rules to evaluate the rules by recall and precision. The experiment, evaluation and improvement are also shown.