- 著者
-
滝澤 修
井佐原 均
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告自然言語処理(NL)
- 巻号頁・発行日
- vol.1995, no.110, pp.13-20, 1995-11-17
- 被引用文献数
-
1
自然言語における修辞的表現の一種である「同語反復表現」を計算機で検出する一手法を提案する.同語反復表現とは,「彼は彼,私は私だ」や「建物という建物が倒壊した」のように,一文中で同じ語(反復語)が繰り返され,かつ表層的な処理では意味解析できない表現のことである.本稿で提案する手法は,形態素解析によって品詞の同定を行い,反復語とその周辺の単語の品詞の並びに関するテンプレートを学習データから予め人手で作成しておき,そのテンプレートとのマッチングによって,対象とする文から同語反復表現を検出するものである.新聞記事データを用いた予備的な実験では,本手法によって,80.6%の呼出率で検出できることが示された.This report proposes a method for mechanically detecting tautological expressions in the Japanese language. Tautological expressions are defined here as "rhetorics in which same words are appeared at two positions in one sentence", e.g., "A promise is a promise". In the proposed method, tautological expressions are detected by matching with templates; each template is a chain of POS (part of speech) of repeated words and the neighbouring words. The templates are created manually beforehand. Preliminary experiments using a newspaper corpus show the appropriateness of the proposed method.