著者
仲尾 由雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.91, pp.23-30, 2000-09-27
参考文献数
11

関連文書の組から、関連箇所を自動的に抽出する手法を提案する。語彙的結束性に基づき認定した話題階層を利用して、様々な粒度の話題を単位に、文書の部分間の関連度を計算し、話題の粒度に応じた関連度をもつ関連箇所の対を抽出する手法である。本手法を、国会における代表質問と答弁を対象に実験を行った結果、抽出された関連箇所の組の約8割は正しく同一の話題に対応し、また、新聞に要旨として掲載された内容の約6割は、この手法で自動的に抽出可能であることがわかった。これにより、完全に対応する文書であれば、話題階層に基づき関連話題を絞り込むことで、予め特別な閾値を設定することなく、効率的に様々な粒度の話題に対する関連箇所が検出できる見込みが得られた。This paper presents an algorithm for discovering related passages among related documents. For the documents to be compared, the algorithm first detects their thematic hierarchies individually based on lexical cohesion measured by term repetitions. Then, it compares a pair of thematic hierarchies in terms of various grading topics, and selects closely-related pairs of thematic units across them. An experiment using proceedings of interpellations in the National Diet shows the precision rates of related topic selection are estimated to be about 80 percent and the recall rates for major related passages corresponding to manual summaries of these proceedings are estimated to be about 60 percent.

言及状況

Twitter (1 users, 1 posts, 0 favorites)

こんな論文どうですか? 話題の階層構成に基づく関連談話の対応づけ(仲尾 由雄),2000 https://t.co/vfymo7j1By 関連文書の組から、関連箇所を自動的に抽出する手法…

収集済み URL リスト