- 著者
-
桜井 裕
佐藤理史
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.43, no.5, pp.1470-1480, 2002-05-15
- 被引用文献数
-
18
本論文では,与えられた用語に対して,その用語を説明する文章(用語説明)をワールドワイドウェブから収集し,それらを編集してユーザに提示するシステムを提案する.本システムは,(1)用語説明の収集,(2)編集,の2つのモジュールから構成される.{}「用語説明の収集」では,まず,サーチエンジンなどを用いて,入力された用語の説明が記述されている可能性が高いウェブページを収集する.次に,収集したウェブページから,用語の説明が記述されている段落を抽出する.最後に,抽出した段落内を解析し,その用語を定義する文(用語定義文)が存在するかどうかを判定し,存在した段落のみを用語説明として出力する.この判定においては,13種類の用語定義文それぞれに対して設定した文型パターンを用いる.{}「編集」では,収集した用語説明を語義ごとにグループ化し,それぞれのグループに対して,最適な用語説明と上位語を決定する.最後に,これらをまとめて,結果を語義ごとに出力する.本システムにおいて,用語定義文の判定精度は87%,グループ化の精度は81%であり,ほぼ実用レベルに達していると考えることができる.This paper proposes a term explainer that offers us a virtual dictionary, which uses the World Wide Web as information source. Thesystem consists of two modules: explanation collector and explanation editor. For a given term, the first module collects related webpages by using search engines, and extracts paragraphs thatcontain the term explanations. Sentence patterns of thirteen kinds ofdefinition sentences enable automatic detection of definitionsentences and automatic extraction of term explanations. The secondmodule classifies the extracted explanations into groups according tothe meaning, and determines the best explanation and the best broaderterm for every group. Finally, the system generates the result inHTML. In an experiment, the system achieved 87% accuracy indetection of definition sentences and 81% accuracy in classificationof explanations into groups.