- 著者
-
佐藤 理史
佐々木 靖弘
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告. 自然言語処理研究会報告 (ISSN:09196072)
- 巻号頁・発行日
- vol.153, pp.57-64, 2003-01-20
- 参考文献数
- 9
- 被引用文献数
-
10
9
与えられた専門用語に対して、その用語と関連する用語をウェブテキストを利用して収集する方法を提案する。提案方法は、コーパス作成、重要語抽出、フィルタリングの3ステップから構成される。コーパス作成では、サーチエンジンを利用して、与えられた用語を説明するテキストをウェブから収集し、その用語に対するコーパスを作成する。次の重要語抽出では、このコーパスから、中川の方法を利用して重要語を抽出する。最後のフィルタリングでは、得られた重要語の中から、関連用語としてふさわしいものを、ウェブのヒット数を利用して、選択する。