著者
中谷 誠 Jatowt Adam 大島 裕明 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. データベース・システム研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.146, pp.253-258, 2008-09-14
参考文献数
13

検索語が属する分野における専門語は,ユーザが検索結果に含まれるウェブページの内容を理解する上で重要な役割を持っている.専門語が多く含まれるウェブページは,非専門家ユーザにとっては理解しづらいが,一方で専門家ユーザにとっては読みやすく詳細な情報を得る上で有用である.本研究では,Wikipediaのリンク構造とカテゴリ構造を用いて,ユーザの入力した検索語からその語に関する専門語を抽出する手法について述べる.Wikipedia中で検索語が含まれている記事のカテゴリ情報を集約することによって検索語の属する専門領域を検出し,その領域の内外でリンクの出現頻度を分析することによって専門語を抽出する.本研究の提案手法は幅広い分野を網羅しており多言語対応しているWikipediaを用いているので,検索語の分野や言語に関係なく専門語を取得することができる.