著者
佐藤 進也 風間 一洋 福田 健介 村上 健一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌. データベース (ISSN:03875806)
巻号頁・発行日
vol.46, no.8, pp.26-36, 2005-06-15
参考文献数
13
被引用文献数
4

巨大なデータベースであるWebから知識を抽出する一手法として実世界指向Webマイニングを提案する.従来のマイニングでは主に統計的な処理によりデータの特徴が抽出されていた.これに対し, 実世界指向マイニングでは, 実世界を意識したデータの解釈, 具体的には, 実世界のエンティティがデータの中にどのように現れ, 相互にどういう関係を形成しているかを調べる.この考え方をWebにおける人物の識別に適用し, 同姓同名人物の分離を行った.これは, 与えられた人名が出現するWebページを同一人物ごとにグループ分けするタスクで, 本手法を用いた場合, 平均9割以上の高い率で正しく処理できることを確認した.