- 著者
-
佐藤 進也
風間 一洋
福田 健介
村上 健一郎
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会論文誌. データベース (ISSN:03875806)
- 巻号頁・発行日
- vol.46, no.8, pp.26-36, 2005-06-15
- 参考文献数
- 13
- 被引用文献数
-
4
巨大なデータベースであるWebから知識を抽出する一手法として実世界指向Webマイニングを提案する.従来のマイニングでは主に統計的な処理によりデータの特徴が抽出されていた.これに対し, 実世界指向マイニングでは, 実世界を意識したデータの解釈, 具体的には, 実世界のエンティティがデータの中にどのように現れ, 相互にどういう関係を形成しているかを調べる.この考え方をWebにおける人物の識別に適用し, 同姓同名人物の分離を行った.これは, 与えられた人名が出現するWebページを同一人物ごとにグループ分けするタスクで, 本手法を用いた場合, 平均9割以上の高い率で正しく処理できることを確認した.