- 著者
-
江口 浩二
大川 剛直
- 出版者
- 神戸大学
- 雑誌
- 特定領域研究
- 巻号頁・発行日
- 2007
情報爆発時代と呼ばれる今日、インターネット上に発信された情報は, 発信者にも制御不能な形で流通することが少なくなく、一旦流通したこれらの情報はアンドゥーすなわち発信される前の状態に戻すことは通常不可能である。また、これらは膨大な他の情報に埋没しがちであるため、既存の手段で探し当てるのは容易でない。本課題では、とくに、人物や組織等に対する誹謗中傷、ならびに、災害、事故、事件などの風評に着目し、それらの発見を支援するための技術基盤として、情報検索および情報追跡手法を開発する。平成20年度は主に以下の基本技術の開発に取り組んだ。1.逐次的に配信される文書系列に対するトピック追跡問題のため、情報理論に基づく語の重みづけ法を開発し、従来手法と比較して有意な改善を実現した。2.ブログポスト間のハイパーリンクとブログボストの潜在トピックに着目して、ブログ空間における情報伝搬を解析する手法を開発し、現実のプログデータを用いた評価実験によって有効性を示した。3.人物名や地名などのエンティティ(固有表現)がタグ付けされた文書の集合から、エンティティ間の関係を示すネットワークを推測する手法を実現した。4.タグで構造化された文書の集合から推定した潜在トピックに基づいて、構造化文書を効果的に検索する手法を実現した。Wikipediaデータを用いた評価実験によって提案手法の有効性を示した。5.マルコフ確率場モデルに基づく語間依存性のモデルにより、自然言語文で表現された質問から構造化クエリを構築し、高精度なWeb検索を実現した。