著者
川前 徳章 高橋 克巳 山田 武士
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J90-D, no.10, pp.2746-2754, 2007-10-01

本論文はユーザの情報検索を効率化するために,ユーザの興味とオブジェクトのトピックに着目した新しい情報検索モデルを提案する.我々は情報検索におけるユーザとその検索対象であるオブジェクトの関係はユーザの興味とオブジェクトのトピックの関係に射影することで説明できると仮定し,この射影を行うための手法としてLatent Interest Semantic Map(LISM)を提案する.LISMの特徴はLatent Semantic Analysisとユーザモデルの構築を同時に行い,射影した空間を用いることでユーザとオブジェクトの関係をユーザの興味やトピックの内容といった意味的な観点から説明できる点にある.この手法を協調フィルタリングに適用することで,ユーザのオブジェクトに対する評価予測やリコメンデーションを興味やトピックといった意味的な観点から実現できる.これらの手法を著名なベンチマークデータに適用した実験の結果,協調フィルタリングにおいて提案手法が情報検索においてユーザの情報検索を効率化することを確認した.
著者
川前 徳章 坂野 鋭 山田 武士
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.6, pp.949-959, 2010-06-01

本論文では文書間,それらの著者間及び両者の意味的な関係を明らかにするために,著者の興味と文書の内容の潜在変数及びそれら変数間の依存関係を導入したモデルを提案する.提案モデルの特徴は,文書及び著者各々に潜在変数を導入し,通常のトピックモデルを拡張している点にある.文書ごとに導入する変数(文書クラス)は,文書のトピックを選択するための確率分布をもち,類似した内容の文書群は共通の文書クラスをもつ.同様に著者ごとに導入する変数(著者クラス)は,文書クラス選択の確率分布をもち,類似した興味をもつ著者群は共通の著者クラスをもつ.このモデルにより,文書生成を著者クラス,文書クラス及びトピックとそれら変数の依存関係を用いて表現し,その依存関係を用いて著者間及び文書間の意味的な関係を説明できる.各種データを用いた実験で,提案手法により著者クラス及び文書クラスを推定し,その結果,文書と著者の関係データを内容と興味に相当する低次元の空間に射影できること,及びテキスト生成モデルとして有効であることを確認できた.また,提案モデルは潜在変数の興味を抽出し,協調フィルタリングにも適用できることを実験で確認できた.
著者
川前 徳章 山田 武士
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. AI, 人工知能と知識処理 (ISSN:09135685)
巻号頁・発行日
vol.109, no.51, pp.19-24, 2009-05-15

本稿では文書間及びそれらの著者間各々の類似性を評価する為に,著者の興味と文書の内容の依存関係を反映した潜在変数モデルを提案する.提案モデルの特徴は,通常のトピックモデルを拡張し,文書間及び著者間各々に潜在変数を導入している点である.文書毎に導入される変数(文書クラス)は,文書のトピックを選択するための確率分布を持ち,類似した内容の文書間で共有されるものとする.同様に著者毎に導入される変数(著者クラス)は,文書クラス選択の確率分布を持ち,類似した興味を持つ著者間で共有されるものとする.それ故,文書生成を著者クラス,文書クラス及びトピックとその依存関係を用いてモデル化し,そのクラスを用いて著者間及び文書間の類似性を評価できる.論文著者データを用いた実験により,提案手法が著者クラス及び文書クラスを推定し,その結果,文書と著者の関係データを内容と興味の低次元の空間に射影できること,及びテキスト生成モデルとしての有効性を確認できた.