著者
西村 章宏 土方 嘉徳 酒田 信親
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.58, no.5, pp.1102-1112, 2017-05-15

情報推薦の一手法として協調フィルタリング(CF)がよく知られているが,このCFの中でもMatrix Factorization(MF)は,評価値の欠損が多い現実のデータセットに対して優れた結果を出していることで有名である.ただし,MFは評価値の欠損に強いものの,評価値が極端に少ない場合には適用することが困難である.この問題に対して,評価値だけでなくテキスト情報も利用したCollaborative Topic Regression(CTR)というモデルが近年注目されている.CTRでは,トピックを抽出する情報源として,アイテムに関するテキスト情報を用いている.しかし,ユーザに関するテキスト情報を用いた場合の評価は行われてこなかった.本研究ではCTRにおいて,アイテムに関するテキスト情報を用いた場合と,ユーザに関するテキスト情報を用いた場合で,推薦の性能にどれだけの違いがあるのかを調査する.この両者とベースラインであるMFに対して推薦結果の正確性(再現率)と利便性(被覆率・多様性)に関して定量的な比較を行う.実験の結果,ユーザに関するテキスト情報を用いた場合は正確性の高い推薦が実現でき,アイテムに関するテキスト情報を用いた場合は利便性の高い推薦が実現できることが分かった.Collaborative filtering is one of the popular methods for selecting contents or items suited to user's interest or preference from a content (item) set. Among the existing methods of CF, Matrix Factorization (MF) is superior for the dataset with much missing data. However, even MF cannot perform well when the number of users' ratings are extremely small. To solve this problem, an approach that uses not only users' rating values but also text information of items are becoming popular recently. We focus on one major model of this approach, Collaborative Topic Regression (CTR). In CTR, text information of items is used as information source to extract topics. However, the case using text information of users has not been evaluated. In this study, we compare the case using text information of items and the case using text information of users in CTR to know the performance difference. We compare the both cases and MF (which is a baseline) according to accuracy metrics and usefulness metrics. We found that using text information of users realizes the recommendation with high accuracy and using text information of items realizes the recommendation with high usefulness from the experiment.

言及状況

Twitter (1 users, 1 posts, 0 favorites)

こんな研究もあります!「潜在トピックを利用した協調フィルタリングにおけるトピック情報源の違いに関する調査」 https://t.co/OIFNmO9eMI #chi2017j

収集済み URL リスト