著者
西村章宏 土方嘉徳 三輪祥太郎 西田正吾
出版者
一般社団法人情報処理学会
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2014, no.14, pp.1-6, 2014-07-25

マイクロブログサービスの 1 つである Twitter では,その時々で話題になる政治家や芸能人など有名人に関する一般ユーザの発言を豊富に得ることができる.さらに近年では,SNS から得られる評判情報をマーケティングやその他サービスに応用しようという試みが活発に行われている.そこで本研究では,Twitter から得られる評判情報のうち,一般ユーザの有名人に関する発言とその発言を行ったユーザのプロフィール等に着目する.これらの各情報源から得られるデータに対し,抽出の妨げとなるノイズへの前処理を経て,一般ユーザの観点が反映された特徴量であるトピックの抽出を行う.そして得られたトピックの分布を元に人物の類似関係を獲得し,それを基に各人物を平面上に配置することで,人物関係の可視化を行う.この可視化結果に対しては使用した情報源毎に妥当性と発見性に着目して特徴の分析を行う.
著者
西村 章宏 土方 嘉徳 酒田 信親
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.58, no.5, pp.1102-1112, 2017-05-15

情報推薦の一手法として協調フィルタリング(CF)がよく知られているが,このCFの中でもMatrix Factorization(MF)は,評価値の欠損が多い現実のデータセットに対して優れた結果を出していることで有名である.ただし,MFは評価値の欠損に強いものの,評価値が極端に少ない場合には適用することが困難である.この問題に対して,評価値だけでなくテキスト情報も利用したCollaborative Topic Regression(CTR)というモデルが近年注目されている.CTRでは,トピックを抽出する情報源として,アイテムに関するテキスト情報を用いている.しかし,ユーザに関するテキスト情報を用いた場合の評価は行われてこなかった.本研究ではCTRにおいて,アイテムに関するテキスト情報を用いた場合と,ユーザに関するテキスト情報を用いた場合で,推薦の性能にどれだけの違いがあるのかを調査する.この両者とベースラインであるMFに対して推薦結果の正確性(再現率)と利便性(被覆率・多様性)に関して定量的な比較を行う.実験の結果,ユーザに関するテキスト情報を用いた場合は正確性の高い推薦が実現でき,アイテムに関するテキスト情報を用いた場合は利便性の高い推薦が実現できることが分かった.Collaborative filtering is one of the popular methods for selecting contents or items suited to user's interest or preference from a content (item) set. Among the existing methods of CF, Matrix Factorization (MF) is superior for the dataset with much missing data. However, even MF cannot perform well when the number of users' ratings are extremely small. To solve this problem, an approach that uses not only users' rating values but also text information of items are becoming popular recently. We focus on one major model of this approach, Collaborative Topic Regression (CTR). In CTR, text information of items is used as information source to extract topics. However, the case using text information of users has not been evaluated. In this study, we compare the case using text information of items and the case using text information of users in CTR to know the performance difference. We compare the both cases and MF (which is a baseline) according to accuracy metrics and usefulness metrics. We found that using text information of users realizes the recommendation with high accuracy and using text information of items realizes the recommendation with high usefulness from the experiment.
著者
西村 章宏 土方 嘉徳 三輪 祥太郎 西田 正吾
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.56, no.3, pp.972-982, 2015-03-15

マイクロブログサービスの1つであるTwitterでは,その時々で話題になる政治家や芸能人など有名人に関する一般ユーザの発言を豊富に得ることができる.さらに近年では,SNSから得られる評判情報をマーケティングやその他のサービスに応用しようという試みが活発に行われている.そこで本研究では,Twitterから得られる評判情報のうち,一般ユーザの有名人に関する発言とその発言を行ったユーザのプロフィールなどに着目する.これらの各情報源から得られるデータに対し,抽出の妨げとなるノイズへの前処理を経て,一般ユーザの観点が反映された特徴量であるトピックの抽出を行う.そして得られたトピックの比率をもとに人物の類似関係を獲得し,それをもとに各人物を平面上に配置することで,人物関係の可視化を行う.この可視化結果に対して,使用した情報源ごと,および可視化手法ごとに,妥当性と発見性に着目した特徴の分析を行う.Recently, it is popular to exploit users' comments or reviews in SNS for marketing research. Twitter, which is one of micro blog services, is one of the popular information sources used for the above purpose. We especially try to extract the information according to celebrities like politicians, actors, comedians, singers and so on. This will be useful for understanding the celebrities. In our study, we use ordinary people's tweet according to a celebrity and the user profile of the tweet's author. We develop a system that visualizes the relationship of celebrities from the viewpoint of ordinary people. For this purpose, we delete some noise text from the tweets, extract latent topics that present the celebrities' characteristics and allocate them on two dimensional plane based on the similarities of topics. We examine the visualization results from the viewpoint of validity and discovery.
著者
西村章宏 土方嘉徳 三輪祥太郎 西田正吾
出版者
一般社団法人情報処理学会
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2014, no.14, pp.1-6, 2014-07-25

マイクロブログサービスの 1 つである Twitter では,その時々で話題になる政治家や芸能人など有名人に関する一般ユーザの発言を豊富に得ることができる.さらに近年では,SNS から得られる評判情報をマーケティングやその他サービスに応用しようという試みが活発に行われている.そこで本研究では,Twitter から得られる評判情報のうち,一般ユーザの有名人に関する発言とその発言を行ったユーザのプロフィール等に着目する.これらの各情報源から得られるデータに対し,抽出の妨げとなるノイズへの前処理を経て,一般ユーザの観点が反映された特徴量であるトピックの抽出を行う.そして得られたトピックの分布を元に人物の類似関係を獲得し,それを基に各人物を平面上に配置することで,人物関係の可視化を行う.この可視化結果に対しては使用した情報源毎に妥当性と発見性に着目して特徴の分析を行う.