著者
田村一樹 吉川大弘 古橋武
出版者
一般社団法人情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2013, no.19, pp.1-6, 2013-09-19

近年,電子商取引 (Electronic Commerce: EC) 市場の規模は拡大を続けている.EC サイトには,膨大な量のアイテムの情報に加え,アイテムに対するユーザの評価・口コミ (ユーザレビュー) などの情報が掲載されている.また,各ユーザの閲覧行動などのログも,大量に蓄積されている場合が多い.EC サイトは,それらの情報を用いて,各ユーザの嗜好を適切に抽出し,能動的にアイテムを推薦することにより,ユーザの購買活動を促進することを試みている.嗜好の抽出手法には,ユーザが直接的に与えた評点などの情報を用いる明示的手法と,アイテムへのアクセス履歴やその時間などを用いる暗黙的手法が存在するが,それらを同時に用いる研究については,これまであまり報告されていない.本稿では,アイテムの内容に関する評価情報であるユーザレビュー履歴に加え,明示的な情報であるアイテム評価履歴と,暗黙的な情報であるアイテム閲覧履歴の情報を用い,ユーザの購買行動を階層ベイズモデルによってモデル化することを試みる.また,オフラインのアイテム評価予測実験を行い,提案モデルの性能について検討を行う.The market of Electronic Commerce (EC) has been drastically growing in recent years. EC sites contain various types of evaluation information on items such as ratings and reviews by users in addition to the numerous information on items themselves. In addition, browsing history of each user is usually recorded. Recently, a lot of EC sites try to recommend items actively to each user to encourage him/her to purchase more items by abstracting his/her preference based on above information. To abstract preferences, there are the explicit method and the implicit method. The explicit method uses the information such as ratings directly given by users, and the implicit method uses the information such as access histories to items and browsing time. However, the study to combine the explicit information and implicit one is not found. This paper tries to construct a hierarchical Bayesian model to analyze purchasing behavior of a user based on reviews as the information of contents, rating histories as the explicit information, and browsing histories as the implicit information. An off-line experiment predicting the ratings of items is carried out and the performance of the proposed model is discussed.
著者
稲垣和人 吉川大弘 古橋武
出版者
一般社団法人情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2013, no.18, pp.1-6, 2013-12-04

マーケティングにおいて,アンケート調査は市場調査を行う上での重要な手段の一つである.一方近年,個性の多様化により,回答者が評価対象に対して抱く印象は様々なものとなってきている.これにより,得られたアンケートの解析においては,全体の傾向を捉えるだけでなく,他の回答者とは大きく異なるが強い印象を持った少人数のグループ,いわゆるマイノリティグループの発見が有益である.しかし,アンケートデータ解析に用いられる従来のクラスタ解析手法は,基本的にマジョリティグループを抽出するものや,データを大きく分類することを目的としたものが多いため,これらマイノリティを適切に抽出することは困難である.そこで本稿では,局所的な類似性を考慮した上で,全体とのつながりの低いクラスタ抽出を特徴とするスペクトラルクラスタリングを用いた,アンケートデータにおけるマイノリティグループの抽出手法を提案する.In the field of marketing, a questionnaire is one of the most important approaches in order to research the market or to design a marketing strategy. On the other hand, people have a variety of individuality recently, then respondents have various impressions to evaluation objects. In the analysis of collected questionnaire data, it is important not only to analyze overall trends but also to discover minority groups which have strong impressions but are different from general groups. It is, however, difficult to extract minority groups by conventional cluster analyses applied to questionnaire data, because they generally aim at extracting majority groups or making a rough clustering. In this paper, we propose the extraction method of minority groups in questionnaire data using the spectral clustering method which considers local similarity and extracts the clusters having less connection to general groups.
著者
佐々木謙太朗 吉川大弘 古橋武
出版者
一般社団法人情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2013, no.3, pp.1-6, 2013-09-19

Latent Dirichlet Allocation (LDA) は,様々な分野で応用されているトピックモデルであり,Twitter におけるユーザ属性の推定や話題の要約などに適用した研究も数多く報告され始めている.LDA をツイート集合に適用する場合,1 ツイートを 1 文書とすると,文書の短さやノイズの多さにより,LDA が有効に機能しないことが多いため,1 ユーザの全ツイートを 1 文書とする方法が一般的に用いられる.これに対して,1 ツイートが 1 トピックから成るという仮定に基づいたトピックモデルである Twitter-LDA が提案され,前者の方法に比べて,トピックの意味のまとまりの面で優れていると報告されている.しかし一方で Twitter-LDA は,オンライン学習ができないという課題がある.本論文では,Twitter-LDA を改良し,Twitter に適したオンライン学習可能なトピックモデルを提案する.提案モデルでは以下の二点について Twitter-LDA を拡張する.第一に,一般語とトピック語との比率をユーザごとに推定することで,より高精度にツイートの生成過程をモデル化する.第二に,ユーザの購買行動をモデル化した Topic Tracking Model (TTM) の機構をモデルに加えることで,Twitter におけるユーザの興味と話題の時間発展をオンラインで学習可能とする.Latent Dirichlet Allocation (LDA) is a topic model which has been applied to various fields. It has been also applied to user profiling or event summarization on Twitter. In the application of LDA to tweet collection, it generally treats aggregated all tweets of a user as a single document. On the other hand, Twitter-LDA which assumes a single tweet consists of a single topic has been proposed and showed that it is superior to the former way in topic semantic coherence. However, Twitter-LDA has a problem that it is not capable of online inference. In this paper, we extend Twitter-LDA in the following two points. First, we model the generation process of tweets more accurately by estimating the ratio between topic words and general words for each user. Second, we enable it to estimate temporal dynamics of user interests and topic trends in online based on Topic Tracking Model (TTM) which models consumer purchase behaviors.