著者
前田 恭佑 土方 嘉徳 中村 聡史
雑誌
第8回Webとデータベースに関するフォーラム論文集
巻号頁・発行日
vol.2015, pp.32-39, 2015-11-17

Amazon.com や楽天市場のようなショッピングサイトでは,商品やコンテンツ (以降,アイテム) に対してレビューを簡単に作成・閲覧することができる.小説や映画などのストーリーを持ったアイテムに対するレビューには,レビュアの感想や意見が存在する一方で,そのアイテムのストーリーに関する記述が存在する.その記述の中には,実際にアイテムを見た時の楽しみや感動が減ってしまう記述(本稿では 「ネタバレ」 と呼ぶ) が含まれる場合があり,問題である. 本研究では,ネタバレがストーリーの進行における位置づけと関係があるのではないかという仮定のもとでネタバレの検出を行う.しかし,記述内容がストーリーの進行においてどの位置に対応するのかはレビュー文書単体からでは把握できない.これに対処するために,本研究では,レビュー文書とは別にアイテムのストーリーを記録した文書 (以降,ストーリー文書) も用いる.本研究では,まずネタバレとストーリーの進行における位置づけとの関係を知るために,ストーリー文書内のネタバレに関する記述について調査を行う.調査で得られた結果を基に,実際のレビュー文書からネタバレの可能性について考察する.
著者
田中 佑典 倉島 健 藤原 靖宏 岩田 具治 澤田 宏
雑誌
第8回Webとデータベースに関するフォーラム論文集
巻号頁・発行日
vol.2015, pp.197-204, 2015-11-17

シングルソースデータからユーザの購買行動を引き起こした要因を推定するための購買行動モデルを提案する.シングルソースデータとは,商品の購買履歴と広告閲覧履歴とを各ユーザ ID に紐づけて収集したものである.1) 個人の嗜好,2) 他者から受ける影響,3) メディア広告から受ける影響の 3 つの要因に基づく確率過程にしたがって起こるものとしてユーザの購買行動をモデル化する.提案モデルは購買行動が起こった時刻において各要因がどの程度影響しているかを分析することにより,購買行動を引き起こした要因を推定することができる.実シングルソースデータを用いた評価実験では,提案モデルが比較手法よりも高精度にユーザの購買行動を予測可能なことを確認した.この結果は,提案モデルがユーザの購買行動をより正しく説明できることを示しており,提案モデルにより推定された購買要因が妥当であることを示唆するものである.さらに,企業による TV 広告がどの程度購買につながったかという観点で広告効果を分析した結果について報告する.
著者
足立 健太郎 土方 嘉徳 Joseph Konstan
雑誌
第8回Webとデータベースに関するフォーラム論文集
巻号頁・発行日
vol.2015, pp.205-212, 2015-11-17

Pinterest は人々をつなぐソーシャルネットワーキングの機能と既存のコンテンツをまとめて新たなコンテンツを作成するキュレーションの機能を併せ持つサービスである.Pinterest には 2015 年 3 月末の時点で 500 億の画像が存在し,ユーザが自らの意図に合う画像を適切に見つけるためには画像推薦の機能が必要である.現在の主要な推薦アルゴリズムには,コンテンツベースフィルタリング,協調フィルタリング,社会ネットワークに基づく推薦,人気度に基づく推薦があるが,それぞれ異なる種類の情報を用いている.Pinterest は,上記のアルゴリズムで用いられる情報を全て有しているため,任意のアルゴリズムを適用できる.さらに,Pinterest のユーザは自分のためだけでなく,他人に見せるために特定のテーマに沿ったコレクションを作成することもあり,従来の推薦システムの想定とは異なるモチベーションを持っていると言える.上記のように新しいタイプのサービスである Pinterest を対象に,どの推薦アルゴリズムが有効に働くのかを知るため,主要な推薦アルゴリズムを正確性と利便性の観点から評価を行なった.
著者
山本 湧輝 熊本 忠彦 灘本 明代
雑誌
第8回Webとデータベースに関するフォーラム論文集
巻号頁・発行日
vol.2015, pp.174-181, 2015-11-17

Twitter では任意のユーザをフォローすることで,そのフォローされたユーザ (フォロイーと呼ぶ) がツイートした内容を自分のタイムライン (TL) に表示させることができるようになる.そのため,実世界での友人や知人だけでなく,共通の趣味・嗜好を有するユーザや有益な情報をツイートしているユーザ,好きな有名人 (芸能人や政治家,スポーツ選手など) をフォローすることで,自分の TL を充実させることが可能である.しかしながら,Twitter 上には数多くのユーザが存在しているため,その中からユーザがフォローしたくなるようなユーザ (すなわちフォロイー候補) を探し出すのは面倒な作業と言える.この問題を解決するために,最適なフォロイー候補の推薦について多くの先行研究がある.これら先行研究では,ツイートの話題が似ているユーザをフォロイー候補として推薦する場合が多いが,ツイートの話題が類似しているからといって,その話題に対するユーザの感情が異なる人をフォロイー候補として推薦するのは適さない場合も多数存在する.そこで我々は,ユーザの興味のある話題が類似しているかどうかだけでなく,その話題に対してどのような感情を持っているかも考慮してフォロイー候補を推薦するシステムを提案する.このとき,任意の話題に対する感情を表現するために,我々が先行研究で提案した Twitter 向けの 8 次元の感情軸 (「喜・好」,「安」,「昂」,「哀」,「怖」,「怒・厭」,「驚」,「恥」) を用いることとし,ツイートからの感情をこの8軸からなるレーダーチャートを用いて可視化する.
著者
青山 賢 廣田 雅春 石川 博 横山 昌平
雑誌
第8回Webとデータベースに関するフォーラム論文集
巻号頁・発行日
vol.2015, pp.72-79, 2015-11-17

ジオタグを用いた観光地や観光ルートを推薦する研究において,観光地における滞在時間は重要な要素である.それらの研究では,観光地で写真を撮影した期間をそのまま滞在時間としている.しかし,観光地の滞在中の人々の移動距離,撮影する写真数,および撮影間隔などは個人差があり,必ずしも滞在中に常に同じように写真を撮影しているとは限らない.そこで,本研究では,これらを考慮することにより滞在時間をより正確に推定することを目指す.提案手法では,ある観光地で一定枚数以上を一定距離以上移動して撮影した,複数の撮影者の移動軌跡の最初と最後の写真の撮影日時の差を算出し,それを集約することで,観光地の滞在時間を推定する.
著者
野沢 健人 若林 啓
雑誌
第8回Webとデータベースに関するフォーラム論文集
巻号頁・発行日
vol.2015, pp.88-95, 2015-11-17

グラフ構造におけるコミュニティ発見手法は,ソーシャルメディアや共著関係,商品の購買データなどから機能的・構造的にまとまりをもったノード群を抽出し分析することを可能にする重要な技術である.特に近年では,非常に大規模なグラフを解析する機会が多くなってきているため,グラフの規模に対してスケーラブルなコミュニティ発見手法が求められている.本研究では,あるノードから距離 1 以下のノードの集合を文書とみなしてトピックモデルを学習し,トピックごとのノードの予測分布を用いてコミュニティ発見を行う手法について論じた上で,トピックモデルの学習に確率的変分ベイズ法を適用することで,データの規模に対して高いスケーラビリティをもつ重複コミュニティ発見手法を提案する.実験により,提案手法は 6000 万ノード,18 億エッジからなる大規模ネットワークに対しても,既存手法と比較して高速なコミュニティ抽出を実現できることを示す.