著者
早川 卓弥 土方 嘉徳 西田 正吾
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.56, no.9, pp.1929-1942, 2015-09-15

ニコニコ動画をはじめとして,動画の再生に同期して表示される動画コメントを投稿可能な動画共有サービスが広まっている.本研究では,動画コメントから面白いコメントを抽出する手法を提案する.この手法ではコメントに対する他のユーザの反応コメントを利用している.反応コメントの推定を動画時間と実時間という2つの時間軸から行い,コメント量の時間的変化から面白いコメントを抽出する.抽出したコメントに対し,動画サービスに備わっているコメントの評価機能による得票数との比較と,複数人の評価者による面白いコメントかどうかの判定結果との比較により,評価を行った.結果として,2種類の時間情報を用いることで面白いコメントを抽出することができる可能性があることが分かった.
著者
西村 章宏 土方 嘉徳 三輪 祥太郎 西田 正吾
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.56, no.3, pp.972-982, 2015-03-15

マイクロブログサービスの1つであるTwitterでは,その時々で話題になる政治家や芸能人など有名人に関する一般ユーザの発言を豊富に得ることができる.さらに近年では,SNSから得られる評判情報をマーケティングやその他のサービスに応用しようという試みが活発に行われている.そこで本研究では,Twitterから得られる評判情報のうち,一般ユーザの有名人に関する発言とその発言を行ったユーザのプロフィールなどに着目する.これらの各情報源から得られるデータに対し,抽出の妨げとなるノイズへの前処理を経て,一般ユーザの観点が反映された特徴量であるトピックの抽出を行う.そして得られたトピックの比率をもとに人物の類似関係を獲得し,それをもとに各人物を平面上に配置することで,人物関係の可視化を行う.この可視化結果に対して,使用した情報源ごと,および可視化手法ごとに,妥当性と発見性に着目した特徴の分析を行う.Recently, it is popular to exploit users' comments or reviews in SNS for marketing research. Twitter, which is one of micro blog services, is one of the popular information sources used for the above purpose. We especially try to extract the information according to celebrities like politicians, actors, comedians, singers and so on. This will be useful for understanding the celebrities. In our study, we use ordinary people's tweet according to a celebrity and the user profile of the tweet's author. We develop a system that visualizes the relationship of celebrities from the viewpoint of ordinary people. For this purpose, we delete some noise text from the tweets, extract latent topics that present the celebrities' characteristics and allocate them on two dimensional plane based on the similarities of topics. We examine the visualization results from the viewpoint of validity and discovery.
著者
大久保 和訓 土方 嘉徳 西田 正吾
出版者
Japan Society for Fuzzy Theory and Intelligent Informatics
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.25, no.1, pp.511-523, 2013

推薦システムは,嗜好データを機械学習することでユーザプロファイルを作成し,それに基づいて推薦を行う.従来の推薦システムの研究では,いかにユーザの嗜好に合ったアイテムを推薦することができるかという精度に注目したものが多い.しかし,近年,推薦システムの精度向上のみを目指すのではなく,推薦過程を含めたサービス全体の価値の向上を目指す研究が行われつつある.我々は,そのような研究の一環として推薦システムを利用したユーザの気づきに着目した.推薦システムが獲得するユーザプロファイルを可視化することで,ユーザは自身の嗜好について何らかの気づきが得られるのではないかと考えた.本研究では,ユーザプロファイルの可視化・提示と気づきの関係についての調査を行う.
著者
清水 拓也 土方 嘉徳 西田 正吾
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.91, no.3, pp.538-550, 2008-03-01
被引用文献数
9 2

現在,商用Webサイトで利用されている推薦システムの多くは,協調フィルタリングを用いている.従来の協調フィルタワングによる推薦方法は,推薦の精度を向上させることに重点を置いて開発されてきた.そのため,既に知っているアイテムが多く推薦されるという問題があった.この推薦は,好みのアイテムをリストアップしてもらうことだけを考えたときには良い推薦といえるが,ユーザの満足度を考えたときには発見性の欠如のために必ずしも良い推薦とはいえない.本概究では,ユーザがどのようなアイテムを知っているかという情報をユーザから獲得し,この情報を用いたいくつかのアルゴリズムを提案する.これらのアルゴリズムは,ユーザの知らない好みのアイテムがどれだけ推薦されるかを示す特性であるNoveltyを向上させることを目的としている。本研究では,ユーザがどのようなアイテムを知っているかという観点でのユーザ聞,アイテム間の類似度を計算し,ユーザが知らないであろうアイテムを推測する.この方法と従来の嗜好に基づく協調フィルタリングを組み合わせることで,ユーザが知らない好みと思われるアイテムを推薦する.
著者
西村章宏 土方嘉徳 三輪祥太郎 西田正吾
出版者
一般社団法人情報処理学会
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2014, no.14, pp.1-6, 2014-07-25

マイクロブログサービスの 1 つである Twitter では,その時々で話題になる政治家や芸能人など有名人に関する一般ユーザの発言を豊富に得ることができる.さらに近年では,SNS から得られる評判情報をマーケティングやその他サービスに応用しようという試みが活発に行われている.そこで本研究では,Twitter から得られる評判情報のうち,一般ユーザの有名人に関する発言とその発言を行ったユーザのプロフィール等に着目する.これらの各情報源から得られるデータに対し,抽出の妨げとなるノイズへの前処理を経て,一般ユーザの観点が反映された特徴量であるトピックの抽出を行う.そして得られたトピックの分布を元に人物の類似関係を獲得し,それを基に各人物を平面上に配置することで,人物関係の可視化を行う.この可視化結果に対しては使用した情報源毎に妥当性と発見性に着目して特徴の分析を行う.
著者
倉持 俊也 岡田 直樹 谷川 恭平 土方 嘉徳 西田 正吾
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.26, 2012

多くの研究者によってSNSネットワークやWorld Wide Webなどの複雑ネットワークの解析が行われてきた.近年ではコミュニティ構造に着目した研究が盛んである.我々は交グラフと意味的な情報を用いた階層的クラスタリングによるコミュニティ抽出手法を提案してきた.本研究では提案する手法をTwitterネットワークに適用,評価し,その有効性を検証する.
著者
山中 努 田中 祐也 土方 嘉徳 西田 正吾
出版者
Japan Society for Fuzzy Theory and Intelligent Informatics
雑誌
知能と情報 : 日本知能情報ファジィ学会誌 : journal of Japan Society for Fuzzy Theory and Intelligent Informatics (ISSN:13477986)
巻号頁・発行日
vol.22, no.6, pp.691-706, 2010-12-15
被引用文献数
1 2

近年,GPS機能付きの携帯電話や,マイクロブログなどの手軽な情報発信サービスの普及により,時空間情報を伴うテキストデータ(メッセージ)が増加しつつある.本研究では,公園などの施設の管理者や自治体の防災センターの職員などが,上記テキスト情報を用いて管理区域の状況把握を行うことを支援するシステムを提案する.提案システムでは,メッセージを決まったカテゴリに分類する自動分類,類似するメッセージを集約するクラスタリング,メッセージが通常より密に発生していることを検出するバースト検出の3つの機能を備えている.万博記念公園で被験者120人に,現場の状況を携帯メールでサーバに通知してもらう実験を行い,時空間情報を伴うテキストデータを収集した.このデータを用いて,提案システムの評価を行った.
著者
土方 嘉徳 青木 義則 古井 陽之助 中島 周
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.2, pp.566-576, 2002-02-15
被引用文献数
10

情報検索におけるユーザ分析では,ユーザが閲覧したコンテンツのどの部分に興味を持ったのかを取得することが重要となる.既存の手法でこのようなユーザの興味に関する情報を取得しようとすると,ユーザにアンケートに答えてもらうという手間をかける問題や,Webページ中の一部分というような細かい単位では自動取得できないという問題があった.本稿では,ユーザのWebページ閲覧中のマウス操作を利用して,ユーザが興味を持ったと思われるテキスト部分を全体のテキストから自動抽出する手法を提案する.本研究では,まず事前調査としてユーザのWebページ閲覧中のマウス操作の観察とインタビューを行い,どのような種類の操作がユーザの興味と関連があるのかを明らかにする.次に,これらの操作の対象となるテキスト部分が実際にユーザが興味を持った部分であるのか否かを,「TextExtractor」と呼ぶ実験システムを実装し,被験者実験を行うことで検証する.実験の結果,テキスト中におけるユーザが興味を持ったキーワードの割合は,文書全体よりも,これら各々の種類の操作が対象とするテキスト部分の方が高いことが検証された.また,これらの操作すべてを使ってテキスト部分を抽出した場合,ユーザが興味を持ったキーワードを抽出する精度は,ランダムにキーワードを抽出する方法に比べて約4倍,tf・idfに比べて約1.4倍高いことが確認できた.In the area of information retrieval, it becomes important to acquire which portion of the content the user was interested in. The existing techniques for acquiring this information have the problem which forces the user to answer questionnaires or the problem which cannot carry out automatic acquisition in a fine unit like the portion in a Web page. This paper proposes a method for extracting the text parts which the user might be interested in from the whole text of the Web page based on the user's mouse operation.First, we conduct observations and interviews to discover what kind of operation is related to the user's interest.Second, we build a system called ``TextExtractor'' and conduct an experiment to see the effectiveness of the discovered operations. The result showed that the ratio of the keywords which the user was interested in was higher in the targeted text parts of any kind of the discovered operations than that in the whole document.When we extracted texts using all kinds of discovered operations, the precision to extract keywords of TextExtractor was about 4 times compared with that of random extraction and about 1.4 times compared with that of tf-idf.
著者
清水 拓也 土方 嘉徳 西田 正吾
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J91-D, no.3, pp.538-550, 2008-03-01

現在,商用Webサイトで利用されている推薦システムの多くは,協調フィルタリングを用いている.従来の協調フィルタリングによる推薦方法は,推薦の精度を向上させることに重点を置いて開発されてきた.そのため,既に知っているアイテムが多く推薦されるという問題があった.この推薦は,好みのアイテムをリストアップしてもらうことだけを考えたときには良い推薦といえるが,ユーザの満足度を考えたときには発見性の欠如のために必ずしも良い推薦とはいえない.本研究では,ユーザがどのようなアイテムを知っているかという情報をユーザから獲得し,この情報を用いたいくつかのアルゴリズムを提案する.これらのアルゴリズムは,ユーザの知らない好みのアイテムがどれだけ推薦されるかを示す特性であるNoveltyを向上させることを目的としている.本研究では,ユーザがどのようなアイテムを知っているかという観点でのユーザ間,アイテム間の類似度を計算し,ユーザが知らないであろうアイテムを推測する.この方法と従来の嗜好に基づく協調フィルタリングを組み合わせることで,ユーザが知らない好みと思われるアイテムを推薦する.
著者
岩濱 数宏 土方 嘉徳 西田 正吾
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151915)
巻号頁・発行日
vol.J88-D1, no.3, pp.642-656, 2005-03-01

インターネット上で流通する情報の中から,ユーザの好みに適合するものを推薦するサービスとして情報フィルタリングがある.近年は,テキストで記述された情報だけでなく音楽などのマルチメディアデータに対しても,その必要性が高まりつつある.情報フィルタリングの一方式として,ユーザの興味に関する情報を表すユーザプロファイルと対象情報(コンテンツ)の内容をモデル化したコンテンツモデルを比較する内容に基づくフィルタリングがある.音楽データを対象とした内容に基づくフィルタリングに関する既存の研究として,コンテンツモデルとユーザプロファイルの両方を音楽の特徴量のベクトルで表し,ベクトル間距離を用いて推薦する手法に関する研究や,それらの特徴量に任意の評価関数を用いるフレームワークに関する研究などが存在する.本研究はこれらの方法とは性質が異なるアルゴリズムである決定木を用いた内容に基づく音楽情報フィルタリングシステムを提案する.決定木は,ユーザによって重視する音楽の特徴が違っても,うまくそれを表現できると思われる.実際の音楽データとユーザを用いて実験を行い,他の手法に比較しての本システムの有効性を検証する.