著者
中島 伸介 張 建偉 稲垣 陽一 中本 レン
出版者
情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.1, pp.1-15, 2013-01-23

本研究では,小さいコミュニティから徐々に広がり,最終的に多くの人々に知れわたるような流行語を拡張型流行語と定義し,ブログ記事を時系列解析することで拡張型流行語の早期発見する手法に関する検討を行った.具体的には,すでにメジャーな流行語となったトピックに対し,ブログ上でどのように拡散していったのかを分析することで,早期発見に必要な分析手法について検討した. kizasi.jp で扱っている 3,776,154 ブログサイトで過去 2 年間に投稿された 81,922,977 件のブログ記事データの分析の結果,流行語候補がメジャーな流行語に発達する過程において,総発言数に占める,対象トピックと関連の深いコミュニティからの発言割合が減少しつつ,関連の薄いコミュニティからの発言割合が増加する状況を確認した.また,対象トピックと関連の深いコミュニティの特定手法を検討するとともに,総発言数に占めるこのコミュニティからの発言数の割合の減少状況について分析を行った.さらに,ライバル関係にある複数の流行語候補のランキングに基づく,提案手法の妥当性の検証を行った結果,良好な結果を得た.In this paper, we focus on "gradual buzzwords" that begin from a restricted community, spread little by little to other communities, and finally become widely known to most people, and discuss a method for their early detection by analyzing time-series data of blog entries. We observe the process in which certain topics grow to become major buzzwords and determine the key indicators that are necessary for their early detection. From the analysis results based on 81,922,977 blog entries from 3,776,154 blog websites posted in the past two years, we find that as topics grow to become major buzzwords, the percentages of blog entries from the blogger communities closely related to the target buzzword decrease gradually, and the percentages of blog entries from the weakly related blogger communities increase gradually. We also discuss how to identify the blogger communities which are closely related to these buzzwords, and conduct a slope analysis of percentage variation of blog entries from these closely related blogger communities. Moreover, we verify the effectiveness of the proposed method through experimentation that compares the rankings of several buzzword candidates with popularity competition.
著者
朝永聖也 中島伸介 稲垣陽一 中本レン 小倉僚 張建偉
出版者
一般社団法人情報処理学会
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2013, no.1, pp.1-8, 2013-11-19

有望な流行語候補を早期に発見する手法の一つとして,流行語先読みブロガーの発見を目指している.この流行語先読みブロガーの発見を行うために,過去の流行語に対してどの程度早くから言及していたのかを分析することによる,ブロガー先読み度判定手法を提案する.具体的には,その流行語が語り始められた時点を推測し,その時点から流行のピークを迎えるまでの期間において,対象となる流行語に関してどの程度早期に言及していたのかを評価する.本稿では,提案する先読み度判定手法について説明すると共に,本手法で必要となる流行語候補のカテゴリ分類について評価を行ったので,報告する.The purpose of this study is to discover good predictors in blogosphere, as one of methods to detect promising buzzwords. In order to find good predictors, we propose a method for evaluating bloggers' buzzword prediction ability by analyzing how early bloggers mentioned past buzzwords. Concretely, we predict the time when a buzzword began to be mentioned, and evaluate how early the buzzword was mentioned in the period from the beginning time to the peak. In this paper, we describe the analysis method of bloggers' buzzword prediction ability, and report the evaluation on buzzword classification.
著者
稲垣 陽一 中島 伸介 張 建偉 中本 レン 桑原 雄
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.3, no.3, pp.123-134, 2010-09-28

本研究ではブロガの体験熟知度に基づいたブログランキングシステムの開発を行った.ユーザが入力した検索キーワードに対して,関連するトピックを複数抽出し,各トピックに関するブロガの体験熟知度を算出する.これに基づいてブログエントリのランキングを行う.熟知度スコアが高いブロガ (熟知ブロガ) が書いたエントリは,熟知度スコアが低いブロガが書いたエントリよりもランキングが上位となる.ブロガの熟知度スコアは,ブロガが過去に投稿したエントリ内で,各トピックに関して共起に基づいて抽出した特徴語をどれほど使ったかを分析することで算出される.なお,開発したシステムは,視点の異なる複数のランキングを提示するとともに,エントリ投稿者 (ブロガ) の特性に関する補助情報を提示している.これにより,ユーザは閲覧するブログエントリの信頼性を自分なりに判断することが可能となる.我々は開発した実証実験システムをWeb上で公開するとともに,これを用いた評価実験を行った.提案システムにより提示される熟知ブロガおよびブログエントリの妥当性が十分に高いことを確認できた.