著者
小出 明弘 斉藤 和巳 長屋 隆之 伊藤 健二
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.26, 2012

大規模なネットワークを粗視化することにより、情報拡散過程を可視化する手法を提案する。具体的には、Twitterのmentionネットワーク等の大規模なネットワークを、ネットワーク内の中心的なユーザに着目して粗視化し、現実の情報拡散現象を可視化する。また、ICモデルやLTモデルを利用した人口の拡散データを作成し、現実の拡散現象に見られる特徴を明らかにすると共に、本提案手法の有効性を検討する。
著者
小出 明弘 斉藤 和巳 風間 一洋 鳥海 不二夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.6, no.2, pp.164-173, 2013-08-21

本稿では,Twitterのフォローネットワークを分析することにより,ユーザのフォローがどのような目的で行われているのか議論する.まず,フォローネットワークの特徴を把握するため,ネットワーク内の高次数ノードに着目し,ブログの読者関係とレビューサイトのお気に入り関係を表したそれぞれのネットワーク構造の特徴と比較する.その結果,ブログやレビューサイトでは,比較的小規模な高コリンクグループが得られたのに対し,フォローネットワークでは,強い双方向関係により構築された大規模な高コリンクグループと,双方向関係がほとんど見られない複数の小規模な低コリンクグループが存在することが分かった.さらに,高次数ノードのツイート集合を分析し,これらのグループは同じようなツイートをしているにもかかわらず,フォロワとの関係に大きな違いが見られることが分かった.In this paper, we explored Twitter's follow mechanism through a network analysis. In order to characterize the salient structure of Twitter's follow network, we first empirically compared it with those of reader and favorite networks form blog and review sites by focusing on their high degree nodes. From this experiment, we observed a relatively large high co-link group whose nodes are mutually connected to each other and some small low co-link groups whose nodes are not mutually connected to each other in Twitter's network. On the other hand, most groups are relatively small high co-link groups such as discussion groups in blog and review sites. Moreover, by analyzing messages tweeted by these group's users, we found that these groups much differ in relation with followers although these groups resemble in content of tweets.
著者
上田 修功 斉藤 和巳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.3, pp.872-883, 2004-03-01
被引用文献数
8

テキストは,一般に,多重トピックからなる.それゆえ,テキストからの自動トピック抽出は,伝統的なパターン認識で行われている排他的なクラス分類とは異なり,多重を許容するという意味でより困難な分類問題といえる.従来法では,多重トピックテキストの生成モデルが全く考慮されていないため,必然的な性能限界があると考えられる.本論文では多重トピックを有するテキストの新たな確率モデル,パラメトリック混合モデル(PMM1,PMM2)を提案し,次いで,PMMに基づいて,テキストから多重トピックを同時に抽出する手法を論じる.PMMは,単一トピックに対応する基底パラメータで可能なすべての多重トピッククラスを表現でき,PMM1ではパラメータ推定アルゴリズムの大域的最適性が保証され,更に,PMMのパラメータ推定及びトピック予測アルゴリズムは高速,という優れた特長を有する."Yahoo"ドメインの実際のwebページ分類実験により,提案手法の従来手法に対する顕著な優位性を示す.
著者
山岸 祐己 斉藤 和巳
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012, no.2, pp.1-6, 2012-08-02

動画共有サービスに投稿されている楽曲動画の評価法を提案する.一般に,楽曲動画は再生数等の絶対数の推移を用いてランキングされるため,上位にランクインするのは楽曲動画集合のうちの僅かな上澄みであることが多い.これに対し,動画情報に統計的な正規化を施してランキングを行うことにより,全ての楽曲動画を平等な評価基準にかけることを試みる.さらに,動画に対して外的に与えられた情報のみで動画同士の歪み距離を計算し,類似した楽曲動画を探索する手法も提案する.提案法は,いずれも動画共有サービスの特性を上手く利用していることを示す.We propose evaluation methods for VOCALOID music videos which are posted in Nico Nico Douga. Generally, music videos are ranked by transition of the absolute numbers of playbacks and comments. However, the top rankers obtained by this conventional ranking method are limited to a part of the music videos with hot topics. In contrast, we tried to apply all the music videos to equal valuation standards by new ranking methods which uses statistical normalization. Furthermore, we also propose a new technique for searching similar music videos by calculating the distortion distance of video information given externally. We show each proposing methods can make use of the characteristics of video hosting service well.
著者
佐藤 哲司 寶珍 輝尚 関 洋平 手塚 太郎 若林 啓 池内 淳 斉藤 和巳 伏見 卓恭
出版者
筑波大学
雑誌
基盤研究(B)
巻号頁・発行日
2013-04-01

リアルとサイバー複合空間を対象に,知識創造社会を支える第3の社会資本と言われるソーシャルキャピタルの形成・変容過程を解明する.我々の実生活と不可分な存在となっているツイッターから,リアル空間における生活を支援するツイート抽出・生活の局面ラベルを付与する手法を提案した.コミュニティのノード機能に着目することで,構造的特性と意味的特性を表す中心性指標も提案した.急速に拡大しているテキストコミュニケーションにおける話者の役割や親密さを推定する手法を提案した.また,テキスト投稿時の意図推定や意見分析に有効な特徴量の考察,変化変容を扱うための系列データを対象とする機械学習手法の考案にも取り組んだ.
著者
木村 学 斉藤 和巳 上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. AI, 人工知能と知識処理 (ISSN:09135685)
巻号頁・発行日
vol.106, no.38, pp.51-56, 2006-05-11

本稿では、新聞記事のような文書ストリームを対象に、ホットトピック抽出法に関する検討結果を報告する。具体的には、文書出現のバースト性を土台にしたKleinbergの抽出法に村し、単語出現のバースト性を土台にした改良法を提案する。新聞記事一年間分を用いた評価実験では、人手抽出したベンチマークのホットトピック群に対し、Kleinbergのオリジナル抽出法と比較して、提案法が高い抽出性能を示したことを報告する。
著者
上野 雄史 斉藤 和巳 沖本 まどか
出版者
日本行動計量学会
雑誌
行動計量学 (ISSN:03855481)
巻号頁・発行日
vol.43, no.2, pp.197-205, 2016 (Released:2017-06-30)
参考文献数
10

We proposed a new method for analyzing the relationship among industrial sectors by Z-score standardizing and visualizing the input-output tables as minimum spanning trees (MST). These results are also quantitatively evaluated in terms of degree centrality and closeness centrality. We confirmed the effectiveness of our method in comparison with the simple method of no Z-score standardization and with a conventional method based on stock market data. In our experiments, using the input-output tables in Japan in 2000 and 2005 and stock data in 2005, the simple method centralized industrial sectors, (such as other business services whose trade volume is simply larger), while our proposed method centralized sectors, (such as electronics, financial and pharmaceutical industries). In addition, we confirmed that our method showed more accurate economic transaction between industries than the conventional stock analysis method.
著者
小出 明弘 斉藤 和巳 風間 一洋 鳥海 不二夫
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.6, no.2, pp.164-173, 2013-08-21

本稿では,Twitterのフォローネットワークを分析することにより,ユーザのフォローがどのような目的で行われているのか議論する.まず,フォローネットワークの特徴を把握するため,ネットワーク内の高次数ノードに着目し,ブログの読者関係とレビューサイトのお気に入り関係を表したそれぞれのネットワーク構造の特徴と比較する.その結果,ブログやレビューサイトでは,比較的小規模な高コリンクグループが得られたのに対し,フォローネットワークでは,強い双方向関係により構築された大規模な高コリンクグループと,双方向関係がほとんど見られない複数の小規模な低コリンクグループが存在することが分かった.さらに,高次数ノードのツイート集合を分析し,これらのグループは同じようなツイートをしているにもかかわらず,フォロワとの関係に大きな違いが見られることが分かった.
著者
佐藤 哲司 福原 知宏 宝珍 輝尚 斉藤 和巳
出版者
筑波大学
雑誌
基盤研究(C)
巻号頁・発行日
2009

ブログやツイッターなどのUGC(User Generated Contents)は, 複数の著者によって断片的に書かれた記事の集合体である.本研究では, 大量な記事集合における、記事間の関連性や類似性を手がかりに, 記事間や著者間の経時的な変容の解明手法、文章の印象評価手法を確立するとともに, それらの知見に基づく新たな情報探索手法を考案した.質問回答サイトのアーカイブデータ等を用いた評価を行い, 考案手法の有効性を確認した.
著者
山岸 祐己 斉藤 和巳
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012-MUS-96, no.2, pp.1-6, 2012-08-02

動画共有サービスに投稿されている楽曲動画の評価法を提案する.一般に,楽曲動画は再生数等の絶対数の推移を用いてランキングされるため,上位にランクインするのは楽曲動画集合のうちの僅かな上澄みであることが多い.これに対し,動画情報に統計的な正規化を施してランキングを行うことにより,全ての楽曲動画を平等な評価基準にかけることを試みる.さらに,動画に対して外的に与えられた情報のみで動画同士の歪み距離を計算し,類似した楽曲動画を探索する手法も提案する.提案法は,いずれも動画共有サービスの特性を上手く利用していることを示す.
著者
谷 直樹 風間 一洋 榊 剛史 吉田 光男 斉藤 和巳
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.10, no.2, pp.31-41, 2017-06-28

Twitterは現実世界の状況を把握するソーシャルセンサとして活用されており,位置情報が付加されているジオタグ付きツイートを用いた人間の移動や観光地情報の分析がさかんに行われている.本論文では,ジオタグ付きツイートを内容や移動速度,移動距離などの条件に基づいて選別・集積して得られる位置情報から,それらの発言者たちが共通で利用している交通路を抽出する方法を提案する.実際には,まずツイート投稿中またはその前後にユーザが移動したと推定されるツイート群を抽出し,対象地域を細分化した矩形領域内のツイートをHough変換して,交通路の断片である近似線分群を求める.次に,連続していると推定される近似線分をグループ化して,3次スプライン曲線で近似・補間することで,連続した交通路として抽出する.実際に,JR山手線周辺の領域の抽出結果を可視化して,提案手法の特徴を分析する.また,特に鉄道路線に着目して,国土数値情報鉄道時系列データと比較することで,提案手法を評価する.さらに,動的に生成される経路抽出の応用例として,桜並木に沿って移動する花見客の経路を分析する.
著者
山岸 祐己 斉藤 和巳 大久保 誠也
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.26, 2012

レビュー時系列データからの分割統治による変化点検出法を提案する。本研究では、国内の代表的なオンラインレビューサイト「食べログ」のレビュー時系列データを用いて、提案手法の有効性を検証すると共に、詳細な分析によって、レビューサイトにおけるユーザーの評点行動の特性を明らかにする。
著者
岩田 具治 斉藤 和巳 山田 武士
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.107, no.114, pp.57-62, 2007-06-21

オンラインストアの収益を向上させるためには,顧客生涯価値(LTV)を高めることが重要である.従来のリコメンデーション法はユーザの興味と最も適合する商品を推薦する.しかしながら,従来法により必ずしもLTVが高まるとは限らない.本研究では,LTVが上昇する確率を最大化する新たなリコメンデーション法を提案する.提案法では,まずLTVの高いユーザに特徴的な購買パターンを抽出する.そして,抽出されたパターンと同じような購買行動になるように商品を推薦する.生存時間解析を応用し,ログデータから効率的に購買パターンの抽出を行う.また,効果的なリコメンデーションにするため,最大エントロピーモデルを用いてユーザの嗜好を推定する.LTVが高まることはユーザがサービスに満足した結果であるため,提案法はオンラインストアだけでなく,ユーザにとっても好ましいリコメンデーションである.音楽配信サイトの実ログデータを用い,提案法の有効性を示す.
著者
加藤 翔子 小出 明弘 伏見 卓恭 斉藤 和巳
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.26, 2012

新たなユーザー嗜好モデルの構築に向けた一歩として,TwitterのFavorite機能を多重有向グラフとして捉え,Favoriteする頻度がユーザー毎に異なる点に着目し,格差を評価するジニ係数を用いて分析した.具体的には,出・入次数のジニ係数をユーザー毎に求め,相関関係,出・入次数との関係,近接度・媒介度との関係をそれぞれ探究した.また,mention機能についても同様の分析し,結果を比較した.
著者
木村 昌弘 斉藤 和巳
出版者
一般社団法人日本応用数理学会
雑誌
日本応用数理学会論文誌 (ISSN:09172246)
巻号頁・発行日
vol.18, no.3, pp.363-388, 2008-09-25
被引用文献数
1

文書ストリームデータにおける主要潜在トピックの抽出を,文書のBOW表現に基づいて効率よく行う,PMM-PCA法と呼ぶ新たな教師なし学習法を提案する.PMM-PCA法は,PCA法と異なり,単語頻度ベクトル群の時系列として表現された文書ストリームデータに対して,その適切な確率的生成モデルに従うという性質を有している.実際の文書ストリームデータを用いた実験により,提案法の有効性を実証する.
著者
風間 一洋 佐藤 進也 斉藤 和巳 山田 武士
出版者
日本ソフトウェア科学会
雑誌
コンピュータ ソフトウェア (ISSN:02896540)
巻号頁・発行日
vol.24, no.1, pp.1_81-1_90, 2007 (Released:2007-06-11)
被引用文献数
1

本論文では,人間関係のネットワークから活発な人間で構成されるコミュニティ構造を互いの重なりを許容しながら抽出するSR-2法を提案する.本手法は,スペクトラルグラフ分析の一手法であり,ネットワーク構造中で他と重なりを持つような結合が密なコア部を抽出できる特徴を持つSR法を,特に共起ネットワークに対して,より詳細な分類ができるように変更したものである.この特性を調べるために,SR-2法に加えてSR法とk-クリークコミュニティ法を,実際のWebデータから抽出した小規模な人間関係に適用して抽出されたノード集合を可視化すると共に,抽出性能を評価する.さらに,より大規模なネットワークとして論文の共著関係を取り上げ,各手法で抽出されるノード集合のサイズの分布を分析する.この結果,SR-2法は,現実の人間の集まりに対応した妥当なコミュニティ構造を抽出できることを示す.
著者
岩田 具治 斉藤 和巳 山田 武士
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.48, no.6, pp.65-74, 2007-03-15
参考文献数
19

定額制サービスを提供しているオンラインストアが収益をあげるためには,ユーザの契約期間をできるだけ延ばすことが必要である.従来レコメンド法では,購入される確率を最大化するためにユーザの嗜好に合致する商品を提示する.しかしながら,従来法により必ずしも契約期間が延びるとは限らない.本研究では,定額制サービスを想定し,契約期間が延びる確率を最大にするレコメンド法を提案する.提案法では,まず契約期間の長いユーザに特徴的な購買パターンを抽出する.そして,抽出されたパターンと同じような購買行動になるように商品をレコメンドする.生存時間解析を応用し,ログデータから効率的に購買パターンの抽出を行う.また,効果的なレコメンドにするため,最大エントロピーモデルを用いてユーザの嗜好を推定する.契約期間が延びることはユーザがサービスに満足した結果であるため,提案法はオンラインストアだけでなく,ユーザにとっても好ましいレコメンドである.携帯電話用漫画配信サイトのログを用い,提案法の有効性を示す.Online stores providing subscription services need to extend user subscription periods as long as possible to increase their profits. Conventional recommendation methods recommend items that best coincide with user's interests to maximize the purchase probability, which does not necessarily contribute to extend subscription periods. We present a novel recommendation method for subscription services that maximizes the probability of the subscription period being extended. Our method finds frequent purchase patterns in the long subscription period users, and recommends items for a new user to simulate the found patterns. Using survival analysis techniques, we efficiently extract information from the log data for finding the patterns. Furthermore, we infer user's interests from purchase histories based on maximum entropy models, and use the interests to improve the recommendations. Since a longer subscription period is the result of greater user satisfaction, our method benefits users as well as online stores. We evaluate our method using the real log data of an online cartoon distribution service for cell-phone.