著者
秋葉 拓哉 林 孝紀 則 のぞみ 岩田 陽一
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.2, pp.B-F71_1-12, 2016-03-01 (Released:2016-02-18)
参考文献数
39

Estimating the relevance or proximity between vertices in a network is a fundamental building block of network analysis and is useful in a wide range of important applications such as network-aware searches and network structure prediction. In this paper, we (1) propose to use top-k shortest-path distance as a relevance measure, and (2) design an efficient indexing scheme for answering top-k distance queries. Although many indexing methods have been developed for standard (top-1) distance queries, no methods can be directly applied to top-k distance. Therefore, we develop a new framework for top-k distance queries based on 2-hop cover and then present an efficient indexing algorithm based on the recently proposed pruned landmark labeling scheme. The scalability, efficiency and robustness of our method are demonstrated in extensive experimental results. It can construct indices from large graphs comprising millions of vertices and tens of millions of edges within a reasonable running time. Having obtained the indices, we can compute the top-k distances within a few microseconds, six orders of magnitude faster than existing methods, which require a few seconds to compute these distances. Moreover, we demonstrate the usefulness of top-k distance as a relevance measure by applying them to link prediction, the most fundamental problem in graph data mining. We emphasize that the proposed indexing method enables the first use of top-k distance for such tasks.
著者
則 のぞみ ボレガラ ダヌシカ 鹿島 久嗣
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.26, 2012

ソーシャルWebサービスにおいて、他のユーザとのコミュニケーションや、コンテンツへのアノテーションなどといったユーザの行動は重要な役割を果たす。ユーザの行動は、ユーザ、文書、キーワード、場所など、複数の異種オブジェクトを巻き込んだ関係データとして表現されるため、これらを限定されたデータから予測することは困難である。本研究では、観測データの疎性に対して頑強な多オブジェクト間関係の予測法を提案する。
著者
則 のぞみ 鹿島 久嗣 山下 和人 猪飼 宏 今中 雄一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.2, pp.194-204, 2017-02-01

ICU入室患者の死亡リスク予測問題において,疾病によってリスク要因がどのように死亡リスクに関係するかが異なる点を考慮するために,疾病ごとに個別化した予測モデルを構築する.疾病ごとの個別化に際して課題となるデータの疎性に対処するために,疾病の分類と電子健康記録の分類に関する二つのドメイン知識を取り込むマルチタスク学習手法を提案し,医療機関における実データを用いた実験で提案手法の有効性を示す.
著者
則 のぞみ ボレガラ ダヌシカ 鹿島 久嗣
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.29, no.1, pp.168-176, 2014-01-05 (Released:2014-01-07)
参考文献数
24
被引用文献数
1 1

Many phenomena in the real world can be represented as multinomial relations, which involve multiple and heterogeneous objects. For instance, in social media, users' various actions such as adding annotations to web resources or sharing news with their friends can be represented by multinomial relations which involve multiple and heterogeneous objects such as users, documents, keywords and locations. Predicting multinomial relations would improve many fundamental applications in various domains such as online marketing, social media analyses and drug development. However, the high-dimensional property of such multinomial relations poses one fundamental challenge, that is, predicting multinomial relations with only a limited amount of data. In this paper, we propose a new multinomial relation prediction method, which is robust to data sparsity. We transform each instance of a multinomial relation into a set of binomial relations between the objects and the multinomial relation of the involved objects. We then apply an extension of a low-dimensional embedding technique to these binomial relations, which results in a generalized eigenvalue problem guaranteeing global optimal solutions. We also incorporate attribute information as side information to address the ``cold start"problem in multinomial relation prediction. Experiments with various real-world social web service datasets demonstrate that the proposed method is more robust against data sparseness as compared to several existing methods, which can only find sub-optimal solutions.
著者
秋葉 拓哉 林 孝紀 則 のぞみ 岩田 陽一
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
pp.B-F71, (Released:2015-10-27)
参考文献数
39

Estimating the relevance or proximity between vertices in a network is a fundamental building block of network analysis and is useful in a wide range of important applications such as network-aware searches and network structure prediction. In this paper, we (1) propose to use top-k shortest-path distance as a relevance measure, and (2) design an efficient indexing scheme for answering top-k distance queries. Although many indexing methods have been developed for standard (top-1) distance queries, no methods can be directly applied to top-k distance. Therefore, we develop a new framework for top-k distance queries based on 2-hop cover and then present an efficient indexing algorithm based on the recently proposed pruned landmark labeling scheme. The scalability, efficiency and robustness of our method are demonstrated in extensive experimental results. It can construct indices from large graphs comprising millions of vertices and tens of millions of edges within a reasonable running time. Having obtained the indices, we can compute the top-k distances within a few microseconds, six orders of magnitude faster than existing methods, which require a few seconds to compute these distances. Moreover, we demonstrate the usefulness of top-k distance as a relevance measure by applying them to link prediction, the most fundamental problem in graph data mining. We emphasize that the proposed indexing method enables the first use of top-k distance for such tasks.
著者
丸井 淳己 則 のぞみ 榊 剛史 森 純一郎
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会研究会資料 知識ベースシステム研究会 102回 (2014/7) (ISSN:24364592)
巻号頁・発行日
pp.10, 2014-07-24 (Released:2021-07-14)

It is now common to have a conversation with others on social media. Many research have been taken to see the community structure on social media, but there are few studies that apply link-based community (link community) detection on a large social network. Link community detection allows users to belong to more than one community. We improve the method of existing link community detection of Ahn et al., which extracts many small communities. We evaluate existing and proposing methods by network indexes, and we characterize link communities from users' biographies. We found that link communities sharing users have similar characteristics from biographies.
著者
丸井 淳己 則 のぞみ 榊 剛史 1 森純 一郎 Marui 1 Junki Nori 2 Nozomi Sakaki 1 3 Takeshi Mori 1 Junichiro
雑誌
SIG-KBS = SIG-KBS
巻号頁・発行日
vol.B4, no.01, pp.51-56, 2014-07-24

It is now common to have a conversation with others on social media. Many research have been taken to see the community structure on social media, but there are few studies that apply link-based community (link community) detection on a large social network. Link community detection allows users to belong to more than one community. We improve the method of existing link community detection of Ahn et al., which extracts many small communities. We evaluate existing and proposing methods by network indexes, and we characterize link communities from users' biographies. We found that link communities sharing users have similar characteristics from biographies.
著者
丸井 淳己 則 のぞみ 榊 剛史 森 純一郎
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

近年Twitterのユーザは様々な年代・コミュニティに渡るようになった。ユーザの背景によって単語の使い方が違うと考えられるため、本研究ではTwitterのコミュニティ毎に使用される単語の違いを調べた。よく会話をするユーザ群をコミュニティとしてユーザのグループ分けを行った。さらにニューラルネットワークから計算した単語の分散表現を用いて単語の使われ方の違いを見た。
著者
則 のぞみ
出版者
京都大学
雑誌
特別研究員奨励費
巻号頁・発行日
2014-04-25

本年度特別研究員は、ICU入室患者が有する複数の疾病の組合せを反映する患者に個別化されたリスク予測手法を開発した。特別研究員はこれまでの研究で、疾病をタスクの単位とするマルチタスク学習手法により、疾病に個別化された予測モデルを構築した。しかし、患者は通常複数の疾病を有するため、これら複数の疾病の組合せを考慮することで、患者の個別性をより捉えたモデル構築が可能になると期待される。一方、患者の有する疾病の組合せは多くの場合、当該患者に固有の組合せとなるため、疾病の組合せごとにタスクを明示的に構築するようなナイーブな手法は有効ではない。特別研究員は患者の個別性を捉えたモデリングのため、患者が有する複数の疾病群から患者の潜在的なタスクを学習するマルチタスク学習手法を開発した。また、実データを用いた実験により、提案手法の有用性を予測精度や予測モデルに基づく知見抽出等の観点から評価した。提案手法により、患者に個別化されたリスク予測および学習モデルの分析等を通じた患者の個別性に対する知見抽出が期待された。更に、その他のこれまでの研究テーマについても、より網羅的な評価実験等を行い研究を進めた。
著者
則 のぞみ ボレガラ ダヌシカ 石塚 満
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.4, pp.613-625, 2015-07-01 (Released:2015-07-03)
参考文献数
29

We propose a method to predict users' interests by exploiting their various actions in social media. Actions performed by users in social media such as Twitter and Facebook have a fundamental property: user action involves multiple entities - e.g. sharing URLs with friends, bookmarking and tagging web pages, clicking a favorite button on a friend's post etc. Consequently, it is appropriate to represent each user's action at some point in time as a higher-order relation. We propose ActionGraph, a novel graph representation to model users' higher-order actions. Each action performed by a user at some time point is represented by an action node. ActionGraph is a bipartite graph whose edges connect an action node to its involving entities, referred to as object nodes. Using real-world social media data, we empirically justify the proposed graph structure. We show that the prediction accuracy can be improved by adequately aggregating various actions. Moreover, our experimental results show that the proposed ActionGraph outperforms several baselines, including standard tensor analysis PARAFAC, a previously proposed state-of-the-art LDA-based method and other graph-based variants, in a user interest prediction task. Although a lot of research have been conducted to capture similarity between users or between users and resources by using graph, our paper indicates that an important factor for the prediction performance of the graph mining algorithm is the choice of the graph itself. In particular, our result indicates that in order to predict users activities, adding more specific information about users activities such as types of activities makes the graph mining algorithm more effective.
著者
則 のぞみ 鹿島 久嗣 山下 和人 猪飼 宏 今中 雄一
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.29, 2015

ICU入室患者の死亡リスク予測において,疾病によって死亡リスクを説明するルールが異なるという“ 疾病コンテキスト”を考慮するために,疾病ごとに個別化した予測モデルを構築する.疾病ごとの個別化に際して課題となるデータの疎性に対処するために,疾病の分類とEHRの分類に関する二つのドメイン知識を取り込むマルチタスク学習手法を提案し,医療機関における実データを用いた実験で提案手法の有効性を示す.
著者
則 のぞみ ボレガラ ダヌシカ 鹿島 久嗣
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

本論文では,関係データ予測におけるデータ過疎の問題を解決するために,複数の情報源からの関係データを統合する予測手法を提案する.提案手法では複数種類の関係データをそれぞれハイパーグラフにおける接続行列に変換し,非線形写像を適用する.現実のデータセットを用いた実験により,提案手法が一種類の関係データに基づく既存手法や複数種類のテンソル同時分解などを上回る予測精度を持つことを示す.