著者
下平 英寿 清水 昌平
出版者
京都大学
雑誌
基盤研究(B)
巻号頁・発行日
2016-04-01

画像,タグ,文書等の様々な種類(ドメインと呼ぶ)の情報源から得られるデータベクトルと,データベクトル間の関連性の強さに関する情報が得られているデータを,多ドメイン関連性データと呼ぶ.従来の多変量解析ではベクトルが1対1対応するものを扱っていたため,柔軟なデータ構造を表すことができなかった.本研究ではベクトルの関連性をグラフ(ネットワーク)で表現して,そのグラフ構造をなるべく保存するように次元削減を行う情報統合の方法を提案・発展させた.
著者
下平 英寿
出版者
大阪大学
雑誌
新学術領域研究(研究領域提案型)
巻号頁・発行日
2014-04-01

大規模なネットワークデータが近年容易に入手できるようになり,ネットワークに潜む構造を理解することが応用上も重要になっている.ネットワークは多くの場合スパース性をもち,ノードとリンクからなるグラフと考えると各ノードが他のノードに接続するリンク数(次数)はノード数に比べてとても小さい.このような複雑ネットワークの研究が注目されているが,ネットワークデータを統計解析するツールの研究は不十分で,今後さらに重要になると考える.そこで本研究では,ネットワークデータの統計解析を通して創造的に多様なスパースモデリングを探求する.とくに,ネットワーク成長モデルの優先的選択関数やスパース正則化の正則化関数の関数形に着目したモデリングを探求する.(1)既知のネットワークの生成メカニズムに興味がある場合,成長ネットワークモデルをネットワークデータに適用して,生成モデルを推定する.ノード接続の優先的選択関数のノンパラメトリック推定法を考案して分析ツールのソフトウエアPAFitとしてCRANに公開していたが,さらにノード適応度も同時にベイズ推定する手法を提案してソフトウエアを公開した.youtubeやfacebook等のソーシャルネットワークの実データに適応してその有効性を検証した.(2)未知のネットワーク構造をグラフィカルモデルによって推定する場合,正則化項を加えたスパース推定を行う.この正則化項のモデリングを工夫して,ランダムグラフとスケールフリーネットワークの両者を含む一般的な正則化項を提案し検証を行った.