著者
福水 健次 鈴木 大慈 小林 景
出版者
統計数理研究所
雑誌
基盤研究(B)
巻号頁・発行日
2014-04-01

H29年度はカーネル法の効率的計算アルゴリズムの課題を中心に研究を遂行した.まず,カーネル法を用いた分布間の距離尺度としてよく用いられる Maximum Mean Discrepancy (MMD)の効率的計算に関して研究を行った.MMDの計算は,そのまま実行するとサンプル数 n に対して O(n^2) の計算量がかかるため大規模なデータに使うことが難しい.これに対し,MMDをU統計量として表現して,データからのランダムサンプリングを行う不完全U統計量の計算を行うと,計算量が削減されるだけでなく,分布の均一性検定の帰無分布が漸近正規性を満たすという非常に良いよい性質を持つことが分かった.この結果に基づいて,MMDの効率計算を従来から研究を行っていた事後選択推論(Post Selection Inference)に応用した論文をまとめて投稿準備を行っている.また,カーネル法を用いた自然言語処理における共起尺度に関して共同研究を行い,低ランク近似の方法を用いることによって比較的少ない計算量で尺度を構築することが可能で,巨大なコーパスからでも学習が可能であることを示した.さらに,カーネル法による分布埋め込みに関するサーベイ論文を出版した.このトピックは本課題においても大きな役割を果たす技術であるが,まとまって書かれた教科書などは存在していなかった.本サーベイ論文は技術を普及するうえで重量な役割を持つと考える.