著者
小渕 智之 樺島 祥介
出版者
一般社団法人 日本物理学会
雑誌
日本物理学会誌 (ISSN:00290181)
巻号頁・発行日
vol.76, no.3, pp.140-149, 2021-03-05 (Released:2021-03-05)
参考文献数
18

「史上初,ブラックホールの撮影に成功」というニュースを覚えておられる読者も多いだろう.この成功の裏には,観測数の足りない推定問題という不良設定問題をいかにして解くかという数理科学・情報科学における技術の進展があった.ポイントは「適切な表現のもとでデータはスパースに表現できる」と仮定することで,不良設定問題を現実的に解ける問題に置き換えることであった.このような方法論をスパースモデリング(SpM)とよぶ.もちろんこの仮定の良し悪しは別途検証されなければならない.ブラックホールの例では,人工擬似観測データや較正天体データを用いて,SpMによる方法がきちんとした性能を上げることが慎重に検証された.一方,個別問題における検証以外に,SpMによる方法論自体の限界を理論的に押さえておくことも重要である.すなわちデータの観測過程をモデル化,推定方式を定式化した上で,どういう条件なら真の信号が正しく復元できるかを理論的に問うのである.伝統的には統計学や情報理論で扱われる問題設定であるが,近年では統計力学を用いたアプローチも行われるようになってきている.情報統計力学とよばれる分野である.情報統計力学における近年の成果の1つとして,平均場近似を用いた汎用的な推定アルゴリズムの導出法と,その挙動を解析するためのマクロなダイナミクスの理論が整備されたことが挙げられる.このアルゴリズムは,Cavity法という平均場近似の一種を,確率伝搬法というベイズ推定における近似的アルゴリズムの観点から見直すことで導出される.このアルゴリズムの特徴は,計算量が非常に少ないこと,およびアルゴリズムを記述するパラメータ間の相関が熱力学極限で無視できるという点にある.後者のおかげで,系のマクロなダイナミクスが,それらパラメータの平均や二乗平均のみで記述できるという単純化が起こる.これにより,アルゴリズムによって到達可能な推定精度や収束までのスピードなどが議論できる.つまりアルゴリズムのある種の性能保証をすることが可能となる.面白いことに,このマクロなダイナミクスは系の大域的な平衡解析による結果と厳密に対応する.すなわち,このアルゴリズムによる推定精度限界(アルゴリズム限界)は,原理的に到達可能な限界(情報理論限界)と密接に関わっている,場合によっては厳密に一致する,ことが示される.この平均場アルゴリズムとマクロダイナミクス解析を,SpMの問題に応用することができる.推定方式としてベイズ推定やl1正則化付き線形回帰などが考えられるが,いずれの方式もこの方法論で系統的に解析することができる.特に興味深いのは,真の信号の復元に必要な観測数である.解析の結果,復元に必要な観測数はベイズ推定のほうが少なく済むこと,真の信号の非ゼロ要素の分布形状によってはベイズ推定のアルゴリズム限界が情報理論限界と一致することなど,SpMの理論性能を明らかにする上で有用な情報が明らかとなる.また,推定誤差は必要な観測数の前後でゼロから有限の値に立ち上がるが,これが物理的には相転移に対応し,l1線形回帰とベイズ推定では相転移の次数が異なることも同様に明らかとなる.
著者
竹田 晃人 小渕 智之 高橋 和孝
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.110, no.265, pp.231-238, 2010-10-28

情報理論と物理学における統計力学の関係はこれまでに数多く指摘されているが,本稿では近年Merhavにより調べられた階層構造を持つランダム符号に関する統計力学的性能解析法について議論する.統計力学的見地ではランダム符号はランダムエネルギー模型と呼ばれる可解なスピングラスの模型として捉えられることが知られている.それを踏まえ,本研究では前述の階層的ランダム符号が一般化離散ランダムエネルギー模型という可解なスピングラスの模型と完全に対応することを述べ,かつこの対応関係を利用することでデータ圧縮(情報源符号化)・通信路符号化における階層的ランダム符号の性能を直接かつ系統的に調べることが可能であることを示す.