著者
永田 賢二 杉田 靖司 佐々木 岳彦 岡田 真人
出版者
一般社団法人 日本物理学会
雑誌
日本物理学会誌 (ISSN:00290181)
巻号頁・発行日
vol.69, no.12, pp.876-880, 2014-12-05 (Released:2018-09-30)

あらゆる物理学の分野において,実験データから必要な情報を抜き出す作業は日常的に行われることである.特にデータの中から複数のピークを探し出し,その位置や広がりを評価することは,実に多くの場面で重要となる.実験データからピーク位置の情報をフィッティングなどで取り出すこと自体は,グラフソフトなどを使えばそれほど難しいことではない.ところが「いったい何個のピークがあるのか」ということを判断することは難しい.ほとんどの場合,何個のピークがあるかを判断するのは解析者の直感に委ねられる.しかし,時に何個のピークがあるか迷うデータに遭遇することもあるだろう.例えば,右下の図は複数のガウス関数の和にノイズを加えて生成した,人工的な実験データである.果たして何個のピーク(ガウス関数)があるのか,判断できるであろうか.データのみからピークの個数を決定することは,理論的にも難しい問題である.例えば,データとフィッティング関数の差(誤差関数)を最小化してピークの個数を決定しようとすると,ピークの数を増やすことでいくらでも誤差を下げることができてしまう.このようなノイズまでフィットしてしまう「オーバーフィッティング」の問題を避けるためには,誤差関数だけでなく,モデルの複雑さとのトレードオフを兼ね備えた関数を考える必要がある.また同様の問題として,実験データを多項式でフィットする問題を挙げることができる.n点のデータに対して,n-1次の多項式でフィットさせると,誤差なくすべてのデータをフィットさせることができるが,意味のないデータ解析であることは明らかであろう.このような,ピークの個数の決定や多項式の次数の決定の問題は,統計学の分野において「モデル選択」と呼ばれている.モデル選択の問題に対しては,赤池情報量規準やベイズ情報量規準といった情報科学の分野で開発されたモデル選択規準が広く使われており,多項式フィッティングの問題をはじめとして,様々なモデル選択で一定の成功を収めている.しかし,ピーク個数の決定については,モデルに内在する数理的な構造の複雑さにより,これらのモデル選択基準の適用により決定することが困難である.最近になって,ベイズ推定とモンテカルロ法を組み合わせた新しい手法が開発され,ピーク個数の決定に応用されるようになった.この手法は,ベイズ推定で記述される評価関数に現れる量を「分配関数」「自由エネルギー」などに読みかえることで,モンテカルロ法を適用するといった特徴を持っている.本稿では,なるべく専門性の高い内容は避け,ベイズ推定によるモデル選択の枠組みを概説し,実際に「右図は3つのピークが合成されている」と考えるのが最も自然であることを示す.