著者
永田 賢二 杉田 靖司 佐々木 岳彦 岡田 真人
出版者
一般社団法人 日本物理学会
雑誌
日本物理学会誌 (ISSN:00290181)
巻号頁・発行日
vol.69, no.12, pp.876-880, 2014-12-05 (Released:2018-09-30)

あらゆる物理学の分野において,実験データから必要な情報を抜き出す作業は日常的に行われることである.特にデータの中から複数のピークを探し出し,その位置や広がりを評価することは,実に多くの場面で重要となる.実験データからピーク位置の情報をフィッティングなどで取り出すこと自体は,グラフソフトなどを使えばそれほど難しいことではない.ところが「いったい何個のピークがあるのか」ということを判断することは難しい.ほとんどの場合,何個のピークがあるかを判断するのは解析者の直感に委ねられる.しかし,時に何個のピークがあるか迷うデータに遭遇することもあるだろう.例えば,右下の図は複数のガウス関数の和にノイズを加えて生成した,人工的な実験データである.果たして何個のピーク(ガウス関数)があるのか,判断できるであろうか.データのみからピークの個数を決定することは,理論的にも難しい問題である.例えば,データとフィッティング関数の差(誤差関数)を最小化してピークの個数を決定しようとすると,ピークの数を増やすことでいくらでも誤差を下げることができてしまう.このようなノイズまでフィットしてしまう「オーバーフィッティング」の問題を避けるためには,誤差関数だけでなく,モデルの複雑さとのトレードオフを兼ね備えた関数を考える必要がある.また同様の問題として,実験データを多項式でフィットする問題を挙げることができる.n点のデータに対して,n-1次の多項式でフィットさせると,誤差なくすべてのデータをフィットさせることができるが,意味のないデータ解析であることは明らかであろう.このような,ピークの個数の決定や多項式の次数の決定の問題は,統計学の分野において「モデル選択」と呼ばれている.モデル選択の問題に対しては,赤池情報量規準やベイズ情報量規準といった情報科学の分野で開発されたモデル選択規準が広く使われており,多項式フィッティングの問題をはじめとして,様々なモデル選択で一定の成功を収めている.しかし,ピーク個数の決定については,モデルに内在する数理的な構造の複雑さにより,これらのモデル選択基準の適用により決定することが困難である.最近になって,ベイズ推定とモンテカルロ法を組み合わせた新しい手法が開発され,ピーク個数の決定に応用されるようになった.この手法は,ベイズ推定で記述される評価関数に現れる量を「分配関数」「自由エネルギー」などに読みかえることで,モンテカルロ法を適用するといった特徴を持っている.本稿では,なるべく専門性の高い内容は避け,ベイズ推定によるモデル選択の枠組みを概説し,実際に「右図は3つのピークが合成されている」と考えるのが最も自然であることを示す.
著者
吉川 英樹 篠塚 寛志 永田 賢二
出版者
公益社団法人 応用物理学会
雑誌
応用物理 (ISSN:03698009)
巻号頁・発行日
vol.92, no.1, pp.41-45, 2023-01-01 (Released:2023-01-01)
参考文献数
6

表面分析法は,深さ方向に原子層からマイクロメートルレベルの広いダイナミックレンジを持つ試料表層において,試料の組織や化学組成などを分析する手法である.そのため表面分析は,分析の際の試料処理やデータ解析における分析者の知識と熟練の経験を要し,計測分野の中でもデータ解析の自動化が特に困難な技術の1つとなっています.この困難さを克服してデータ解析の自動化を行うには,熟練の分析者の暗黙知となっている経験をデータ駆動型のアプローチによって明らかにすることが重要となります.本稿では,表面分析法の1つとしてX線光電子分光を対象としたデータ駆動型のアプローチによるデータ解析の自動化の実例を紹介します.
著者
本武 陽一 五十嵐 康彦 竹中 光 永田 賢二 岡田 真人
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第31回全国大会(2017)
巻号頁・発行日
pp.2I23in2, 2017 (Released:2018-07-30)

ノンパラメトリックなスパース変数選択法として,L1VMがL1正則パラメータλをone-standard ruleなどのアドホックな手法によって最適化されて適用されてきた.本研究では,L1VMで抽出された説明変数を用い,交差検証誤差やベイズ自由エネルギーによって各λから求められた説明変数を評価する枠組み(λ-スキャン法)を提案する.提案手法をスペクトル分解に適用し,その有効性を検証する.
著者
市川 寛子 川端 大貴 五十嵐 康彦 永田 賢二 永福 智志 田村 了以 岡田 真人
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

我々は識別問題に対して,N個の入力変数からK個選んだすべての変数の組み合わせに対して,クロスバリデーションエラー(CVE) を計算し,その分布を求めるK-スパース全状態探索をもちいた変数選択法を提案した.本研究では,この手法の数理的な性質を研究するために,実データ解析だけでなく,仮想計測実験(VMA)を用いて,この手法の数理的な性質を調べた結果を報告する.
著者
徳田 悟 永田 賢二 岡田 真人
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.29, 2015

学習において,確率分布の構造はサンプルの個数が増えるにつれて徐々に明らかになる.ではサンプル数が少なくともいくつであれば,その構造を発見できるのであろうか?我々は物質の相転移を議論する統計力学との数理的等価性に基づき,ベイズ学習における系の秩序変数を計算し,その転移点が学習に必要な最低サンプル数に対応することを示す.ニューラルネットワークの一種である動径基底関数ネットワークにおいてその検証を行う.