著者
牧野 貴樹 合原 一幸
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.27, no.4, pp.253-262, 2012 (Released:2012-08-03)
参考文献数
24

It is not easy to test software used in studies of machine learning with statistical frameworks. In particular, software for randomized algorithms such as Monte Carlo methods compromises testing process. Combined with underestimation of the importance of software testing in academic fields, many software programs without appropriate validation are being used and causing problems. In this article, we discuss the importance of writing test codes for software used in research, and present a practical way for testing, focusing on programs using Monte Carlo methods.
著者
牧野貴樹著
出版者
暗黒通信団
巻号頁・発行日
1996
著者
牧野 貴樹 滝 久雄 合原 一幸
出版者
東京大学生産技術研究所
雑誌
生産研究 (ISSN:0037105X)
巻号頁・発行日
vol.62, no.3, pp.259-265, 2010-05-01 (Released:2010-09-22)
参考文献数
10

試行錯誤を通して学習するエージェントが利他的行動を獲得するために必要な他者モデルの要素を,繰り返し囚人のジレンマゲームの計算機シミュレーションにより調べた。実験の結果,他者モデルを持たないエージェントや,予測した他者の行動だけを参照するエージェントよりも,推定した他者の内部状態に基づいて行動決定するエージェントのほうが,高確率で相互協調に至ることが明らかになった。また,再帰的な推定構造をもつ他者モデルや,自己と他者の相互の入れ子構造を有する他者モデルを利用すると,相互協調に至る確率がさらに高まった。
著者
牧野 貴樹
出版者
東京大学生産技術研究所
雑誌
生産研究 (ISSN:0037105X)
巻号頁・発行日
vol.66, no.3, pp.305-308, 2014-05-01 (Released:2014-07-31)
参考文献数
20

機械学習技術の中でも、強化学習は、試行錯誤を通して最適化する研究領域として知られているが、ロボットのような自律システムのための手法であると狭く捉えられることが少なくなかった。しかし、近年、データの集め方を含めた未知の環境に対する最適化の技術として、多くの興味深い分野で応用され始めている。本解説では、強化学習の研究がどのような問題に応用できるかを概観するために、システムへの働きかけ・ヒトへの働きかけ・探索問題の効率化・分散最適化・ヒトのモデル化に関する応用例について紹介する。
著者
木脇 太一 牧野 貴樹 合原 一幸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.112, no.279, pp.103-106, 2012-10-31

Restricted Boltzmann Machine(RBM)の過学習問題を緩和するために隠れ変数のエントロピーを正規化項として用いる学習手法を提案する.従来のRBMには不要な複雑性を取り除くための機構が欠如していたため,データの複雑性に関係なく必要以上に複雑な表現を学習してしまう,いわゆる過学習が問題となっていた.本手法ではデータに合わせて最適なRBMの複雑性が動的に調節される,いわゆるモデル選択をRBM上に実現する.本稿ではこの正則化項に基づく学習アルゴリズムを統計力学の手法を用いて導出する.