はじめに
データを使って仮説の生成と検証を行なうための方法であるベイズ最適化を学ぶために,今村秀明・松井孝太 著「ベイズ最適化 ー適応的実験計画の基礎と実践ー」を読むことにした。
本記事は,「第3章 ベイズ最適化のアルゴリズム」における,ハイパーパラメータの取り扱いに関する読書メモである。
- 本書の紹介ページ
3.10 ハイパーパラメータの取り扱い
本節では,ベイズ最適化において登場するハイパーパラメータの取り扱いについて説明している。
ベイズ最適化におけるハイパーパラメータには,
- 仮定する統計モデルのハイパーパラメータ
- 獲得関数のハイパーパラメータ
などがある。
後者の獲得関数のハイパーパラメータは,事前に決め打ちすることが多いが,前者の統計モデルのハイパーパラメータはベイズ最適化の途中で調節することが多い。
統計モデルのハイパーパラメータ
統計モデルにおいてガウス過程回帰を用いた場合,カーネル関数のハイパーパラメータが挙げられる。
二乗指数カーネル
の場合,値スケールと長さスケールを表すパラメータと
が存在する。
また,の次元ごとに長さスケール
を関gな得たARDカーネル
を用いると,ハイパーパラメータは,観測値のノイズの標準偏差,値スケールと長さスケール
の
個が存在する。
ベイズ的なモデル選択
ベイズ的なモデル選択においてハイパーパラメータを選択するには,タイプII最尤推定(type II maximum likelihood estimation)を用いる。
統計モデルとして,パラメトリックなものを考える。をパラメータ,
をハイパーパラメータとする。
を尤度関数,
をパラメータの事前分布とすると,
をについて最大化することがタイプII最尤推定である。
まとめと感想
今回は,「第3章 ベイズ最適化のアルゴリズム」のうち, ハイパーパラメータの取り扱いについて学んだ。
ベイズ最適化においては,目的関数にベイズ線形回帰モデルやガウス過程回帰モデルを用いるので,ハイパーパラメータの選択にはベイズ統計の手法であるタイプII最尤推定などを用いることができる。また解析的に事後分布が計算できない時にMCMCを用いることも,ベイズ統計ではおなじみの方法である。
P135の式(3.152)について,直感的に分かりづらかったので少し丁寧に式展開したところ,誤植と思われる箇所が見つかった。手元にあるのは初版なので,今度書店に行くときに最新版を手に取って確認してみたい。
本記事を最後まで読んでくださり,どうもありがとうございました。
*1:本書の初版では,式(3.152)におけるが
になっている。