はじめに
データを使って仮説の生成と検証を行なうための方法であるベイズ最適化を学ぶために,今村秀明・松井孝太 著「増補改訂版 ベイズ最適化 ー適応的実験計画の基礎と実践ー」を読むことにした。
本記事は,「第5章 ベイズ最適化の理論解析」における,最大情報獲得量の解析に関する参考論文の読書メモである。
目次
5.4.2 最大情報獲得量の解析の補足
5.4.2節では,最大情報獲得量の上界評価の結果を示していた。この評価の導出は,
S. Vakili et al. "On Information Gain and Regret Bounds in Gaussian Process Bandits" にまとめられていた。
この論文をもとに,上界評価に関する証明の流れを確認した。なお本論文において,上界評価の証明はかなり丁寧に説明されているが,本記事では証明のおおまかな流れをまとめている。また扱っている変数は,この論文ではなく本書の表記にできるだけ合わせた。

本記事は,「増補改訂版 ベイズ最適化」を読む ~第5章 ベイズ最適化の理論解析 ⑧(補足)最大情報獲得量の評価の流れ(準備編)~ - jiku logの続きである。
目的
この評価の目的は,最大情報獲得量に関する不等式に基づき,この上界を評価することである。
最大情報獲得量は,情報獲得量
基本方針
情報獲得量にはカーネル関数が含まれているので,このカーネル関数に関する評価を行なうことになる。そのままだと評価がしづらいので,Mercerの定理により再生核ヒルベルト空間(RKHS)上の固有関数に展開する(Mercer表現)ことを考えるが,この固有関数は無限次元であり扱いづらい。
そのため,Mercer表現を有限次元空間に射影してから評価を行なう。有限次元の成分を取り出すことで,この部分は行列に関する不等式によって,評価を行なうことが可能になる。
準備
準備として,「増補改訂版 ベイズ最適化」を読む ~第5章 ベイズ最適化の理論解析 ⑧(補足)最大情報獲得量の評価の流れ(準備編)~ - jiku log にカーネル行列の分解に関する説明を行なった。
最大情報獲得量の上界評価の流れ
以下では,本書の定理5.4.8の証明の流れを,参考論文のAppendices A に沿って確認した。
Step 2. Kpに関する部分の評価
に関する部分である
Step 2-1. Weinstein–Aronszajn identity
の部分を評価するために,
ここで, という等式(Weinstein–Aronszajn identity)を用いると,グラム行列
Step 2-2. 正定値行列に関する不等式
参考論文で証明されているように,正定値行列について,
Step 2-3. Kpに関する部分の評価
先に示したグラム行列のトレースは,カーネル関数で表現することができ,
これと,Step 2-2. の正定値行列に関する不等式を用いると,最終的に
Step 3. Koに関する部分の評価
2つの正定値行列のトレースに関する不等式
これと,仮定5.4.2の3番目の仮定および不等式を用いると,最終的に
Step 4. 最大情報獲得量の上界評価
Step 1. ~ Step 3.の結果より,情報獲得量について
が得られる。よって最大情報獲得量について,
まとめと感想
今回は,「第5章 ベイズ最適化の理論解析」における,最大情報獲得量の解析に関する参考論文を読み,証明の流れをまとめた。
最大情報獲得量の上界評価について,その導出手順を確認した。
カーネル関数をMercer展開により固有関数へ分解し,有限次元部分と無限次元部分に切り分けることで,有限次元成分に対して行列不等式を適用できる形に変換している。
有限次元成分は固有値が大きい上位個に対応し,残差成分は固有値が小さい高次元成分として扱われる。この分解により,情報獲得量を有限次元部分と残差部分に分け,それぞれに仮定に基づく上界評価を適用する流れが明確になった。特に,Weinstein–Aronszajn identity の利用により,行列式の評価をより扱いやすい形に変形している点が重要である。
本記事を最後まで読んでくださり,どうもありがとうございました。