はじめに
この記事は,統計・機械学習の数理 Advent Calendar 2025の8日目の記事である。
持橋大地・鈴木大慈 監訳「確率的機械学習 入門編I」のP124に,ベイズ統計や機械学習ではおなじみの事後予測分布 (posterior predictive distribution)の式
果たして,この等式は自明だろうか?
3変数以上を扱う式は事後予測分布の理解に必要であるため,本記事では,ベイズ統計における3変数以上の公式を整理し,事後予測分布の式を導出するまでの流れを説明する。
なお本記事で説明する内容は「公式」というより「応用テクニック」に近いものであるが,本記事中では便宜上「3つの公式」と表現する。
ベイズ統計における基本的な公式
同時分布と条件付き分布
確率変数の同時分布(同時確率密度関数)は
が与えられたもとでの
の確率密度関数を条件付き分布(条件付き確率密度関数)といい,
周辺分布
同時分布が与えられた下で,1つの確率変数に関する周辺分布(marginal distribution)は
条件付き確率と組み合わせると,
周辺分布は,通常では確率変数の数を減らしたいときに用いる公式であるが,このように確率変数の数を増やしたいときに用いることもできる。
条件付き独立
確率変数が与えられたときに,確率変数が
が独立であるとき,「
が与えられた下で
と
が条件付き独立(conditionally independent)である。」という。
条件付き独立は,
- 3つ以上の確率変数に関する公式である。
は
を経由して
に依存する。
という特徴がある。
3変数以上の公式
以下ではベイズ統計における基本的な公式を用いて,ベイズ統計における代表的な3変数以上の公式を導出する。具体的には,
- 変数統合 : 複数の変数をまとめて,条件付き確率の式を使う。
- 変数固定 : 条件付ける変数を条件から外して,条件付き確率の式を使う。
- 変数消去 : 条件付き独立を用いて,条件付ける変数を消去する。
と名付けた3つの公式について説明する。
公式その1 : 変数統合
1つめの公式は,2つの確率変数をまとめて1つの変数とみなすというものであり,本記事では変数統合と呼ぶ。
■証明 :
公式その2 : 変数固定
2つめの公式は,条件付けている変数を,式変形の前後で条件として与えるというものであり,本記事では変数固定と呼ぶ。
■証明 :
(1)式の右辺は,
この式の分子は,変数統合の公式を用いると,
公式その3 : 変数消去
3つめの公式は,条件付き独立を用いて,変数を1つ消すというものであり,本記事では変数消去と呼ぶ。
のもとで
と
が条件付き独立である,すなわち
■証明 :
変数固定の公式を用いると,
変数消去の公式は,条件付ける変数を消すときに用いることができる。
事後予測分布の導出
ベイズ統計における3変数以上の公式を用いて,「確率的機械学習 入門編I」のP123-124の事後予測分布の式を導出する。
問題設定
本書における問題設定は以下の通りである。
のような観測データが与えられているとする。
- パラメータの事後分布を計算した後,入力
が与えられた下での出力
の事後分布を求める。
確率モデルなどの設定
事後予測分布を導出するにあたり,確率モデルを設定する。これは,「変数消去」の公式において条件付き独立を用いるが,変数間の条件付き独立性を確認するためには,確率モデルが必要になるためである。
すなわち事後予測分布の導出は,単なる式変形ではなく,対象に対する洞察と仮定を必要とするものであると言える。
本書にもとづき,確率モデルやこれに関連する前提条件を整理する。
データ
データに対する条件は明記されていないが,ここでは観測データと,入力・出力
が,同一分布から独立に得られている(i. i. d. )とする。すなわち,確率分布のパラメータ
のもと,観測データ
と,入力・出力
が独立,すなわち
尤度
出力は,入力
とパラメータ
から得られる条件付き確率だと仮定する。すなわち,出力
の確率分布は,
このようなモデルの例として,例えばとした線形モデル
このモデルを用いると,観測データに関する尤度は,
グラフィカルモデル
ここまでの情報をグラフィカルモデルで表現すると以下のようになる。

事後予測分布の導出の証明
上記の確率モデルと,3変数以上の公式を用いて,事後予測分布を導出する。
まず,周辺分布の式を用いて,パラメータを登場させる。
次に,変数統合および変数固定の公式を用いて,を固定して,
に関する条件付き確率の式を用いると,
そして確率モデルを確認すると,出力と観測データ
は独立であるため,変数消去の公式を用いると,
さらに,パラメータの事後分布を計算した後に,入力から出力を求めようとしているので,
と
も独立である。よって,
以上をまとめると,
事後予測分布の解釈
最後に得られた事後予測分布の各項を確認してみると,
: 観測データ
と入力
が与えられた下で,出力
を求める。
: 事後分布から生成したパラメータ
を用いて,出力
の予測を行なう。
: 事後分布による期待値を計算する。
となり,確率的な操作によって,観測データから新たな出力を予測していることが確認できた。
まとめ
事後予測分布を求めるために,ベイズ統計における3変数以上の公式として,
- 変数統合 : 複数の変数をまとめて,条件付き確率の式を使う。
- 変数固定 : 条件付ける変数を条件から外して,条件付き確率の式を使う。
- 変数消去 : 条件付き独立を用いて,条件付ける変数を消去する。
と名付けた3つの公式を説明した。
これらの公式を使うと,事後予測分布の式を説明することができるが,条件付き独立を利用するには変数間の関係性,すなわち確率モデルをきちんと定義しておく必要がある。
事後予測分布の導出は,単なる数式の変形なのではなく,確率モデルの操作であるということを理解したうえで計算を進めることが重要である。
宣伝
統計・機械学習の数理 Advent Calendar 2025 について
こちらのAdvent Calenderは,統計・機械学習に関する話題を扱っている。興味深いテーマが公開されていくので,ぜひご覧ください。
adventar.org
