確率変数の変数変換の注意点 #統計検定

はじめに

確率変数の変数変換は，統計検定1級で頻出の分野であるだけでなく，実用上でも新しい確率密度関数を作る際などで有益である。
この記事では，確率変数の変数変換の問題を解いていた際に，私がつまずいたポイントとその対策を紹介する。

確率変数の変換

確率変数の変換は，久保川達也著「現代数理統計学の基礎」をはじめ，数理統計学の書籍で紹介されている重要分野の1つである。

変換公式の概要

確率変数 $X$ の確率密度関数 $f_X(x)$ が与えられている。
変数変換の関数 $Y = g(X)$ が与えられている。ただし $g(X)$ は単調増加または単調減少であり，逆関数 $g^{-1}(y)$ は微分可能である。

というとき，新しい確率密度関数 $f_Y(y)$ を求める公式が変数変換の公式である。

これはヤコビアン $|dx/dy|$ を用いて，以下のように与えられる。

$\displaystyle f_Y(y) = f_X( g^{-1}(y) ) \left\lvert \frac{dx}{dy} \right\rvert$

覚え方

この式は，ヤコビアンやら逆関数やらいろいろ出てきて覚えづらかった。そのため，確率密度関数を積分すると1になるということにもとづき，数学的な厳密さは横に置いておいて，下図のように覚えることとした。

確率変数の変数変換～カイ2乗分布を例にして

カイ2乗分布の導出 : 誤った手順

確率変数の変数変換を覚えて，ひとつ賢くなったつもりの私は，意気揚々と練習問題に挑戦した。
確率変数の変数変換の例題として有名な，カイ2乗分布の導出は，以下のような問題である。

確率変数 $Z$ が，標準正規分布 $N(0, 1)$ にしたがうとき， $Y = Z^2$ は，自由度1のカイ2乗分布 $\chi_1^2$ にしたがうことを示せ。
ただし， $Z, Y$ の確率密度関数は，それぞれ以下の通りである。

$\displaystyle f_Z(z) = \frac{1}{\sqrt{2\pi}} \exp{ \left( - \frac{z^2}{2} \right) }$
$\displaystyle f_Y(y) = \frac{1}{\sqrt{2\pi}} y^{- \frac{1}{2}} \exp{ \left( - \frac{y}{2} \right) }$

以下の流れは，私が初めてこの問題に対峙した時にしてしまったミスである。
変数変換の関数は， $Y = g(Z) = Z^2$ なので，逆関数を求めると，

$\displaystyle Z = g^{-1}(Y) = \sqrt{Y}$
$\displaystyle \left\lvert \frac{dz}{dy} \right\rvert = \frac{1}{2} y^{- \frac{1}{2}}$

あとは公式通りに代入するだけなので，求めたい確率密度関数は以下のようになる。

$\displaystyle f_Y(y) = \frac{1}{2} \times \frac{1}{\sqrt{2\pi}} y^{- \frac{1}{2}} \exp{ \left( - \frac{y}{2} \right) }$

ここでミスに気付くのである。求めた確率分布を定数倍しないと，求めたい確率分布にならなかったのである。

確率変数の変数変換の式が利用できる条件

確率変数の変数変換には，利用できる重要な前提条件があった。それは，

$g(X)$ は単調増加または単調減少であり，逆関数 $g^{-1}(y)$ は微分可能である

という点である。今回の変数変換の関数は $Y = g(Z) = Z^2$ なので，単調増加でも単調減少でもないのである。そのためこの問題では，確率変数の変数変換の式を利用することができない。

カイ2乗分布の導出 : 正しい手順

前提が崩れているので，別のアプローチをとる必要がある。久保川達也著「現代数理統計学の基礎」には正しい求め方が紹介されており，それは累積分布関数から導出するという方法である。

変数変換後の累積分布関数 $F_Y(y)$ は

$\displaystyle F_Y(y) = P( Y \leq y) = P( g(X) \leq y) = P(X \in \left\{ x| g(x) \leq y \right\} )$

と表される。確率密度関数 $f_Y(y)$ は，累積分布関数を $y$ で微分することで得られる。

$\displaystyle f_Y(y) = \frac{d}{dy} F_Y(y)= \frac{d}{dy} P(X \in \left\{ x| g(x) \leq y \right\} )$

この求め方の良い点は，変数変数の前後における，確率変数の値のとりうる範囲が明示される点である。こうすることで，変数変換前後で，確率変数の値の範囲の変換ミスを減らせるのである。

このことを踏まえると，カイ2乗分布の導出は以下のようになる。

変数変換後の(すなわちカイ2乗分布の)累積分布関数 $F_Y(y)$ は，確率変数Zの累積分布関数を $F_Z(z)$ として，

$\begin{align} F_Y(y) &= P(Y \leq y) \\ &= P(Z^2 \leq y) \\ &= P(- \sqrt{y} \leq Z \leq \sqrt{y}) \\ &= \int _{ - \sqrt{y} }^{ \sqrt{y} } f_Z(z) dz \\ &= F_Z(\sqrt{y}) - F_Z( - \sqrt{y}) \end{align}$

で表されるので，求める確率密度関数 $f_Y(y)$ は，

$\begin{align} f_Y(y) = \frac{d}{dy} F_Y(y) = \frac{d}{dy} \left\{ F_Z(\sqrt{y}) - F_Z( - \sqrt{y}) \right\} \\ \end{align}$

となる。ここで， $z = \sqrt{y}$ とおいて，Chain Ruleを用いると

$\begin{align} \frac{d}{dy} F_Z(\sqrt{y}) = \frac{dz}{dy} \frac{d}{dz} F_Z(z) = \frac{1}{2\sqrt{y}} f_Z(\sqrt{y}) \end{align}$

となることなどから，

$\begin{align} f_Y(y) &= \frac{1}{2\sqrt{y}} \left( f_Z(\sqrt{y}) + f_Z( - \sqrt{y}) \right) \\ &= \frac{1}{2\sqrt{y}} \left( \frac{1}{\sqrt{2\pi}} \exp{ \left( - \frac{y}{2} \right) } + \frac{1}{\sqrt{2\pi}} \exp{ \left( - \frac{y}{2} \right) } \right) \\ &= \frac{1}{\sqrt{2\pi}} y^{- \frac{1}{2}} \exp{ \left( - \frac{y}{2} \right) } \end{align}$

となり，無事にカイ2乗分布の確率密度関数が導出できた。これが有名な平方変換の式である。

まとめと教訓

どんな公式にも当てはまることであるが，その公式が利用できる前提条件を忘れてはならない。
確率変数の変数変換は，変数変換の関数 $Y = g(X)$ において， $Y$ と $X$ が1対1対応していないと使ってはならないのである。前提条件が満たされない場合は，定義に立ち返って導出することになる。
この問題が解けたとき，出題者の先生から「君は公式を丸暗記せず，きちんと本質を理解しているかな？」と問われているように感じた。