jiku log

JTCのデータサイエンス中間管理職の学び

確率変数の変数変換の注意点 #統計検定

はじめに

確率変数の変数変換は,統計検定1級で頻出の分野であるだけでなく,実用上でも新しい確率密度関数を作る際などで有益である。
この記事では,確率変数の変数変換の問題を解いていた際に,私がつまずいたポイントとその対策を紹介する。

確率変数の変換

確率変数の変換は,久保川達也 著 「現代数理統計学の基礎」をはじめ,数理統計学の書籍で紹介されている重要分野の1つである。

変換公式の概要

  • 確率変数 X確率密度関数 f_X(x)が与えられている。
  • 変数変換の関数 Y = g(X)が与えられている。ただし g(X)は単調増加または単調減少であり,逆関数 g^{-1}(y)微分可能である。

というとき,新しい確率密度関数 f_Y(y)を求める公式が変数変換の公式である。

これはヤコビアン |dx/dy|を用いて,以下のように与えられる。


 \displaystyle  f_Y(y) = f_X( g^{-1}(y) ) \left\lvert  \frac{dx}{dy} \right\rvert

覚え方

この式は,ヤコビアンやら逆関数やらいろいろ出てきて覚えづらかった。そのため,確率密度関数積分すると1になるということにもとづき,数学的な厳密さは横に置いておいて,下図のように覚えることとした。


確率変数の変数変換~カイ2乗分布を例にして

カイ2乗分布の導出 : 誤った手順

確率変数の変数変換を覚えて,ひとつ賢くなったつもりの私は,意気揚々と練習問題に挑戦した。
確率変数の変数変換の例題として有名な,カイ2乗分布の導出は,以下のような問題である。

確率変数 Zが,標準正規分布 N(0, 1)にしたがうとき, Y = Z^2は,自由度1のカイ2乗分布 \chi_1^2にしたがうことを示せ。
ただし, Z, Y確率密度関数は,それぞれ以下の通りである。


 \displaystyle  f_Z(z) = \frac{1}{\sqrt{2\pi}} \exp{ \left( - \frac{z^2}{2} \right) }
 \displaystyle  f_Y(y) = \frac{1}{\sqrt{2\pi}}  y^{- \frac{1}{2}} \exp{ \left( - \frac{y}{2} \right) }


以下の流れは,私が初めてこの問題に対峙した時にしてしまったミスである。
変数変換の関数は, Y = g(Z) = Z^2なので,逆関数を求めると,


 \displaystyle  Z = g^{-1}(Y) = \sqrt{Y}
 \displaystyle  \left\lvert  \frac{dz}{dy} \right\rvert  = \frac{1}{2} y^{- \frac{1}{2}}

あとは公式通りに代入するだけなので,求めたい確率密度関数は以下のようになる。


 \displaystyle  f_Y(y) = \frac{1}{2} \times  \frac{1}{\sqrt{2\pi}}  y^{- \frac{1}{2}} \exp{ \left( - \frac{y}{2} \right) }

ここでミスに気付くのである。求めた確率分布を定数倍しないと,求めたい確率分布にならなかったのである。

確率変数の変数変換の式が利用できる条件

確率変数の変数変換には,利用できる重要な前提条件があった。それは,

 g(X)は単調増加または単調減少であり,逆関数 g^{-1}(y)微分可能である

という点である。今回の変数変換の関数は Y = g(Z) = Z^2なので,単調増加でも単調減少でもないのである。そのためこの問題では,確率変数の変数変換の式を利用することができない。

カイ2乗分布の導出 : 正しい手順

前提が崩れているので,別のアプローチをとる必要がある。久保川達也 著 「現代数理統計学の基礎」には正しい求め方が紹介されており,それは積分布関数から導出するという方法である。

変数変換後の累積分布関数 F_Y(y)


 \displaystyle  F_Y(y) = P( Y \leq y) = P( g(X) \leq y) = P(X \in \left\{ x| g(x) \leq y \right\} )

と表される。確率密度関数 f_Y(y)は,累積分布関数を y微分することで得られる。


 \displaystyle  f_Y(y) = \frac{d}{dy} F_Y(y)= \frac{d}{dy}  P(X \in \left\{ x| g(x) \leq y \right\} )

この求め方の良い点は,変数変数の前後における,確率変数の値のとりうる範囲が明示される点である。こうすることで,変数変換前後で,確率変数の値の範囲の変換ミスを減らせるのである。

このことを踏まえると,カイ2乗分布の導出は以下のようになる。

変数変換後の(すなわちカイ2乗分布の)累積分布関数 F_Y(y)は,確率変数Zの累積分布関数を F_Z(z)として,


 \begin{align}

F_Y(y) 
&= P(Y \leq y) \\
&= P(Z^2 \leq y) \\
&= P(- \sqrt{y} \leq  Z \leq \sqrt{y}) \\
&= \int _{ - \sqrt{y} }^{ \sqrt{y} } f_Z(z) dz \\
&= F_Z(\sqrt{y}) - F_Z( - \sqrt{y})
\end{align}

で表されるので,求める確率密度関数 f_Y(y)は,


 \begin{align}

f_Y(y) = \frac{d}{dy} F_Y(y)  = \frac{d}{dy} \left\{  F_Z(\sqrt{y}) - F_Z( - \sqrt{y})  \right\} \\

\end{align}

となる。ここで, z = \sqrt{y}とおいて,Chain Ruleを用いると


 \begin{align}
\frac{d}{dy}  F_Z(\sqrt{y}) = \frac{dz}{dy} \frac{d}{dz} F_Z(z) = \frac{1}{2\sqrt{y}}  f_Z(\sqrt{y})
\end{align}

となることなどから,


 \begin{align}

f_Y(y) &=  \frac{1}{2\sqrt{y}} \left( f_Z(\sqrt{y}) + f_Z( - \sqrt{y}) \right) \\

&=  \frac{1}{2\sqrt{y}} \left(  \frac{1}{\sqrt{2\pi}} \exp{ \left( - \frac{y}{2} \right) } + \frac{1}{\sqrt{2\pi}} \exp{ \left( - \frac{y}{2} \right) } \right) \\

&= \frac{1}{\sqrt{2\pi}}  y^{- \frac{1}{2}} \exp{ \left( - \frac{y}{2} \right) } 
\end{align}

となり,無事にカイ2乗分布の確率密度関数が導出できた。これが有名な平方変換の式である。

まとめと教訓

どんな公式にも当てはまることであるが,その公式が利用できる前提条件を忘れてはならない。
確率変数の変数変換は,変数変換の関数 Y = g(X)において, Y Xが1対1対応していないと使ってはならないのである。前提条件が満たされない場合は,定義に立ち返って導出することになる。
この問題が解けたとき,出題者の先生から「君は公式を丸暗記せず,きちんと本質を理解しているかな?」と問われているように感じた。