jiku log

JTCのデータサイエンス中間管理職の学び

ガンマ分布における変数変換 #統計検定

はじめに

統計検定1級の統計数理・理工学において,ガンマ分布は頻出分野である。この記事ではガンマ分布と他の分布の変換について説明する。

ガンマ分布

統計検定1級での出題

統計検定1級の統計数理・理工学において,2012年~2022年の10年の間で,関連する問題が7題(6年)出題されている。

ガンマ分布と他の確率分布との関係

ガンマ分布と他の分布の関係は以下の通りである。

ガンマ分布→正規分布の変換

確率変数 Xが,ガンマ分布 Ga(\alpha, \beta)にしたがうとする。


 \begin{align}
\mu &= \alpha \beta \\ 
\sigma ^2 &= \alpha \beta ^2 \\ 
Z &= \frac{X - \mu}{\sigma} = \frac{X - \alpha \beta}{ \sqrt{\alpha \beta ^2} } \\
\alpha & \rightarrow \infty 
\end{align}
という変換を行なうと,確率変数 Zは標準正規分布にしたがう。

方針

確率変数 Xが,ガンマ分布 Ga(\alpha, \beta)にしたがうので, E[X] = \alpha \beta, V[X] = \alpha \beta^2である。
つまり上式は \alpha \rightarrow \inftyの極限で,ガンマ分布は正規分布に変換される,ということを示している。
極限が出てくるので,極限計算に出てくる項の数を出来るだけ減らすために,導出にはモーメント母関数を用いる。

導出

ガンマ分布 Ga(\alpha, \beta)にしたがう確率変数 Xのモーメント母関数 M_X(t)は,


 \displaystyle
M_X(t) = E [ e^{tX}  ]  = \left(  1 - \beta t \right) ^{- \alpha}

である。よって,確率変数 Zのモーメント母関数 M_Z(t)は,


 \begin{align}
M_Z(t)  
= E [ e^{tZ}  ]  
&= E \left [ \exp{ \left( t   \frac{X - \alpha \beta}{ \sqrt{\alpha \beta ^2} } \right) } \right ] \\
&= \exp { \left( - t  \sqrt{\alpha} \right) }  \times E \left [ \exp{ \left( \frac{t }{ \sqrt{\alpha}  \beta } X  \right) } \right ] \\
\end{align}

となる。ここで, M_X(t) = E [ e^{tX}  ]  = \left(  1 - \beta t \right) ^{- \alpha}を用いると,


 \begin{align}
M_Z(t)  
&= e^ { - t  \sqrt{\alpha}  }  \times E \left [ \exp{ \left( \frac{t }{ \sqrt{\alpha}  \beta } X \right) } \right ] \\
&= e^ { - t  \sqrt{\alpha}  }  \times  \left(  1 - \beta \frac{t}{ \sqrt{\alpha}  \beta } \right) ^{- \alpha} \\
&= e^ { - t  \sqrt{\alpha}  }  \times  \left(  1 - \frac{t}{ \sqrt{\alpha} } \right) ^{- \alpha} \\
&= \left(e^ { \frac{t } {\sqrt{\alpha} } }  \times  \left(  1 - \frac{t}{ \sqrt{\alpha} } \right) \right)^{- \alpha} \\
&= \left(e^ { \frac{t } {\sqrt{\alpha} } }  - \frac{t}{ \sqrt{\alpha} } e^ { \frac{t } {\sqrt{\alpha} } }  \right)^{- \alpha} \\
\end{align}

となる。 \alphaが大きいとき,


 \displaystyle
e^ { \frac{t } {\sqrt{\alpha} } }  = 1 + \frac{t}{\sqrt{\alpha}} + \frac{t^2}{2 \alpha} + o(\alpha ^{-1})

と近似できるので,


 \begin{align}
e^ { \frac{t } {\sqrt{\alpha} } }  - \frac{t}{ \sqrt{\alpha} } e^ { \frac{t } {\sqrt{\alpha} } }   
&= 1 + \frac{t}{\sqrt{\alpha}} + \frac{t^2}{2 \alpha} -   \frac{t}{ \sqrt{\alpha} }    \left( 1 + \frac{t}{\sqrt{\alpha}} + \frac{t^2}{2 \alpha}  \right) + o(\alpha ^{-1})\\
&= 1 + \frac{t}{\sqrt{\alpha}} + \frac{t^2}{2 \alpha} -   \frac{t}{ \sqrt{\alpha} }  - \frac{t^2}{\alpha}  + o(\alpha ^{-1}) \\
&= 1 - \frac{t^2}{2 \alpha} + o(\alpha ^{-1})\\
\end{align}

となる。よって,


 \begin{align}
M_Z(t)  
&= \left(e^ { \frac{t } {\sqrt{\alpha} } }  - \frac{t}{ \sqrt{\alpha} } e^ { \frac{t } {\sqrt{\alpha} } }  \right)^{- \alpha} \\
&= \left( 1 - \frac{1}{\alpha }\frac{t^2}{2 } + o(\alpha ^{-1})  \right)^{- \alpha} \\
&\rightarrow \exp{ \left(  {\frac{t^2}{2}}  \right) }  \quad (\alpha \rightarrow \infty)
\end{align}

となり,これは標準正規分布のモーメント母関数なので,確率変数 Zは標準正規分布にしたがう。

指数分布←→ガンマ分布の変換

ガンマ分布→指数分布の変換は,ガンマ分布 Ga(\alpha, \beta )において \alpha = 1としたものが指数分布になることを用いる。
この変換については,以下の記事において説明した。
stern-bow.hatenablog.com

また,指数分布→ガンマ分布の変換は,ガンマ分布の再生性を用いる。
この変換については,以下の記事において説明した。
stern-bow.hatenablog.com

まとめ

統計検定1級の頻出分野であるガンマ分布について,ガンマ分布から正規分布へ変換する方法についてまとめた。
本記事を最後まで読んでくださり,どうもありがとうございました。