jiku log

JTCのデータサイエンス中間管理職の学び

ポアソン分布から他の分布への変換 #統計検定

はじめに

統計検定1級の統計数理・理工学において,ポアソン分布は頻出分野である。この記事では,ポアソン分布に関する話題のうち,ポアソン分布から他の分布への変換,具体的には

という変換について説明する。

ポアソン分布

統計検定1級での出題

統計検定1級の統計数理・理工学において,2012年~2022年の10年の間で,関連する問題が9題出題されている。

ポアソン分布と他の確率分布との関係

統計検定では,確率分布の性質,特に他の確率分布との関係を問われることが多い。ポアソン分布と他の分布の関係は以下の通りである。

ポアソン分布→負の二項分布の変換

ポアソン分布 Po(x|\lambda)のパラメータ \lambdaの事前分布としてガンマ分布 Ga(\lambda | \alpha, \beta)を設定した場合, Xの周辺分布はガンマ・ポアソン分布と呼ばれるが,これは負の二項分布 NB(x| \alpha, 1/(1+\beta))に等しくなる。これを導出してみよう。

方針

ポアソン分布にしたがう変数 X確率密度関数 f(x|\lambda),パラメータ \lambda確率密度関数 f(\lambda)とすると,


 \begin{align}
f(x | \lambda) &= \frac{\lambda ^x}{x!} e^{- \lambda} \\
f(\lambda) &= \frac{1}{\Gamma(\alpha) \beta^{\alpha}} \lambda^{\alpha - 1} e^{- \frac{\lambda}{\beta}}
\end{align}

である。

周辺分布を求めるので,事前分布の確率変数を積分消去すればよい。

周辺分布の導出

 Xの周辺分布は,以下のようになる。


 \begin{align}
f(x) 
&= \int_{0}^{\infty} f(x | \lambda) f(\lambda) d \lambda \\ 
&= \int_{0}^{\infty} \frac{1}{x! \Gamma(\alpha) \beta^{\alpha}} \lambda^{x + \alpha - 1} e^{- (\frac{1}{\beta} +1) \lambda} \\
&=\frac{1}{x! \Gamma(\alpha) \beta^{\alpha}} \Gamma(x + \alpha) \left( \frac{\beta}{\beta + 1} \right) ^{x+\alpha} \\
\end{align}

ここで, \Gamma(x+\alpha) = (x + \alpha - 1)!および \Gamma(\alpha) = (\alpha - 1)!を用いると,


 \begin{align}
f(x) 
&= \frac{(x + \alpha - 1)!}{x! (\alpha - 1)!}  \left( \frac{1}{\beta + 1} \right) ^\alpha \left( \frac{\beta}{\beta + 1} \right) ^ x \\
&= NB(\alpha, \frac{1}{\beta + 1})
\end{align}

となり,負の二項分布が得られた。

ポアソン分布→二項分布の変換

ポアソン分布に関する条件付分布として二項分布が得られることを説明する。具体的には,確率変数 X, Yについて,


 \begin{align}
X & \sim Po(\lambda_1)\quad (\lambda_1 \gt 0) \\
Y & \sim Po(\lambda_2) \quad (\lambda_2 \gt 0) \\
X &+ Y = n
\end{align}

という条件のもとで,条件付分布 P(X=x|X+Y=n)が二項分布になることを示す。

方針

 X+Yがしたがう確率分布を求める必要があるが,ポアソン分布の再生性を用いると X+Y \sim Po(\lambda_1 + \lambda_2)となることを利用する。

ポアソン分布の再生性を用いた条件付分布の導出


 \begin{align}

P(X=x|X+Y=n)
&= \frac{P(X=x, X+Y=n)}{P(X+Y=n)} = \frac{P(X=x, Y=n-x)}{P(X+Y=n)} \\
&= \frac{e^{-\lambda_1}}{x!} \lambda_1^x  \times  \frac{e^{-\lambda_2}}{(n-x)!} \lambda_2^{n-x}  
\div \left\{ \frac{e^{-(\lambda_1 + \lambda_2)}}{n!} (\lambda_1 + \lambda_2)^n \right\} \\
&= \frac{n!}{x! (n-x)!} \left( \frac{\lambda_1}{\lambda_1 + \lambda_2} \right)^x \left( \frac{\lambda_2}{\lambda_1 + \lambda_2} \right)^{n-x} \\
&= Bin \left( x | n, \frac{\lambda_1}{\lambda_1 + \lambda_2} \right)

\end{align}

となり,二項分布が得られた。

まとめ

統計検定1級の頻出分野であるポアソン分布について,ポアソン分布から負の二項分布および二項分布へ変換する方法についてまとめた。