jiku log

JTCのデータサイエンス中間管理職の学び

ポアソン分布への変換 #統計検定

はじめに

統計検定1級の統計数理・理工学において,ポアソン分布は頻出分野である。この記事では,ポアソン分布に関する話題のうち,他の分布をポアソン分布へ変換する,具体的には

という変換について説明する。

ポアソン分布

統計検定1級での出題

統計検定1級の統計数理・理工学において,2012年~2022年の10年の間で,関連する問題が9題出題されている。

ポアソン分布と他の確率分布との関係

統計検定では,確率分布の性質,特に他の確率分布との関係を問われることが多い。ポアソン分布と他の分布の関係は以下の通りである。

二項分布→ポアソン分布の変換

二項分布において, n \rightarrow \infty, \lambda = npという極限を取ると,ポアソン分布 Po(\lambda)に変換される。


 \displaystyle 
Bin(n, p) \rightarrow Po(\lambda) \quad (n \rightarrow \infty, \lambda = np)

この式を得てみよう。

方針

求めたいポアソン分布の式の形を確認し,ゴールから式変形の方向性を確認してみる。

まず二項分布は以下の通りである。


 \displaystyle 
Bin(x|n, p) = \dbinom{n}{x}  p^x (1-p) ^{n -x }

次にポアソン分布は以下の通りである。


 \displaystyle 
Po(x|\lambda) = \frac{\lambda ^x}{x!} e^{- \lambda}

二項分布の式を変形して,最終的にポアソン分布の各項を作っていくことを目指していく。

二項分布の式変形

まず二項分布を階乗の形に変形する。


 \begin{align}
Bin(x|n, p) 
&= \dbinom{n}{x}  p^x (1-p) ^{n -x } \\
&= \frac{n!}{x! (n-x)!} p^x (1-p) ^{n -x }
\end{align}

最終ゴールであるポアソン分布の形を眺めてみると, x!の部分はそのまま使えそうである。また, p^xの部分が \lambda ^xに変形できそうなので,


 \displaystyle 
p^x= \frac{(np)^x}{n^x} = \frac{\lambda ^x }{n^x}
という形を作ってみる。

更に,


 \displaystyle 
\frac{n!}{(n-x)!} = n(n-1) \cdots (n-x+1)
という, x個の項の掛け算が得られるので,先ほど出てきた n^xの項とセットにすると見通しが良くなる。

ここまででいったん式変形してみる。


 \begin{align}
Bin(x|n, p) 
&= \frac{n!}{x! (n-x)!} p^x (1-p) ^{n -x } \\
&= \frac{1}{x!} \times \frac{n(n-1) \cdots (n-x+1)}{n^x} \times (np)^x \times (1-p)^{n-x} \\
&= \frac{1}{x!} \times  \left(1 - \frac{1}{n} \right) \cdots  \left( 1 - \frac{x-1}{n} \right) \times \lambda ^x \times (1-p)^{n-x} \\
\end{align}

このうち2番目の項は n \rightarrow \inftyの極限で1に収束する。

残るは e^{- \lambda}の項だが,この部分は


 \displaystyle 
\lim_{n\to \infty}
\left( 1+\frac{a}{n} \right) ^n = e^a

という式を使うことを考える。


 \begin{align}
(1-p)^{n-x}
&= \left(1 - \frac{\lambda}{n}  \right)^n \times \left(1 - \frac{\lambda}{n}  \right)^{-x}
\end{align}

と変形できるが,前半部分は e^{- \lambda}に収束するし,後半の部分は \lambda / n \rightarrow 0より1に収束する。

これを用いると,


 \begin{align}
Bin(x|n, p) 
&= \frac{1}{x!} \times \ \left(1 - \frac{1}{n} \right) \cdots  \left( 1 - \frac{x-1}{n} \right) \times \lambda^x \times \left(1 - \frac{\lambda}{n}  \right)^n \times \left(1 - \frac{\lambda}{n}  \right)^{-x} \\
& \rightarrow  \frac{1}{x!} \times \lambda^x \times e^{- \lambda} \\
&= Po(\lambda)
\quad (n \rightarrow \infty)
\end{align}

となり,二項分布の極限としてポアソン分布を得ることができた。

負の二項分布→ポアソン分布の変換

負の二項分布においても, n \rightarrow \infty, \lambda = n(1-p) = nqという極限を取ると,ポアソン分布 Po(\lambda)に変換される。


 \displaystyle 
NB(n, p) \rightarrow Po(\lambda) \quad (n \rightarrow \infty, \lambda = n(1-p) = nq)

この式を得てみよう。

方針

負の二項分布は以下の通りである。


 \displaystyle 
NB(x|n, p) = \dbinom{n+x-1}{x}  p^n (1-p) ^x

負の二項分布の式を変形して,最終的にポアソン分布の各項を作っていくことを目指していく。

負の二項分布の式変形

まず負の二項分布を階乗の形に変形する。この際,二項分布のときと同様な式変形をしたいので, q = 1-pとして式を書き直す。


 \begin{align}
NB(x|n, p) 
&= \dbinom{n+x-1}{x}  p^n (1-p) ^x  \\
&= \frac{(n+x-1)!}{x! (n-1)!} (1-q)^n q^x 
\end{align}


二項分布の式変形と同様に, x!の部分はそのまま使う。また,


 \displaystyle 
q^x= \frac{(nq)^x}{n^x} = \frac{\lambda ^x }{n^x}
という形を作ってみる。

更に,


 \displaystyle 
\frac{(n+x-1)!}{(n-1)!} = n(n+1) \cdots (n+x-1)
という, x個の項の掛け算が得られるので,先ほど出てきた n^xの項とセットにすると見通しが良くなる。

ここまででいったん式変形してみる。


 \begin{align}
NB(x|n, q) 
&= \frac{1}{x!} \times \frac{n(n+1) \cdots (n+x-1)}{n^x} \times (nq)^x \times (1-q)^n \\
&= \frac{1}{x!} \times  \left(1 + \frac{1}{n} \right) \cdots  \left( 1 + \frac{x-1}{n} \right) \times \lambda ^x \times (1-q)^n \\
\end{align}

このうち2番目の項は n \rightarrow \inftyの極限で1に収束する。

 e^{- \lambda}の項は


 \begin{align}
(1-q)^n
&= \left(1 - \frac{\lambda}{n}  \right)^n 
&\rightarrow e^{- \lambda}
\end{align}

と変形できる。

これを用いると,


 \begin{align}
NB(x|n, q) 
&= \frac{1}{x!} \times \ \left(1 + \frac{1}{n} \right) \cdots  \left( 1 + \frac{x-1}{n} \right) \times \lambda^x \times \left(1 - \frac{\lambda}{n}  \right)^n  \\
& \rightarrow  \frac{1}{x!} \times \lambda^x \times e^{- \lambda} \\
&= Po(\lambda)
\quad (n \rightarrow \infty)
\end{align}

となり,二項分布のときと同様に,負の二項分布の極限としてポアソン分布を得ることができた。

まとめ

統計検定1級の頻出分野であるポアソン分布について,二項分布および負の二項分布からポアソン分布へ変換する方法についてまとめた。