jiku log

JTCのデータサイエンス中間管理職の学び

無記憶性を持つ連続型確率分布は指数分布か? #統計検定

はじめに

指数分布 Ex(\lambda)の重要な性質として,無記憶性が挙げられる。逆に,「無記憶性を持つ連続型確率分布は指数分布である」ということも示せる。この記事では,無記憶性を持つ連続型確率分布は指数分布であることを紹介する。

「無記憶性を持つ連続型確率分布は指数分布である」

無記憶性

無記憶性とは,以下のような性質のことである。

確率変数 Xが指数分布にしたがうとする。このとき,


 \begin{align}
P(X \gt s+t | X \gt s) = P(X \gt t)
\end{align}
が成り立ち,これを無記憶性と呼ぶ。

問題設定

今回の問題設定は,「指数分布は無記憶性を持つ」ということの逆が成り立つ,というものである。

連続な確率密度関数を持つ確率変数 X (ただし, X \gt 0)について,無記憶性


 \begin{align}
P(X \gt s+t | X \gt s) = P(X \gt t)
\end{align}
が成り立つとき,確率変数 Xは指数分布にしたがう。

これを証明してみよう。

方針

条件付き分布から関数方程式へ変換する

初手としては,無記憶性の式が条件付き分布の形になっているので,これを変形して条件付き分布ではない形にしてみる。

条件付き確率の定義式 P(A|B) = P(A, B)/P(B)より,


 \begin{align}
P(X \gt s+t | X \gt s) 
&= \frac{P(X \gt s+t, X \gt s ) }{P(X \gt s) }  \\
&=\frac{P(X \gt s+t ) }{P(X \gt s) } \\
&= P(X \gt t)
\end{align}

よって,


 \begin{align}
P(X \gt s+t ) = P(X \gt s) P(X \gt t)
\end{align}
となる。

見通しを立てやすくするために, P(X \gt t) \equiv G(t)のようにおくと,


 \begin{align}
G(s+t ) = G(s) G(t)
\end{align}

となる。これは,関数方程式の形になっている。

eが出てくる微分方程式の形を目指す

関数方程式の形には変形できたが,まだ具体的な関数の形が見えてこない。しかし最終的には指数分布になるので, e^xのような形が出てくるようにすることを目指せばよいと考えられる。また確率密度関数は連続なので, G(t)微分である G'(t)なども使えそうである。
そこで,微分 e^xに関連した式として,微分方程式の形にすることを目指す。

導出


 \begin{align}
G(s+t ) = G(s) G(t)  \tag{1}
\end{align}

の両辺を s微分すると,


 \begin{align}
G'(s+t ) = G'(s) G(t) \tag{2}
\end{align}

が得られる。同様に式(1)の両辺を t微分すると,


 \begin{align}
G'(s+t ) = G(s) G'(t) \tag{3}
\end{align}

が得られる。

式(2)と式(3)の辺々の比を取ると,


 \begin{align}
\frac{G'(s+t )}{G'(s+t )  } = \frac{G(s) G'(t)  }{G'(s) G(t)  } 
\end{align}

よって,


 \begin{align}
\frac{G'(s)}{G(s) } = \frac{G'(t)  }{G(t)  } 
\end{align}

これは G'(t) /G(t) が変数 s, tによらず一定,すなわち定数 Cとみなせるので,


 \begin{align}
\frac{G'(s)}{G(s) } = C   \Rightarrow \frac{d}{ds} \log{G(s)} = C
\end{align}

よって,


 \begin{align}
\log{G(s)} &= Cs + D \\
\therefore G(s) &= e^{Cs + D}
\end{align}

となる。

 G(0) = P(X \gt 0) = 1なので, D=0となる。

よって,確率変数 Xがしたがう確率密度関数と累積分布関数をそれぞれ f_X(x), F_X(x)とすると,


 \begin{align}
G(x) = P(X \gt x) = 1 - F_X(x) = e^{Cx}
\end{align}

となる。 C = - \lambda \quad (\lambda \gt 0)とおくと,


 \begin{align}
F_X(x) &= 1 - e^{-\lambda x} \quad (x \gt 0) \\
f_X(x) &= \lambda e^{-\lambda x} \quad (x \gt 0) 
\end{align}

となり,指数分布が得られた。

まとめ

関数方程式を解くことで、「無記憶性を持つ連続型確率分布は指数分布である」ということを示した。
関数方程式を解く際には,0といった特定の値を関数に入れるだけでなく,連続分布であることを利用して微分する,といったテクニックを使うことによって解くことができた。

本記事を最後まで読んでくださり,どうもありがとうございました。