jiku log

データサイエンスの核心を掴む : 学びと発見の記録

「入門確率過程」を読む ~第3章 いろいろな確率分布~

はじめに

確率過程は数理統計学の応用分野であり,製造業で扱う時系列データ解析ともかかわりがある。松原望編著・山中卓・小船幹生 著「改訂版 入門確率過程」は,確率過程に関する入門書としてロングセラーである。確率過程の基礎と応用を学ぶために,本書を読むこととした。


本記事は,「第3章 いろいろな確率分布」に関する読書メモである。

第3章 いろいろな確率分布

本章では,代表的な確率分布について説明している。具体的には,以下の確率分布が紹介されている。

  • 離散確率分布
    • 二項分布  Bi(n, p)
    • ポアソン分布  Po(\lambda)
    • 超幾何分布
    • 幾何分布
    • 負の二項分布


いずれの内容も数理統計学において基本的な内容であるが,興味深かった説明をいくつかピックアップしてまとめてみた。

二項分布の期待値・分散の導出

二項分布 Bi(n, p)の確率関数は,


 \begin{align}
P(X = x) = {}_n C_x p^x (1- p)^{n - x} \quad(x=0, 1, ..., n) \\ \\
\end{align}
である。

二項分布の期待値・分散の求め方として,直接計算する方法や確率母関数から求める方法などがあるが,変数 tを導入し, tの関数から求める方法が紹介されていた。

二項分布の確率関数に変数 tを組合わせて,


 \begin{align}
g(t) \equiv {}_n C_x p^k t^k \cdot q^{n - k} \quad (q = 1 - p) \\ \\
\end{align}
とする。二項定理より,

 \begin{align}
f(t) \equiv \sum_{k=0}^n {}_n C_x p^k t^k \cdot q^{n - k} = (pt + q)^n \\ \\
\end{align}
となるが,両辺を t微分すると,

 \begin{align}
f'(t) = \sum_{k=0}^n (k \cdot {}_n C_x p^k q^{n - k} ) t^{k-1}= n (pt + q)^{n-1} \cdot p \\ \\
\end{align}
となる。これより f'(1)を考えると,左辺に期待値が, p + q = 1を用いると右辺には npが現れる。


同様にして分散を考える。 f''(t)を考えると,


 \begin{align}
f''(t) = \sum_{k=0}^n (k(k-1) \cdot {}_n C_x p^k q^{n - k} ) t^{k-2}= n(n - 1) (pt + q)^{n-2} \cdot p^2 \\ \\
\end{align}
となるので, t=1を代入すると,

 \begin{align}
E(X(X-1)) = n(n-1) p^2 \\ \\
\end{align}
となる。よって分散は,

 \begin{align}
V(X) = E(X(X-1)) + E(X) - \{ E(X) \}^2 = n(n-1)p^2 + np - n^2 p^2 = np(1 - p) \\ \\
\end{align}
が得られる。

対数正規分布の性質

対数正規分布は, Y = \log X正規分布 \mathcal{N}(\mu, \sigma^2)正規分布にしたがうときにおける, Xがしたがう確率密度関数で,


 \begin{align}
g(x) = \frac{1}{ \sqrt{2 \pi} \sigma x } \exp \left( - \frac{ (\log x - \mu)^2 }{ 2 \sigma^2 }   \right), \quad x \gt 0 \\ \\
\end{align}
である。

補足:対数正規分布のモーメント母関数

対数正規分布のモーメント母関数 M_t(X)は, X = e^Yより


 \begin{align}
M_t(X) = E[ e^{tX} ] = E[ e^{te^y} ] = \int_{- \infty}^{\infty}  e^{te^y} \cdot \frac{1}{ \sqrt{2 \pi} \sigma  } \exp \left( - \frac{ (y - \mu)^2 }{ 2 \sigma^2 }   \right) dy \\ \\
\end{align}
となる。

ここで, y \rightarrow \inftyのとき, e^{te^y}の発散スピードの方が - (y - \mu)^2 / 2 \sigma^2の収束スピードよりも速いので,上記の積分 t \gt 0において発散する。そのため対数正規分布のモーメント母関数は存在しない。

まとめと感想

今回は,「第3章 いろいろな確率分布」についてまとめた。

確率分布の章は,多くの統計教科書では「公式集」に近い扱いになりがちだが,本章では二項分布の期待値・分散の導出過程を説明している点が印象的だった。統計検定1級では,期待値・分散を求める問題が多いが,あまり有名でない確率分布についても期待値・分散を求めることがある。この際には,何パターンかの導出方法を理解しておくと,確率分布に応じた計算ができるようになる。

また対数正規分布については,本書にはなかったがモーメント母関数が存在しないことについて説明してみた。モーメント母関数は,期待値や分散を求めるための手法の一つであるが,モーメント母関数が存在しないことから,期待値を直接計算する方針を取ることになるので,計算方法の選択の意味でも,モーメント母関数などの存在有無は把握しておくのがよいだろう。


本記事を最後まで読んでくださり,どうもありがとうございました。