「自然科学の統計学」を読む　～第1章確率の基礎 ①代表的な離散分布～

はじめに

私は統計検定1級を受験する際に，数理統計学の学習にあたって竹村彰通「現代数理統計学」や久保川達也「現代数理統計学の基礎」といった解説の丁寧な参考書を読み進めていた。しかしそれらはときどき難易度が高いことがあり，理解に時間を要する箇所が少なくなかった。そのため，異なる切り口や表現によって理解を補強できる補助教材の必要性を感じていた。
東京大学教養学部統計学教室編「自然科学の統計学」は，1992年発行のやや古典的な文献であるが，自然科学に関わる統計学的テーマが簡潔にまとめられており，理解の補完に有用であった。

その後，数理統計学や機械学習の応用に関する様々な書籍を読んだが，その根底には数理統計学があると感じた。そのため基本に立ち返り，数理統計学の復習も兼ねて，本書を読むこととした。
ただ，基本的なことは他書で学んできたのと，本書自体がかなり細かく説明されているので，本書内の内容や数式を細かく追うというより，実務や統計検定の受験において有用そうなことを選んでまとめてみたい。

本記事は，「第1章確率の基礎」における，代表的な離散分布に関する読書メモである。

第1章　確率の基礎

本章では，代表的な確率分布(離散分布・連続分布)やモーメント母関数，そして確率分布の操作に重要な中心極限定理などについて説明している。

1.1.2 離散分布

二項分布

各試行で成功する確率を $p$ ，試行回数を $n$ とする。このとき二項分布にしたがう確率は，

$\begin{align} P(X=k) = {}_n C_k p^k q^{n-k}, \quad(k=0, 1, ..., n) \\ \\ \end{align}$

と表される。ただし $q = 1- p$ である。

二項分布 $Bi(n, p)$ において， $p$ を固定して $n$ の値を大きくしていくと，だんだん滑らかな曲線に近づいていく。
また $n$ を固定して $p$ の値を変えていくと， $p=0.5$ のときは左右対称になるが，それ以外の $p$ では非対称になる。

描画用サンプルコードはクリックで展開

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import binom

# Data for varying n
n_values = [2, 5, 8, 10]
p_fixed = 0.5

# Data for varying p
n_fixed = 10
p_values = [0.1, 0.2, 0.3, 0.4, 0.5]

plt.figure(figsize=(16, 6))

# Subplot 1: Varying n
plt.subplot(1, 2, 1)
for n in n_values:
    k = np.arange(0, n + 1)
    prob = binom.pmf(k, n, p_fixed)
    plt.plot(k, prob, marker='o', linestyle='-', label=f'n={n}')
plt.title('Binomial Distribution for p=0.5 and varying n')
plt.xlabel('Number of successes (k)')
plt.ylabel('Probability')
plt.legend()
plt.grid(True)

# Subplot 2: Varying p
plt.subplot(1, 2, 2)
for p in p_values:
    k = np.arange(0, n_fixed + 1)
    prob = binom.pmf(k, n_fixed, p)
    plt.plot(k, prob, marker='o', linestyle='-', label=f'p={p}')
plt.title('Binomial Distribution for n=10 and varying p')
plt.xlabel('Number of successes (k)')
plt.ylabel('Probability')
plt.legend()
plt.grid(True)

plt.tight_layout()
plt.show()

幾何分布と負の二項分布

幾何分布は，ベルヌーイ試行において，初めて事象 $S$ が起きるまでに要した回数 $X$ がしたがう確率関数であり，

$\begin{align} P(X=r) = pq^{r-1}, \quad (r=1, 2, ...) \\ \\ \end{align}$

で表される。

これを一般化して，事象 $S$ が $M$ 回起きるまでに要した回数を $X$ とする。この確率関数は，

$\begin{align} P(X=n) = {}_{n-1} C_{M-1} p^M q^{n-M} \\ \\ \end{align}$

で表される。この確率分布は負の二項分布と呼ばれる。

【補足】負の二項分布とポアソン分布・ガンマ分布との関係

負の二項分布の特徴として，負の二項分布はポアソン分布とガンマ分布を混合した分布として得られるというものが挙げられる。
これは，ポアソン分布のパラメータ $\lambda$ がガンマ分布にしたがう場合，これらの2つの確率分布を掛け合わせてパラメータ $\lambda$ を積分消去する(この一連の操作を「混合する」と表現する)と，この確率分布は負の二項分布になる。
具体的な計算は，ポアソン分布から他の分布への変換 #統計検定 - jiku logにて説明した。

またこれは，統計検定1級における，2022年の統計数理・第3問にも出題された話題である。

超幾何分布

超幾何分布はおもに非復元抽出に現れる確率分布であり，以下のように表される。

$\begin{align} P(X=r) = \frac{ {}_R C_r \cdot {}_{N-R} C_{n-r} }{ {}_N C_n}, \quad(r=0, 1, ..., \min(n, R)) \\ \\ \end{align}$

【補足】超幾何分布と二項分布の関係

超幾何分布において， $R/N \rightarrow p, N \rightarrow \infty$ という極限を取ると，これは二項分布に変換される。具体的な計算は，超幾何分布から二項分布への変換 #統計検定 - jiku logにて説明した。

ポアソン分布

ポアソン分布は，「1回1回の試行では起きる確率は小さいが，試行回数が多いので全体としてはかなり起こりうる」現象をモデル化する際に用いられる分布である。
ポアソン分布の確率分布は以下のように表される。

$\begin{align} P(X=k) = e^{-\lambda} \frac{\lambda^k}{k!} \\ \\ \end{align}$

描画用サンプルコードはクリックで展開

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import poisson

lambda_values = [0.5, 1, 3, 5]
k = np.arange(0, 11)  # 横軸の範囲を0から10までとする

plt.figure(figsize=(10, 6))

for lambda_val in lambda_values:
    prob = poisson.pmf(k, lambda_val)
    plt.plot(k, prob, marker='o', linestyle='-', label=f'$\lambda$={lambda_val}')

plt.title('Poisson Distribution for varying $\lambda$')
plt.xlabel('Number of events (k)')
plt.ylabel('Probability')
plt.legend()
plt.grid(True)
plt.show()

【補足】ポアソン分布と二項分布の関係

二項分布において， $np = \lambda, n \rightarrow \infty$ とすると，ポアソン分布が得られる。この式変形については，ポアソン分布への変換 #統計検定 - jiku logにて紹介した。

まとめと感想

今回は，「第1章確率の基礎」における，代表的な離散分布についてまとめた。

本章では，二項分布をはじめとする代表的な確率分布の定義と性質が整理されている。本書の補足として，二項分布からポアソン分布への極限操作や，超幾何分布から二項分布への近似など，確率分布間の関係に関する話題にも触れたが，これらは統計学を体系的に理解するうえで不可欠な話題である。

特に興味深いのは，負の二項分布とポアソン・ガンマ混合分布の関係である。これは過去の統計検定１級にも出題された話題であるが，分布の「混合」という視点は，単なる公式暗記を超えて，確率分布を生成的に理解するアプローチにつながる。これはベイズ推定や階層モデルの基盤ともなり，実務のデータ解析でも重要な考え方である。

本書において，図は提示されているものの描画用のコードは準備されていなかったが，確率分布のパラメータを変化させたときの形状変化を可視化する試みは，理論を直感的に理解する際に有効であると考える。

本記事を最後まで読んでくださり，どうもありがとうございました。