jiku log

JTCのデータサイエンス中間管理職の学び

ベータ分布における変数変換 #統計検定

はじめに

統計検定1級の統計数理・理工学において,ベータ分布はこれまでに2回しか出たことがない。ただ,数理統計学のテキストにはよく出てくる分布なので紹介する。

ベータ分布

統計検定1級での出題

統計検定1級の統計数理・理工学において,2012年~2022年の10年の間で,関連する問題が2題出題されている。

ベータ分布と他の確率分布との関係

ベータ分布と他の分布の関係は以下の通りである。

以下の説明では,確率変数 X, Y確率密度関数 f_X(x), f_Y(y)とする。なお表記を簡単にするために,確率密度関数における定義域は略記する。

ベータ分布→連続一様分布の変換

確率変数 Xが,ベータ分布 Be(a,b)にしたがうとする。 a=b=1とすると,これは連続一様分布にしたがう。

方針

ベータ分布における特殊ケースが連続一様分布であり,この場合は変数変換の必要はない。

導出

ベータ分布の確率密度関数 Be(x|a, b) は,


 \displaystyle
Be(x|a, b) = \frac{1}{B(a, b)} x^{a-1} (1-x)^{b-1} \quad (0 \leq x \leq1)
である。ただし, B(a, b)はベータ関数である。


 \displaystyle
B(a, b) = \frac{\Gamma(a) \Gamma(b)}{\Gamma(a+b)} = \frac{(a-1)!  (b-1)!  }{(a+b-1)! }
より B(1, 1) = 1なので,

ベータ分布の確率密度関数 Be(x|a, b)は,


 \displaystyle
Be(x|a, b) = \frac{1}{B(1, 1)} x^{1-1} (1-x)^{1-1} = 1 \quad (0 \leq x \leq1)

となり,これは連続一様分布 U(0, 1)である。

連続一様分布→ベータ分布の変換

確率変数 Yが,連続一様分布 U(0, 1)にしたがうとする。すわなち確率変数 Y確率密度関数 f_Y(y)と累積分布関数 F_Y(y)がそれぞれ,


 \begin{align}
f_Y(y) &= 1 \quad (0 \leq y \leq 1) \\
F_Y(y) &= Y \quad (0 \leq y \leq 1)
\end{align}
であるとする。得られた n個のサンプル Y_1, ..., Y_nにおける第i順序統計量の確率密度関数 f_{(i)}(y)はベータ分布にしたがう。

方針

第i順序統計量の確率密度関数の式に当てはめていけばよい。

導出

第i順序統計量の確率密度関数は以下の式で表される。


 \begin{align}
 f_{(i)}(y) = \frac{n!}{(i-1)! (n-i)! } F_Y(y) ^{i-1} f_Y(y) (1 - F_Y(y))^{n-i}
\end{align}

この式に,連続一様分布の確率密度関数と累積分布関数の式を代入すると,


 \begin{align}
 f_{(i)}(y) = \frac{n!}{(i-1)! (n-i)! } y ^{i-1}  (1 - y)^{n-i} = Be(i, n-i+1)
\end{align}

となり,ベータ分布 Be(i, n-i+1)が得られた。

まとめ

統計検定1級でこれまで2回しか出てきていないベータ分布について,一様分布からベータ分布へ,ベータ分布から一様分布へ変換する方法についてまとめた。

数理統計学の教科書には,ガンマ分布とベータ分布の間にある美しい関係に感動したが,ベータ分布は分散やモーメント母関数の式が煩雑であるし,他の確率密度関数との関係も少ないので,問題としては出しにくいかもしれない。

本記事を最後まで読んでくださり,どうもありがとうございました。