jiku log

データサイエンスの核心を掴む : 学びと発見の記録

統計検定1級 過去問解説:2024年 統計数理 問2 #統計検定

はじめに

本記事では,2024年の統計検定1級 統計数理の問2についてまとめてみた。

関連リンク

問題そのものをこちらのブログに掲載することができないので,以下のリンクを参考していただきたい。
www.toukei-kentei.jp

[1]

解説

確率変数の変数変換の問題である。今回の場合,極座標変換を用いる。

なお変数 \thetaがすでに使われているので,角度は別の変数で表す必要がある。

解答例


 \begin{align}
X &= R \cos T \\
Y &= R \sin T \\
\end{align}

と置く。ただし R Tは独立で, 0 \leq R \leq \theta, 0 \leq T \leq 2\piである。


 (X, Y) \rightarrow (R, T)に変数変換するヤコビアンは,


 \begin{align}
J = 
\begin{vmatrix}
  \partial x / \partial r & \partial x / \partial t \\
  \partial y / \partial r & \partial y / \partial t \\
\end{vmatrix}
= 
\begin{vmatrix}
  \cos t & -r \sin t \\
  \sin t & r \cos t \\
\end{vmatrix}
=r \\

\end{align}

となる。よって R, Tの同時確率密度関数 f_{R,T}(r, t)は, 0 \leq R \leq \thetaの範囲において


 \begin{align}
f_{R,T}(r, t) = h(x, y) \times J = \frac{r}{\pi \theta^2}
\end{align}

となる。

上記から, T (0 \leq T \leq 2\pi)は一様分布にしたがうことが分かるので, T確率密度関数 f_T(t)は,


\begin{align}
f_T(t) =
\begin{cases}
1/2 \pi & (0 \leq T \leq 2 \pi) \\
0 & \text{otherwise}
\end{cases}
\end{align}
となる。

よって,


 \begin{align}
f_{R,T}(r, t)  = \frac{r}{\pi \theta^2} = \frac{2r}{\theta^2} \times \frac{1}{2\pi} \\
\end{align}

と表される。

以上より変数の範囲に注意すると,確率密度関数 f(r)は,


\begin{align}
f(r) =
\begin{cases}
2r / \theta^2 & (0 \leq r \leq \theta) \\
0 & \text{otherwise}
\end{cases}
\end{align}

となる。

積分布関数は,確率密度関数積分すると,


\begin{align}
f(r) =
\begin{cases}
0 & (r \lt 0) \\
r^2 / \theta ^2 & (0 \leq r \leq \theta) \\
1 & (\theta \lt r) \\
\end{cases}
\end{align}

となる。 \blacksquare

[2]

解説

確率変数の平均と分散を求める問題である。
[1]で得られた確率密度関数は,有名な確率分布には属さないが,定義にしたがって平均と分散を求めればよい。

解答例

[1]で求めた確率密度関数を用いて,


 \begin{align}
E[ R ] = \int_{0}^{\theta} r \cdot \frac{2r}{\theta^2} dr = \frac{2}{\theta^2} \left[  \frac{1}{3} r^3 \right]_{0}^{\theta} = \frac{2}{3} \theta 

\end{align}
となる。 \blacksquare

また,


 \begin{align}
E[ R^2 ] = \int_{0}^{\theta} r^2 \cdot \frac{2r}{\theta^2} dr = \frac{2}{\theta^2} \left[  \frac{1}{4} r^4 \right]_{0}^{\theta} = \frac{1}{2} \theta^2 
\end{align}

より,


 \begin{align}
V[ R ] = E[ R^2 ]  - (E[ R ] )^2 = \frac{1}{18} \theta^2
\end{align}

となる。 \blacksquare

[3]

解説

「得られたサンプルの最大値がしたがう確率分布を求める」という順序統計量の問題である。
得られた n個のサンプルのうち最大値がしたがう分布(第 n順序統計量がしたがう分布)を求めるには,累積分布関数 P(R_{(n)} \leq r)を考えればよい。

解答例

第n順序統計量 R_{(n)}は得られたサンプルのうち最大値なので,


 \begin{align}
R_{(n)} \leq r  & \Leftrightarrow R_{(1)}, R_{(2)}, \cdots , R_{(n)} \leq r \\ \\
& \Leftrightarrow R_1, R_2, \cdots , R_n \leq r \\
\end{align}

となる。

よって, R_{(n)}がしたがう累積分布関数は, 0 \leq r \leq \thetaの範囲で,


 \begin{align}
G(r) &= P(R_{(n)} \leq r) = P(R_1, R_2, \cdots , R_n \leq r)  \\
&= \{ P(R \leq r)  \}^n  = \left(  \frac{r^2}{\theta^2} \right)^n \\
\end{align}

よって,定義関数 Iを用いて,


 \begin{align}
G(r)  = \frac{r^{2n}}{\theta^{2n}} I_{[ 0 \leq r \leq \theta ]}   \\
\end{align}

となる。 \blacksquare


また確率密度関数は,


 \begin{align}
g(r) = \frac{d}{dr} G(r) = \frac{2nr^{2n-1}}{\theta^{2n}} I_{[ 0 \leq r \leq \theta ]}   \\
\end{align}

となる。 \blacksquare

[4]

解説

最尤推定量を求める問題である。
これまでは F(r)および f(r) rの関数として見ていたが,最尤推定量を求める問題ではあるので,見方を変えて \thetaの関数とみる。

最尤推定量を用いる問題だからと言って,尤度方程式(対数尤度関数をパラメータで微分したものを 0と置いた方程式)を解こうとしても, \theta = 0となってしまう。
この問題では一様分布における最尤推定量の導出と同様に, r, \thetaの値の範囲が決まっているので,これを用いることとする。

解答例

 R_1, \cdots, R_nの尤度関数 L(\theta)は,


 \begin{align}
L(\theta) = \left(  \frac{2r}{\theta^2}  \right)^n I_{[ 0 \leq R_1, \cdots,  R_n \leq \theta ]}
 =  \frac{(2r)^n}{\theta^{2n}}   I_{[ R_{(n)} \leq \theta \lt \infty  ]}
\end{align}

これは \thetaに関する単調減少関数であるので, \thetaの範囲の最小値 R_{(n)} において, L(\theta)は最大値を取る。

よって最尤推定量は, \hat{\theta}_{ML} = R_{(n)}となる。 \blacksquare

[5]

解説

 \hat{\theta} _U \theta不偏推定量になるためには, E [  \hat{\theta} _U ] = \theta となるように,係数を調整すればよい。

解答例

 \hat{\theta}_{ML}がしたがう確率密度関数は,[3]で求めた g(r)である。

 g(r)について,期待値は,


 \begin{align}
E [ r ] &= \frac{2n}{\theta^{2n}} \int_{0}^{\theta} r \cdot r^{2n-1} dr \\ \\
&= \frac{2n}{\theta^{2n}} \times \frac{\theta ^{2n+1}}{2n+1} = \frac{2n}{2n+1} \theta \\
\end{align}

となる。

また,


 \begin{align}
E [ r^2 ] &= \frac{2n}{\theta^{2n}} \int_{0}^{\theta} r^2 \cdot r^{2n-1} dr \\ \\
&= \frac{2n}{\theta^{2n}} \times \frac{\theta ^{2n+2}}{2n+2} = \frac{n}{n+1} \theta^2 \\
\end{align}

より,分散は,


 \begin{align}
V [ r ] = E [ r^2 ] - (E [ r ])^2 = \frac{n}{(n+1)(2n+1)^2} \theta^2
\end{align}

となる。


これらを用いると, \hat{\theta}_Uが不偏推定量になるには, E [  \hat{\theta} _U ] = \theta ,すなわち


 \begin{align}
E [  \hat{\theta} _U ] &= a E [  \hat{\theta} _{ML} ] + b \\ \\
&= a \times \frac{2n}{2n+1} \theta + b = \theta \\ \\ 
& \therefore a = \frac{2n+1}{2n}, b=0 \\
\end{align}

となる。またこのとき \hat{\theta}_Uの分散は,


 \begin{align}
V [  \hat{\theta} _U ] &= a^2 V [  \hat{\theta} _{ML} ]  \\ \\
&= \frac{(2n+1)^2}{(2n)^2} \times \frac{n}{(n+1)(2n+1)^2} \theta^2 \\ \\
&= \frac{\theta ^2}{ 4n(n+1)} \\
\end{align}

となる。 \blacksquare

まとめ

2024年 問2の解説を行なった。

[1]および[2]では,あまり見慣れない確率密度関数が出てくるが,変数変換を丁寧に行なっていけば解けると考えられる。

[3]は順序統計量の基本的な問題である

[4]は最尤推定量を求める問題だが,一様分布の最尤推定と同様に尤度方程式では解けないパターンである。そのため,値の範囲に注意して定義関数を導入し,尤度方程式を使わずに尤度を最大化するような値を用いる方針を取る必要がある。


本記事を最後まで読んでくださり,どうもありがとうございました。