jiku log

データサイエンスの核心を掴む : 学びと発見の記録

平均・分散に関するデルタ法 #統計検定

はじめに

統計検定1級の統計数理・理工学や統計検定準1級において,デルタ法はわりとお馴染みの話題である(1級よりも準1級に出やすい印象がある)。

デルタ法には,平均に関するものと分散に関するものがあるので,整理してみた。

関連記事

デルタ法

統計検定1級での出題

統計検定1級の統計数理・理工学において,2012年~2022年の10年の間で,関連する問題が2年(3問)出題されている。

定義と雰囲気

デルタ法に関する定義は,久保川達也 著「現代数理統計学の基礎」 (以下,久保川本と記載)の第5.3節に説明されている。

雰囲気だけ説明すると,デルタ法とは「ある確率変数が分布収束するときに,その確率変数を連続微分な関数で変換しても分布収束する」という定理である*1。ポイントとしては,分布収束がかかわってくることである。

中心極限定理との関係

分布収束するような確率変数の列に関する定理として代表的なものは,中心極限定理がある。そのためデルタ法は,中心極限定理との組合せで出てくることが多い。久保川本には,次のように説明されている。

確率変数の列 \{ U_n \} _{n=1,2,...}と連続微分可能な関数 g(\cdot)について,


 \begin{align}
\sqrt{n}(U_n - \mu) \rightarrow _d N(0, \sigma^2)
\end{align}


が成り立つときには,デルタ法から


 \begin{align}
\sqrt{n}(g(U_n) - g(\mu)) \rightarrow _d N(0, \sigma^2 \{ g'(\mu) \}^2  )
\end{align}

となる。

私は初見のときに,「確率変数の列 \{ U_n \} _{n=1,2,...}」と言われてもピンとこなかったが,たとえばある分布関数から得られたサンプル X=(X_1,...,X_n)について,


 \begin{align}
\bar{X_n} = \frac{1}{n} \sum_{i=1}^{n} X_i
\end{align}

とすると,確率変数の列 \{ \bar{X_n} \} _{n=1,2,...}において nを大きくするということは,平均の計算に用いるサンプルを増やすことに対応する。

また,中心極限定理は,分布関数 Fについて, E[X_i] = \mu, V[X_i ] =\sigma^2 が存在すると仮定したうえで,  \bar{X_n}を標準化したものが,標準正規分布の累積分布関数に収束するというものである。


 \begin{align}
P \left( \frac{\sqrt{n}(\bar{X_n} - \mu)}{\sigma} \leq z \right) \rightarrow \Phi(z)  \quad (n \rightarrow \infty)
\end{align}

これを書き直すと,


 \begin{align}
\frac{\sqrt{n}(\bar{X_n} - \mu)}{\sigma} \rightarrow _d N(0, 1)
\end{align}

すなわち


 \begin{align}
\sqrt{n}(\bar{X_n} - \mu) \rightarrow _d N(0, \sigma^2)
\end{align}

となる。

平均・分散に関するデルタ法

以下では,確率変数 Xが分布関数 Fにしたがい, E[X_i] = \mu, V[X_i ] =\sigma^2 が存在するものとする。

分散に関するデルタ法

分散に関するデルタ法は,ある確率変数 Xを連続微分可能な関数 Y=g(X)で変換したときの分散を求めるための式である。

厳密な証明ではないが,覚え方としてはテイラー展開(1次近似)を用いる。

 Y=g(X)を, \muの周りで1次の項までテイラー展開する。


 \begin{align}
Y = g(X) &\approx g(\mu) + g'(\mu)(X - \mu) \\
\Rightarrow g(X) -  g(\mu) &\approx  g'(\mu)(X - \mu) \\
\end{align}

両辺をそれぞれ2乗して期待値を取ると,


 \begin{align}
E [ (g(X) -  g(\mu))^2 ] &\approx  E [ \{ g'(\mu)(X - \mu) \}^2 ] = \{ g'(\mu) \}^2  E [ ((X - \mu) )^2 ] \\
\end{align}

よって,


 \begin{align}
V [ g(X) ] &\approx  \sigma^2 \{ g'(\mu) \}^2   \\
\end{align}

となり,関数 Y=g(X)で変換したときの分散が求められた。

平均に関するデルタ法

平均に関するデルタ法は,ある確率変数 Xを連続微分可能な関数 Y=g(X)で変換したときの平均を求めるための式である。

こちらも厳密な証明ではないが,覚え方としてはテイラー展開(2次近似)を用いる。

 Y=g(X)を, \muの周りで2次の項までテイラー展開する。


 \begin{align}
Y = g(X) \approx g(\mu) + g'(\mu)(X - \mu) + \frac{1}{2} g''(\mu) (X - \mu)^2 
\end{align}

両辺の期待値を取ると, E [ X - \mu ] =0 より,


 \begin{align}
E [ g(X) ]  
&\approx E [ g(\mu) ]  + \frac{1}{2} E [ g''(\mu) (X - \mu)^2 ] \\
&= g(\mu) + \frac{1}{2} \sigma^2 g''(\mu) 
\end{align}

となり,関数 Y=g(X)で変換したときの平均が求められた。

まとめ

統計検定1級や準1級でよく出てくるデルタ法について,平均・分散に関するデルタ法を紹介した。

本記事を最後まで読んでくださり,どうもありがとうございました。

*1:「デルタ法」という名前だと何やら計算手法っぽい印象を受けるが,久保川本では「定理」と説明されている