はじめに
統計検定1級の統計数理・理工学において,不偏推定量は頻出分野である。
統計学の教科書では,「●●は不偏推定量である」「●●を不偏推定量として…」という説明は多いが,「不偏推定量を求めよ」という問題が出た時に頭が混乱したことがあったので,この記事では不偏推定量の求め方についてまとめた。
統計検定1級での出題
統計検定1級の統計数理・理工学において,2012年~2022年の10年の間で,関連する問題が5年(6問)出題されている。
不偏推定量の例
が,平均,分散をもつ確率分布から発生しているとする。
とすると,
となる。よって標本平均は,の不偏推定量である。
また,不偏分散
は, の不偏推定量である。
不偏推定量の求め方
ここまでは,「●●は不偏推定量である」という説明であり,統計学の教科書ではおなじみの話題である。
一方で以前数理統計学の演習問題を解いていたときに,「データから不偏推定量を求めよ」という問題があり,これまでと逆の発想を求められたので頭が混乱したことがあった。
たとえば,久保川 達也著 「現代数理統計学の基礎」の演習問題において,以下のような設問がある(第6章 問4)。
連続一様分布にしたがうデータがあるとき,標本平均に基づく不偏推定量を求めよ。
このような問題にアプローチする方法を考えてみよう。
ポイント2 : データXを発生させている確率モデルに着目する
求めたいものはパラメータの点推定量なので,データを発生させている確率モデルを仮定している。
ここでいう確率モデルとは確率密度関数や確率関数のことであるが,確率モデルにおける特性値(平均や分散)は,データとパラメータの関係性を示している。また代表的な確率モデルを学ぶ際に,それらの特性値も併せて学ぶ。
今回の問題では,データが連続一様分布にしたがうので,
のようになる。
改めて確認してみると,左辺にはデータの情報が,右辺にはパラメータの情報があるので,不偏推定量を求める際にもこれらがヒントになる。
ポイント3 : 係数調整を行なう
確率モデルの特性値を求めておけば,あとは係数調整である。
今回の問題設定では,標本平均に基づく不偏推定量を求めたいので,標本平均に関する特性値を求めると,
となる。
あとは,パラメータが主役になるように,余計な係数を推定量に持っていくように係数調整すると,
となる。
この式を改めて確認してみる。右辺・左辺の項の順番を変えると,
になっており,「期待値を取るとパラメータの値になる」という不偏推定量の定義を満たしていることが分かる。
不偏推定量を求める手順
以上をまとめると,不偏推定量を求める手順は以下のようになる。
- 手順1 : データXを発生させている確率モデルに着目し,この確率モデルの特性値(平均や分散)を求める。
- 手順2 : 上記の特性値からパラメータが得られるよう係数調整を行なう。
不偏推定量を求める例題
上記に示した一様分布の例はかなりシンプルなので,少し複雑な例題を示す。
例題は,久保川 達也著 「現代数理統計学の基礎」の演習問題の第6章 問11である。
詳細は書籍を買っていただくか上記サイトを参照していただきたいが,不偏推定量に関する設問は以下のようなものである。
確率変数が2項分布にしたがうとする。
とおくとき,の不偏推定量を求めよ。
では,先ほどの手順にしたがい不偏推定量を求めてみよう。
手順1 : 確率モデルに着目し特性値(平均や分散)を求める
確率変数が2項分布にしたがうので,
などが求められる。
手順2 : 係数調整を行なう
なので,先に求めた特性値からやを含むものを取り出す。
であり,
なので,
となり,の不偏推定量が求められた。
まとめ
統計検定1級の頻出分野である不偏推定量について,「不偏推定量を求めよ」という問題へのアプローチ方法についてまとめた。
本記事を最後まで読んでくださり,どうもありがとうございました。