はじめに
確率変数の変数変換は,統計検定1級で頻出の分野であるだけでなく,実用上でも新しい確率密度関数を作る際などで有益である。
この記事では,確率変数の変数変換の問題を解いていた際に,私がつまずいたポイントとその対策を紹介する。
確率変数の変換
確率変数の変換は,久保川達也 著 「現代数理統計学の基礎」をはじめ,数理統計学の書籍で紹介されている重要分野の1つである。
確率変数の変数変換~カイ2乗分布を例にして
カイ2乗分布の導出 : 誤った手順
確率変数の変数変換を覚えて,ひとつ賢くなったつもりの私は,意気揚々と練習問題に挑戦した。
確率変数の変数変換の例題として有名な,カイ2乗分布の導出は,以下のような問題である。
確率変数が,標準正規分布にしたがうとき,は,自由度1のカイ2乗分布にしたがうことを示せ。
ただし,の確率密度関数は,それぞれ以下の通りである。
以下の流れは,私が初めてこの問題に対峙した時にしてしまったミスである。
変数変換の関数は,なので,逆関数を求めると,
あとは公式通りに代入するだけなので,求めたい確率密度関数は以下のようになる。
ここでミスに気付くのである。求めた確率分布を定数倍しないと,求めたい確率分布にならなかったのである。
確率変数の変数変換の式が利用できる条件
確率変数の変数変換には,利用できる重要な前提条件があった。それは,
という点である。今回の変数変換の関数はなので,単調増加でも単調減少でもないのである。そのためこの問題では,確率変数の変数変換の式を利用することができない。
カイ2乗分布の導出 : 正しい手順
前提が崩れているので,別のアプローチをとる必要がある。久保川達也 著 「現代数理統計学の基礎」には正しい求め方が紹介されており,それは累積分布関数から導出するという方法である。
変数変換後の累積分布関数は
と表される。確率密度関数は,累積分布関数をで微分することで得られる。
この求め方の良い点は,変数変数の前後における,確率変数の値のとりうる範囲が明示される点である。こうすることで,変数変換前後で,確率変数の値の範囲の変換ミスを減らせるのである。
このことを踏まえると,カイ2乗分布の導出は以下のようになる。
変数変換後の(すなわちカイ2乗分布の)累積分布関数は,確率変数Zの累積分布関数をとして,
で表されるので,求める確率密度関数は,
となる。ここで,とおいて,Chain Ruleを用いると
となることなどから,
となり,無事にカイ2乗分布の確率密度関数が導出できた。これが有名な平方変換の式である。
まとめと教訓
どんな公式にも当てはまることであるが,その公式が利用できる前提条件を忘れてはならない。
確率変数の変数変換は,変数変換の関数において,とが1対1対応していないと使ってはならないのである。前提条件が満たされない場合は,定義に立ち返って導出することになる。
この問題が解けたとき,出題者の先生から「君は公式を丸暗記せず,きちんと本質を理解しているかな?」と問われているように感じた。