はじめに
統計検定1級の統計数理・理工学において,回帰分析の関連テーマ(最小二乗推定・線形単回帰・線形重回帰)は2012年~2022年の間で複数回登場した頻出分野の1つである。
本記事では,線形回帰モデルにおける3つの主な課題のうち,誤差項が正規分布にしたがうという仮定を加えた状態で,残差平方和の標本分布に関する性質を整理する。
特に,射影子と正規直交基底との関係や,正準形に関する説明を行なう。
目次
改訂履歴
- 特異値分解を用いたカイ2乗分布の導出が,久保川達也 著 「現代数理統計学の基礎」に説明されていることについて,参考文献に追記した(2024/10/31)。
回帰分析の関連テーマ(最小二乗推定・線形単回帰・線形重回帰)
統計検定1級での出題
統計検定1級の統計数理・理工学において,2012年~2020年の10年間で,最小二乗推定は5回出題されている。また関連テーマである線形単回帰は4回,線形重回帰は3回出題されており,割と出題頻度が多いテーマである。

線形回帰モデル
線形回帰モデルは,
であらわされる。
ここでは目的変数,
は計画行列(または説明変数行列),
は回帰係数,
は誤差項である。
線形回帰モデルにおける主な課題は以下の通りである。
- 最小二乗推定量とこれにかかわる数値の性質の把握
- 標本分布の性質の把握
- 検定
本記事では,2つ目の課題である「標本分布の性質の把握」について紹介する。
誤差項における正規性の仮定
実は,最小二乗推定量の導出においては,誤差項がしたがう分布については仮定を置いていなかった。
誤差項について正規性の仮定
残差平方和の標本分布 (カイ2乗分布)
残差平方和とは,残差ベクトルの絶対値の二乗のことである。残差平方和をで表すと,
となる。

では,この残差平方和がしたがう確率分布を考えてみよう。
特異値分解を用いた射影子の性質の確認
ここで,射影子および
の性質を,特異値分解を用いて確認していく。
を以下のように特異値分解する。

は上記のように正規直交基底からなる行列なので,
および
を満たす。
の特異値分解を用いると,
および
なので,
が得られる。すなわち射影子は,正規直交基底ベクトルの積になるということが分かる。

または,
となる。
は
個の正規直交基底からなるが,これらと直交するような正規直交基底ベクトル
を追加した行列
を考える。
すなわち,
である。これを用いると,
よって,
となり,もまた,正規直交基底ベクトルの積になるということが分かる。

正準形への変形
前節で計算した正規直交基底を用いて,誤差項
の見通しを良くするために変形する。
で定義されるを導入する。
は,正規分布にしたがう確率変数
に正規直交基底
をかけたものなので,
も正規分布にしたがう。
であるので,
となる。このようにが張る空間上の正規直交基底と,これに直交する空間上の正規直交基底で変換した形を正準形と呼ぶ。
さらに,より,
よって,
となる。
さらに,
となるので,
となり,残差平方和が,正準形で表現されることが確認できた。
カイ2乗分布の導出
より,
となるので,
となる。よって,
となり,残差平方和は自由度のカイ2乗分布にしたがうということが確認できた。
まとめ
統計検定1級ではおなじみのテーマである線形回帰モデルについて,残差平方和がカイ2乗分布にしたがうことや,誤差項におけるの不偏推定量について整理した。
射影子が,正規直交基底ベクトルで表現できることについては,他書ではあまり見かけたことが無いが,特異値分解を用いることで見通しを立てることができた。
参考文献
正準形については,竹村彰通 著 「現代数理統計学」に詳しく書かれている。こちらでは,特異値分解を用いることなく,正規直交基底を最初から導入して説明している。
www.gakujutsu.co.jp
特異値分解を用いてカイ2乗分布を導出する方法は,久保川達也 著「現代数理統計学の基礎」に紹介されている。
www.kyoritsu-pub.co.jp
本記事を最後まで読んでくださり,どうもありがとうございました。