はじめに
東京大学教養学部統計学教室編「自然科学の統計学」は,1992年発行のやや古典的な文献であるが,自然科学に関わる統計学的テーマが簡潔にまとめられている。数理統計学の復習も兼ねて,本書を読むこととした。
ただ,基本的なことは他書で学んできたのと,本書自体がかなり細かく説明されているので,本書内の内容や数式を細かく追うというより,実務や統計検定の受験において有用そうなことを選んでまとめてみたい。
本記事は,「第8章 質的データの統計分析 」における,ロジット・モデルとプロビット・モデルに関する読書メモである。
第8章 質的データの統計分析
本章では質的変数,すなわち「買う・買わない」,「合格する・合格しない」,「(医学・生物学での)生きる・死ぬ」といった変数を扱う。また,これらを扱うための手法であるプロビットモデル・ロジットモデルなどについて説明している。
8.1 二値データ
先ほど示した「買う・買わない」,「合格する・合格しない」,「(医学・生物学での)生きる・死ぬ」のように,対象がある状態やカテゴリーの項目に属しているかどうかのみを知ることができるデータを質的データと呼ぶ。
質的データを扱う方法として代表的なものは,分割表を用いる方法や,回帰分析の考え方を応用した確率モデルがある。この確率モデルとして代表的なものが,
- プロビット・モデル
- ロジット・モデル(ロジスティック・モデル)
である。
8.2 ロジット・モデルとプロビット・モデル
ロジット・モデル
ロジット・モデルは,ロジスティック分布の累積分布関数
ロジットモデルにおいて,
標準正規分布およびロジスティック分布のそれぞれの累積分布関数を並べて描くと,左図のようになる。
また標準正規分布および分散1のロジスティック分布のそれぞれの確率密度関数を並べて描くと,右図のようになる。

まとめと感想
今回は,「第8章 質的データの統計分析 」における,ロジット・モデルとプロビット・モデルについてまとめた。
本節では質的データを扱う統計的手法として,確率モデルに基づくプロビット・モデルとロジット・モデルが体系的に整理されていた。
プロビット・モデルは標準正規分布の累積分布関数を用い,ロジット・モデルはロジスティック分布の累積分布関数を用いる。両者のグラフの形状はかなり似ており,分散1に正規化されたロジスティック分布を考えると,推定されるパラメータはほぼ定数倍の関係にある。
特にロジット・モデルでは,対数オッズが線形関数として表現できる点が特徴的で,解釈のしやすさから広く用いられている。
本記事を最後まで読んでくださり,どうもありがとうございました。