jiku log

JTCのデータサイエンス中間管理職の学び

「機械学習のための確率と統計」 #書籍紹介

機械学習のための確率と統計」の紹介

講談社の「機械学習プロフェッショナルシリーズ」は,最新のAI・機械学習手法を丁寧に紹介しているシリーズなので,データサイエンスを学ばれている方もよく読まれているかもしれない。
このシリーズのうち「機械学習のための確率と統計」は,統計検定1級や統計検定準1級の学習を進めるうえでも参考になると感じたので,紹介したい。

www.kspub.co.jp

本書を読もうとした理由

機械学習プロフェッショナルシリーズ」のうち,青い本と赤い本は,比較的新しいAI・機械学習手法を学ぶ上で重要だと考え,発売当初からコツコツ蓄積している。そのため早い段階でこの本は入手していた。
統計検定を受けるにあたり,改めてパラパラと見返してみたところ,参考になりそうな点がたくさんあったので,改めて読んでみることにした。

本書の構成

本書の構成は以下の通りである。

第1章 確率変数と確率分布
第2章 離散型確率分布の例
第3章 連続型確率分布の例
第4章 多次元確率分布の性質
第5章 多次元確率分布の例
第6章 任意の確率分布に従う標本の生成
第7章 独立な確率変数の和の確率分布
第8章 確率不等式
第9章 統計的推定
第10章 仮説検定

参考になった点

代表的な確率分布がコンパクトに紹介されている

統計検定を受験する際には,「現代数理統計学」などを熟読し,代表的な確率分布は一通り把握しておくことが重要である。本書でも,代表的な離散型確率分布と連続型確率分布の情報がコンパクトにまとめられているので,復習する際に適している。
また「現代数理統計学」では,多次元の確率分布の情報が少ないが,本書は多次元の確率分布の説明の量が多い。一通り確率分布を学んだあとに,知識を強化するために参考になると考えられる。もちろん,機械学習で頻出の確率分布(多項分布やディリクレ分布)も紹介されているので,機械学習を理解するうえでも有益である。

乱数生成に関する説明が充実している

確率分布にしたがう乱数の生成手法は,統計検定準1級や統計検定1級・統計応用などで出てくることが多い。逆関数法や棄却法,MCMCなどが丁寧に説明されている点も参考になる。

確率不等式の説明が充実している

期待値 E[X]や分散 V[X]といった限られた情報を用いて確率の大きさを見積もるための不等式を確率不等式と呼ぶ。代表的なものは,マルコフの不等式やチェビシェフの不等式だが,これ以外にも多くの確率不等式が紹介されている。
確率不等式は,2019年統計数理 問1などでも出題されており,統計検定を受験するうえでの重要分野だと考えられる。

本書に対する感想とまとめ

題名には「機械学習のための」と書かれているが,統計検定1級や,統計検定準1級の機械学習系の問題を解くうえで参考になるので,学習する際には手に取っていただきたい。