jiku log

データサイエンスの核心を掴む : 学びと発見の記録

2024-10-01から1ヶ月間の記事一覧

「データ解析のための統計モデリング入門」を読む ~第9章 GLMのベイズモデル化と事後分布の推定~

はじめに 数理統計学より実践的な内容の理解に向けて,久保 拓弥 著「データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC」を読んでいる。本記事は,第9章「GLMのベイズモデル化と事後分布の推定」の読書メモである。 本書の紹…

「データ解析のための統計モデリング入門」を読む ~第8章 マルコフ連鎖モンテカルロ(MCMC)法とベイズ統計モデル~

はじめに 数理統計学より実践的な内容の理解に向けて,久保 拓弥 著「データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC」を読んでいる。本記事は,第8章「マルコフ連鎖モンテカルロ(MCMC)法とベイズ統計モデル」の読書メモで…

最小二乗推定量に関連する標本分布(正規分布) #統計検定

はじめに 統計検定1級の統計数理・理工学において,回帰分析の関連テーマ(最小二乗推定・線形単回帰・線形重回帰)は2012年~2022年の間で複数回登場した頻出分野の1つである。 本記事では,線形回帰モデルにおける3つの主な課題のうち,誤差項が正規分布にし…

残差平方和に関連する標本分布(カイ2乗分布) #統計検定

はじめに 統計検定1級の統計数理・理工学において,回帰分析の関連テーマ(最小二乗推定・線形単回帰・線形重回帰)は2012年~2022年の間で複数回登場した頻出分野の1つである。 本記事では,線形回帰モデルにおける3つの主な課題のうち,誤差項が正規分布にし…

部分空間による線形回帰モデルの解釈 #統計検定

はじめに 統計検定1級の統計数理・理工学において,回帰分析の関連テーマ(最小二乗推定・線形単回帰・線形重回帰)は2012年~2022年の間で複数回登場した頻出分野の1つである。 理解を深めるための1つの手段として,図形的・幾何学的なイメージを持つ,という…

線形回帰モデルと最小二乗推定量の導出 #統計検定

はじめに 統計検定1級の統計数理・理工学において,回帰分析の関連テーマ(最小二乗推定・線形単回帰・線形重回帰)は2012年~2022年の間で複数回登場した頻出分野の1つである。 本記事では,線形回帰モデルにおける3つの主な課題と,そのうちの1つである最小…

統計検定1級に合格して変わらなかったこと・変わったこと #統計検定

はじめに 先日,「名刺に『統計検定1級(理工学)』と入れた話」をXにポストしたところ,多くの方から反応を頂けた。 名刺に「統計検定1級(理工学)」と入れたが反応が無かった話 拙者,名刺に「統計検定1級(理工学)」って書いて,ご丁寧にQRコードも入れてるの…

「データ解析のための統計モデリング入門」を読む ~第7章 一般化線形混合モデル(GLMM)~

はじめに 数理統計学より実践的な内容の理解に向けて,久保 拓弥 著「データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC」を読んでいる。本記事は,第7章「一般化線形混合モデル(GLMM) ―個体差のモデリング―」の読書メモであ…

「データ解析のための統計モデリング入門」を読む ~第6章 GLMの応用範囲をひろげる②~

はじめに 数理統計学より実践的な内容の理解に向けて,久保 拓弥 著「データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC」を読んでいる。本記事は,第6章「GLMの応用範囲をひろげる」の読書メモであり,Rのコード例をPythonで…

「データ解析のための統計モデリング入門」を読む ~第6章 GLMの応用範囲をひろげる~

はじめに 数理統計学より実践的な内容の理解に向けて,久保 拓弥 著「データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC」を読んでいる。本記事は,第6章「GLMの応用範囲をひろげる」の読書メモである。 本書の紹介ページ www…

「データ解析のための統計モデリング入門」を読む ~第5章 GLMの尤度比検定と検定の非対称性~

はじめに 数理統計学より実践的な内容の理解に向けて,久保 拓弥 著「データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC」を読んでいる。本記事は,第5章「GLMの尤度比検定と検定の非対称性」の読書メモである。 本書の紹介ペ…

尤度比検定におけるカイ2乗分布の導出 #統計検定

はじめに 統計検定1級の統計数理・理工学において,尤度比検定は2012年~2022年の間で2回しか登場していないが,最尤法の漸近論で登場する統計的検定の手法として重要な内容である。尤度比の検定統計量はカイ2乗分布にしたがうが,これを導出する際につまず…

尤度比検定における分母・分子の覚え方 #統計検定

はじめに 統計検定1級の統計数理・理工学において,尤度比検定は2012年~2022年の間で2回しか登場していないが,最尤法の漸近論で登場する統計的検定の手法として重要な内容である。尤度比の定義が教科書によって異なり,覚えるときに混乱したので,覚え方を…

「データ解析のための統計モデリング入門」を読む ~第4章 GLMのモデル選択~

はじめに 数理統計学より実践的な内容の理解に向けて,久保 拓弥 著「データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC」を読んでいる。本記事は,第4章「GLMのモデル選択 ―AICとモデルの予測の良さ―」の読書メモである。 本…

「データ解析のための統計モデリング入門」を読む ~第3章 一般化線形モデル(GLM)~

はじめに 数理統計学より実践的な内容の理解に向けて,久保 拓弥 著「データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC」を読んでいる。本記事は,第3章「一般化線形モデル(GLM)」の読書メモである。なおPythonコードは,Cha…

「データ解析のための統計モデリング入門」を読む ~第2章 確率分布と統計モデルの最尤推定~

はじめに 数理統計学より実践的な内容の理解に向けて,久保 拓弥 著「データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC」を読んでいる。本記事は,第2章「確率分布と統計モデルの最尤推定」の読書メモである。なおPythonコー…

「データ解析のための統計モデリング入門」を読む ~第1章~

はじめに 統計検定の学習を通じて,数理統計学における基礎的な考え方に触れることができた。次のステップとして,より実践的な内容の書籍を探していた。 久保 拓弥 著「データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC」は…

平均・分散に関するデルタ法 #統計検定

はじめに 統計検定1級の統計数理・理工学や統計検定準1級において,デルタ法はわりとお馴染みの話題である(1級よりも準1級に出やすい印象がある)。デルタ法には,平均に関するものと分散に関するものがあるので,整理してみた。 目次 はじめに 目次 デルタ法…

複素積分を用いた特性関数からの確率密度関数の導出(ガンマ関数を例として)

はじめに 数理統計学の教科書において, 確率密度関数のフーリエ変換によって,特性関数が求められる。 逆に,特性関数をフーリエ逆変換すると,確率密度関数が求められる。 確率密度関数と特性関数が1対1対応しているので,2つの特性関数が一致すると対応す…

ワルド検定とスコア検定の比較 #統計検定

はじめに 統計検定1級の統計数理・理工学において,ワルド検定・スコア検定はこれまでほとんど登場していないが,最尤法の漸近論で登場する統計的検定の手法としては重要な内容である。覚えようとしたときにごっちゃになってしまうことがあったので,両者を…

独立した合成変数を用いたt分布の平均・分散の導出 #統計検定

はじめに 統計検定1級の統計数理・理工学において,t分布はこれまで3回出てきた。標本分布や統計的検定においてお馴染みの分野ではあるが,「t分布にしたがう変数は,独立した確率変数の合成(積)である」という性質から,平均・分散が導出できることを説明す…

「大規模言語モデル入門」を読む ~第9章 質問応答~

はじめに 大規模言語モデルの入門書として,山田 育矢 著「大規模言語モデル入門」を読んでいる。本記事は第9章「質問応答」の読書メモである。gihyo.jp 目次 はじめに 目次 第9章 質問応答 9.1 質問応答システム オープンブック・クローズドブック 9.2 デー…

「基礎統計学III 自然科学の統計学」 #書籍紹介

「自然科学の統計学」の紹介 数理統計学を学んだ際には,竹村彰通 著「現代数理統計学」や,久保川達也 著「現代数理統計学の基礎」を読んだ。いずれの書籍も,とても丁寧に解説されているが,難易度が高く理解に時間がかかる箇所があった。ある分野を学ぶ際…

2024年9月の学びの振り返り

はじめに 当ブログのサブタイトルは,「JTCのデータサイエンス中間管理職の学び」である。というわけで,9月の学習記録を振り返ってみた。 目次 はじめに 目次 インプット編 「因果推論 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ…

「大規模言語モデル入門」を読む ~第8章 文埋め込み~

はじめに 大規模言語モデルの入門書として,山田 育矢 著「大規模言語モデル入門」を読んでいる。本記事は第8章「文埋め込み」の読書メモである。gihyo.jp 目次 はじめに 目次 第8章 文埋め込み 8.1 文埋め込みとは 文埋め込みの目的と必要性 文埋め込みの性…

「総和の累乗」の項数を求める #統計検定

はじめに 統計検定1級の統計数理・理工学において,「総和の累乗」に関する問題がたまに出てくる。「総和の累乗」に関する問題とは,以下のような問題設定である。 が互いに独立。 平均,分散,3次モーメント,4次モーメントを持つ。 として,にの期待値に…

クラメール・ラオの不等式の導出の流れとその応用 #統計検定

はじめに 統計検定1級の統計数理・理工学において,クラメール・ラオの不等式やフィッシャー情報量の話題は2回しか出たことがないテーマではあるが,数理統計学のテキストにはよく出てくる話題である。クラメール・ラオの不等式の不等式は,不偏推定量の分散…

「大規模言語モデル入門」を読む ~第7章 要約生成~

はじめに 大規模言語モデルの入門書として,山田 育矢 著「大規模言語モデル入門」を読んでいる。本記事は第7章「要約生成」の読書メモである。gihyo.jp 目次 はじめに 目次 第7章 要約生成 7.1 要約生成とは 出力形式 入力文書数 クエリ志向 7.2 データセッ…

ベータ分布の正規近似 #統計検定

はじめに 統計検定1級の統計数理・理工学において,ベータ分布はこれまでに2回しか出たことがないテーマではあるが,数理統計学のテキストにはよく出てくる分布である。先日,ガンマ分布の正規近似とスターリングの公式 #統計検定 - jiku logという記事を紹…

「大規模言語モデル入門」を読む ~第6章 固有表現認識~

はじめに 大規模言語モデルの入門書として,山田 育矢 著「大規模言語モデル入門」を読んでいる。本記事は第6章の読書メモである。gihyo.jp 目次 はじめに 目次 第6章 固有表現認識 6.1 固有表現認識とは 固有表現のタスク 固有表現認識を解くための主要アプ…