はじめに
当ブログのサブタイトルは,「データサイエンスの核心を掴む : 学びと発見の記録」である。2025年6月の学びと発見を振り返ってみた。

インプット編
2025年6月は,2冊の本を読んだ。
「Pythonでつくる Webアプリのつくり方」
クジラ飛行机、 杉山 陽一、遠藤 俊輔 著「PythonでつくるWebアプリのつくり方」を読み,Pythonを使ったWebアプリ開発の基礎を学ぶことにした。
製造業におけるデータ分析プロジェクトを行なった後に,業務の中にデータ分析を組み込んでいくためには,自動的にデータを可視化したり,自動的に分析をしたりするための仕組みが必要になる。これまではデータ分析そのものにかかわる技術習得を意識していたが,業務に組込まれたデータ分析を実現するアプリを作りたいと思い,本書を手に取った。
本書は,テキストデータを登録・表示する掲示板アプリから始まり,メモ帳・カレンダー・リバーシといった実践的なアプリ,機械学習を使ったアプリ,そして生成AIを使ったアプリといった順に説明している。基本的なところからスタートして,少しずつ機能を発展させながら説明しているので,内容を把握しやすい構成になっていた。
「コピュラ理論の基礎」
私は製造業のデータ分析部門に所属する立場から,江村 剛志 著「コピュラ理論の基礎」を読むことにした。
この理由は,製造業におけるデータ分析において,複数の変数間の複雑な依存関係を精緻にモデル化する必要性が高まっているためである。特に,生産プロセスや品質管理データの分析では,従来の相関分析では捉えきれない非線形な依存構造を扱う場面が増えている。
コピュラ理論は,周辺分布と依存構造を分離し,柔軟なモデル構築を可能にする手法として知られている。「コピュラ」という言葉にはこれまであまりなじみがなかったが,本書はまえがきに「大学1年次から読めるよう」とあるくらい,丁寧に書かれており,基礎から理解することができた。
実際は,コピュラが同時分布関数であるため,数理統計学の知識がある方が読み進められると考えられるが,標準的な数理統計学の教科書における「多変量分布」の内容まで理解できていれば,読み進められると考えられる。また定義や定理を説明する前に,背景にある考え方を丁寧に説明しているので,重要な定義や定理も理解しやすかった。
ただ,数理統計学の場合,多変量分布の後には統計的推定の話が出てくるのだが,本書ではコピュラのパラメータ推定などの話題には触れられていなかった。こちらは論文や記事などで理解していきたい。
アウトプット編
ブログの記事
ブログの記事は,30個作成した。今月の記事は,ほぼ「Pythonでつくる Webアプリのつくり方」と「コピュラ理論の基礎」の読書メモだった。
- 2025年5月のアクセス数時系列グラフ ※スクリーンショットは2025/5/31に取得

↓
- 2025年6月のアクセス数時系列グラフ ※スクリーンショットは2025/6/30に取得

先月はアクセス数が5,000件を超えたが,今月も5,000件を超えた。また,累積のアクセス数も50,000件を超えた。
Google Analyticsを用いて,2025/6/1~30の1か月間におけるアクセス数を確認し,今月作成した記事のうち最もアクセス数が多かった記事を確認したところ,以下の記事であった。
stern-bow.hatenablog.com
コピュラの記事ではあったが,統計検定準1級でもおなじみである順位相関係数の話題であった。
統計検定準1級を受けたときは,スピアマン順位相関係数とケンドール順位相関係数はさらっとしか学んでいなかったが,コピュラとの関連も深いことが興味深かった。
ただ,これまで触れた数理統計学の本においては,これら順位相関係数の話題は少なかったので,いろいろと調べてみて記事にしてみても良いと感じた。
振り返りと今後の抱負
業務への応用を意識した読書をしていきたい。
今月は,Webアプリの作成方法やコピュラについて学ぶことができた。ただ,表面的な理解にとどまっている感じがしている。
理解を深めていくためには実践が重要であるため,業務で使うWebアプリを作ってみたり,仕事の中でコピュラによる分析を試したりすることで,業務課題の解決手段としての知識を身に着けていきたい。
本記事を最後まで読んでくださり,どうもありがとうございました。