jiku log

データサイエンスの核心を掴む : 学びと発見の記録

「自然科学の統計学」を読む ~第10章 確率過程の基礎 ①ランダム・ウォーク~

はじめに

東京大学教養学部統計学教室編「自然科学の統計学」は,1992年発行のやや古典的な文献であるが,自然科学に関わる統計学的テーマが簡潔にまとめられている。数理統計学の復習も兼ねて,本書を読むこととした。
ただ,基本的なことは他書で学んできたのと,本書自体がかなり細かく説明されているので,本書内の内容や数式を細かく追うというより,実務や統計検定の受験において有用そうなことを選んでまとめてみたい。


本記事は,「第10章 確率過程の基礎」における,ランダム・ウォークに関する読書メモである。

※註 : 私(本記事の筆者)の主観ではあるが,本章の内容は他の章に比べてかなり情報を詰め込んでいる印象を受けた。また本章の内容をきちんと理解するためには,他書をかなり参照する必要があると感じた。本章の内容については理解不足の部分も多いと思うが,ご容赦頂きたい。

第10章 確率過程の基礎

本章では,確率過程を扱っている。確率過程(Stochastic Process)とは,確率変数列 X_tを時刻 tごとに定める枠組みである。
本章では確率過程の基本的なものとして,ランダム・ウォーク,ブラウン運動マルコフ連鎖などについて説明している。

10.1 ランダム・ウォークと破産問題

ランダム・ウォーク

ランダム・ウォークは,基本的な確率過程の1つである。1次元のランダム・ウォークでは,確率変数 X_i, \: (i=1,...,n)は互いに独立で,

  • 確率 p X_i = 1
  • 確率 q (= 1-p) X_i = -1

を取るものとする。

このような確率変数について,期待値と分散はそれぞれ,


 \begin{align}
E [ X_i ] &= p \cdot 1 + q \cdot (-1) = p - q \\ \\
V [ X_i ] 
&= E [ X_i^2 ] - E [ X_i ]^2 \\ \\ 
&= p \cdot 1^2 + q \cdot (-1)^2 - (2p - 1)^2 \\ \\
&= p + 1- p - 4p^2  + 4p - 1 = 4p(1-p) = 4pq \\ \\ 
\end{align}
となる。


1次元のランダム・ウォークについて,時点 nにおける粒子の位置は,


 \begin{align}
S_n = X_1 + X_2 + \cdots + X_n  \\ \\
\end{align}
と表される。この S_nの期待値と分散は,

 \begin{align}
&E [ S_n ] = n E [ X_i ] = n (p - q) \\ \\
&V [ S_n ] = n V [ X_i ] = 4n pq \\ \\ 
\end{align}
となる。


1次元のランダム・ウォークを図示すると以下のようになる。

ランダム・ウォークの例

時点nにおいて位置rにいる確率

時点 nにおける粒子の位置 S_nが位置 rに等しい確率を考える。

 X_i \in [-1, 1] であるため, (X_i + 1) / 2 \in [0, 1] となり,これはベルヌーイ試行列になる。そのため, (X_i + 1) / 2 の総和を B_n = (S_n + n)/2とすれば, B_nは二項分布にしたがう。そのため,

  •  (n+r)/2が整数,すなわち (n+r)が偶数である
  •  0 \leq (n+r)/2 \leq nである

とき,


 \begin{align}
P(S_n = r) = P\left( B_n = \frac{n+r}{2}  \right) = {}_n C_{\frac{n+r}{2}} p^{\frac{n+r}{2}} q^{\frac{n-r}{2}} \\ \\
\end{align}
となる。

原点に戻る確率

原点を出発した1次元ランダム・ウォークが,原点に戻ってくる確率を考える。

 h_iを「位置  i から出発して(ある時点で)原点に到達する確率」とする。特に, h_0 = 1となる。

ランダム・ウォークでは,座標が1増える確率が p,座標が1減る確率が qであるため,


 \begin{align}
&h_i = p h_{i+1} + q h_{i-1} \\ \\
\Rightarrow &p h_{i+1} - h_i + q h_{i-1} = 0 \\ \\
\end{align}
という差分方程式になる。

ランダム・ウォークの座標変化の様子

この差分方程式における特性方程式とその解は,


 \begin{align}
&p \lambda^2 - \lambda + q  = 0 \\ \\
\therefore & \lambda = 1, \frac{q}{p} \\ \\
\end{align}
となる。ただし, p \neq qとした。これより h_iの一般解は,

 \begin{align}
h_i = A + \left( \frac{q}{p} \right)^i \\ \\
\end{align}
となる。


 A, Bを決める必要があるが,初期条件 h_0 = 1より, A+B = 1となる。残りの条件式は, iが大きいときの極限から考える。


 p \gt qのとき,ランダム・ウォークは値が増え続けやすいので, i \rightarrow \infty h_i \rightarrow 0となる。よって, A=0, B=1となる。
これより, h_1 = q/pとなる。次に, h_{-1},すなわち「位置  -1 から出発して(ある時点で)原点に到達する確率」は,このランダム・ウォークは値が増え続けやすいので,いずれ1つ隣の原点に到達し, h_{-1} = 1となる。

よって,


 \begin{align}
h_0 = p \cdot \frac{q}{p} + q \cdot 1 = 2q = 2 \min(p, q) \\ \\
\end{align}
となる。


 p \lt qのとき,同様に考えると


 \begin{align}
h_0 = p \cdot 1 + q \cdot \frac{p}{q} = 2p  = 2 \min(p, q) \\ \\
\end{align}
となる。


以上より,原点を出発したランダム・ウォークが,原点に戻ってくる確率は,


 \begin{align}
h_0 = 2 \min(p, q) = 1 - \lvert p - q \rvert \\ \\
\end{align}
となる。

また, p = q = 1/2のとき,原点に戻る確率は1となる。

まとめと感想

今回は「第10章 確率過程の基礎」における,ランダム・ウォークについてまとめた。

ランダム・ウォークは,シンプルなルールではあるものの,座標の推移がかかわってくるので,ランダム・ウォークが原点に戻ってくる確率や破産問題においては,差分方程式が登場する。
差分方程式は,

という手順になるため,統計検定1級や準1級対策としては,一度手を動かして解くことが重要であると考えられる。


本記事を最後まで読んでくださり,どうもありがとうございました。