逆正弦法則の意味と導出

ランダムウォークにおける逆正弦法則について紹介します。大雑把に言うと,ほとんどの人は「ずっと勝っている状態」または「ずっと負けている状態」になるという話です。

途中の「おもしろい補題」は高校数学でも理解できます。

問題設定

  • 一次元のランダムウォークを考えます。

  • つまり,確率 12\dfrac{1}{2}+1+1 ポイント,確率 12\dfrac{1}{2}1-1 ポイントとなるゲームを繰り返す状況を考えます。

  • 例えば,コイントスを行い,勝ったら1円もらえ負けたら1円失うようなゲームを繰り返すイメージです。

  • 例として,(+1,1,+1,+1,1,1,1,1)(+1,-1,+1,+1,-1,-1,-1,-1) となった状況を図に示します。8回繰り返して最終 2-2 ポイントです。 逆正弦法則1

逆正弦法則

「逆正弦法則」と呼ばれる法則を2種類紹介します。

1. プラスの状態にいた時間の割合

「プラスの状態にいた時間の割合 R1R_1」が従う分布を考えます。例えば,(+1,1,+1,+1,1,1,1,1)(+1,-1,+1,+1,-1,-1,-1,-1) と遷移した場合,プラスの状態にいた時間の割合は図の赤い部分で R1=68R_1=\dfrac{6}{8} です。 逆正弦法則2

逆正弦法則1(時間の割合)

試行回数が十分大きいとき,「プラスの状態にいた時間の割合 R1R_1」が従う分布は,逆正弦分布に近づく。

ただし,この記事では以下の分布を逆正弦分布と呼ぶ。

A. 確率密度関数は p(r)=1π1r(1r)p(r)=\dfrac{1}{\pi}\dfrac{1}{\sqrt{r(1-r)}}
B. 累積分布関数は F(r)=2πArcsinrF(r)=\dfrac{2}{\pi}\mathrm{Arcsin}\sqrt{r}

  • 確率密度関数のグラフを描いてみます。当たり前ですが r=12r=\dfrac{1}{2} に関して対称です。r=12r=\dfrac{1}{2} でへこんでいて,r=0,1r=0,1 付近が高いです。つまり,多くの場合「ずっとプラス」または「ずっとマイナス」というわけです。 逆正弦法則3
  • 累積分布関数には逆三角関数が登場します。→逆三角関数(Arcsin,Arccos,Arctan)の意味と性質
    「逆正弦法則」と呼ばれる由来です。
  • AとBの関係を確認しておきます。
AとBの関係の確認

F(r)F(r) を微分して p(r)p(r) になることを確認する。

(Arcsinx)=11x2(\mathrm{Arcsin}\:x)'=\dfrac{1}{\sqrt{1-x^2}} および合成関数の微分公式より

dF(r)dr=2π11r×12r=p(r)\dfrac{dF(r)}{dr}=\dfrac{2}{\pi}\dfrac{1}{\sqrt{1-r}}\times\dfrac{1}{2\sqrt{r}}=p(r)

また,F(0)=0,F(1)=1F(0)=0,F(1)=1 であることもわかる。

2.最後に0に戻ってきてからの時間の割合

2つめの逆正弦法則です。「プラスの状態にいた時間の割合 R2R_2」が従う分布を考えます。例えば,(+1,1,+1,+1,1,1,1,1)(+1,-1,+1,+1,-1,-1,-1,-1) と遷移した場合,最後に0に戻ってきてからの時間の割合は R2=28R_2=\dfrac{2}{8} です。 逆正弦法則4

逆正弦法則2(最後に0に戻ってきた割合)

試行回数が十分大きいとき,「最後に0に戻ってきてから現在までの時間の割合 R2R_2」が従う分布は,逆正弦分布に近づく。

おもしろい補題

逆正弦法則の導出に向けて,おもしろい補題を紹介します。以下の補題は,

  • 逆正弦法則1と2の導出で使います。
  • 以下の補題だけなら高校数学範囲内で証明できます。
補題

試行回数 2N2N のとき,以下はすべて u2N=2NCN22Nu_{2N}=\dfrac{{}_{2N}\mathrm{C}_N}{2^{2N}} と等しい。

(a) 2N2N 回終了時に 00 にいる確率
(b) 2N2N 回目まで 00 に1回も戻らない確率
© 2N2N 回目までずっと 00 以上である確率

証明
  • (a) は簡単。2N2N 回のうち NN+1+1NN1-1 になる場合の数は 2NCN{}_{2N}\mathrm{C}_N

  • ©=(a) を示す。一番大変。
    2N2N 回終了時に 00 にいる (a) のパターン」と「2N2N 回目までずっと 00 以上である © のパターン」の間に1対1対応があることを示せばよい。 (a) のパターンに対して,
    最初に最小値を達成した点 AA までの部分を切って yy 軸に関して折り返して末尾につけて原点を AA に平行移動する
    と © のパターンになる。 逆正弦法則5 逆の操作も構成できる。つまり,©のパターンに対して
    はじめて最終累積値の半分まで戻った点 BB まで切って折り返して最初につけて原点を先頭の点に平行移動する」ともとの(a)のパターンに戻る。 逆正弦法則6

  • (b)=© を示す。文章は長いが難しくない。

    • 2N2N 回目まで0に1回も戻らない (b) のパターン」のうち「最初に+1」となるのは半分である。
    • 2N2N 回目までずっと 00 以上である © のパターン」のうち「最後に+1」となるのは半分である。なぜなら,2N12N-1 回目終了時は奇数ポイントなので,その時点までで © のパターンか否かが決まるからである。
    • 以上から「(b) のパターンのうち最初に+1のもの」と「© のパターンのうち最後に+1のもの」の間に1対1対応があることを示せばよい。
      「(b) のパターンのうち最初に+1のもの」に対して「最初の1回分を無視して,最後の1回に +1+1 をつける」と © のパターンになる。逆に「© のパターンのうち最後に+1のもの」に対して「最後の1回分を無視して,最初の1回に +1+1 をつける」と元に戻る。

逆正弦法則2の導出

さきほどの補題とスターリングの公式を使えば逆正弦法則2は簡単に導出できます。

逆正弦法則2の導出

まず,試行回数が 2N2N のとき,P(R2=kN)=u2ku2N2kP\left(R_2=\dfrac{k}{N}\right)=u_{2k}u_{2N-2k} であることを示す。

R2=kNR_2=\dfrac{k}{N} となるのは,2N2N 回のうち「最初の 2k2k 回終了時に0にいる」かつ「後半の 2N2k2N-2k 回で0に1回も戻らない」なので,補題の(a)と(b)より定理が成立。

次に,u2ku_{2k} を評価する。

スターリングの公式 k!2πk(ke)kk!\fallingdotseq\sqrt{2\pi k}\left(\dfrac{k}{e}\right)^k より,

u2k=2kCk22k=122k(2k)!k!k!122k2π(2k)(2ke)2k2πk(ke)k×2πk(ke)k=1kπu_{2k}=\dfrac{{}_{2k}\mathrm{C}_{k}}{2^{2k}}\\ =\dfrac{1}{2^{2k}}\dfrac{(2k)!}{k!k!}\\ \fallingdotseq\dfrac{1}{2^{2k}}\dfrac{\sqrt{2\pi(2k)}(\frac{2k}{e})^{2k}}{\sqrt{2\pi k}(\frac{k}{e})^k\times\sqrt{2\pi k}(\frac{k}{e})^k}\\ =\dfrac{1}{\sqrt{k\pi}}

以上より,

P(R2=kN)=u2ku2N2k1π1k(Nk)=1N1πkN(1kN)P\left(R_2=\dfrac{k}{N}\right)\\ =u_{2k}u_{2N-2k}\\\fallingdotseq \dfrac{1}{\pi}\dfrac{1}{\sqrt{k(N-k)}}\\ =\dfrac{1}{N}\cdot\dfrac{1}{\pi\sqrt{\frac{k}{N}(1-\frac{k}{N})}}

つまり NN が十分大きいとき,R2R_2 は確率密度関数が p(r)=1π1r(1r)p(r)=\dfrac{1}{\pi}\dfrac{1}{\sqrt{r(1-r)}} である分布に近づく(区分求積法)。

参考文献

  • 逆正弦法則2については Simple Random Walk を参考にしました。
  • 逆正弦法則1の証明は,2の証明と似ています。同じように P(R1=kN)=u2ku2N2kP\left(R_1=\dfrac{k}{N}\right)=u_{2k}u_{2N-2k} であることを示します。その後は全く同じです。ただし,紫色の式を示すために上記の補題に加えて数学的帰納法を使い,もう少し頑張る必要があります。→逆正弦法則の「できるだけ直感的な」証明

「おもしろい補題→スターリングの公式→積分してArcsinが出てくる」という一連の流れがとても楽しいです。