最大値と最小値の分布(一般論と例)

00 以上 11 以下の数字をランダムに独立に nn 個生成する。このとき,小さい方から kk 番目の数の期待値は kn+1\dfrac{k}{n+1} となる。

最大値や最小値など「小さい方から kk 番目」が従う確率分布の公式について考えます。最後に公式を一様分布に適用することで,上記の性質を確認します。

最大値が従う分布

確率変数 X1,,XnX_1,\dots, X_n が互いに独立に同一の分布(累積分布関数が F(x)F(x) )に従うとします。このとき,X1,,XnX_1,\dots,X_n の最大値や最小値が従う分布について考えてみます。

まず「最大値の分布」の累積分布関数は F(x)nF(x)^n になります。

導出

「最大値が xx 以下の確率」

=「X1,,XnX_1,\dots,X_n が全て xx 以下になる確率」

=F(x)××F(x)=F(x)n=F(x)\times \dots \times F(x)\\ =F(x)^n

最小値が従う分布

「最小値の分布」の累積分布関数は 1{1F(x)}n1-\{1-F(x)\}^n になります。

導出

「最小値が xx 以下の確率」

=「少なくとも1つは xx 以下になる確率」

=1-「全部 xx より大きい確率」

=1{1F(x)}n=1-\{1-F(x)\}^n

順序統計量が従う分布

X1,,XnX_1,\dots,X_n のうち,小さい方から kk 番目」が従う分布の 累積分布関数は,

t=knnCtF(x)t{1F(x)}nt\displaystyle\sum_{t=k}^n{}_n\mathrm{C}_tF(x)^t\{1-F(x)\}^{n-t}

最小値の分布(k=1k=1 の場合),最大値の分布(k=nk=n の場合)の一般化です。

導出の概略

小さい方から kk 番目が xx 以下である確率

=「nn 個のうちちょうど tt 個が xx 以下である確率」を t=kt=k から t=nt=n まで足し上げたもの

と考える。

累積分布関数はシグマが入っていて少し複雑ですが,実は微分するときれいになります。

X1,,XnX_1,\dots,X_n のうち,小さい方から kk 番目」が従う分布の 確率密度関数は,

knCkF(x)k1{1F(x)}nkf(x)k{}_n\mathrm{C}_kF(x)^{k-1}\{1-F(x)\}^{n-k}f(x)

※もとの分布の確率密度関数 f(x)f(x) の存在は仮定します。

導出の概略

上記の累積分布関数を地道に微分すると,

t=knnCttF(x)t1{1F(x)}ntf(x)t=knnCt(nt)F(x)t{1F(x)}nt1f(x)=t=knn!(t1)!(nt)!F(x)t1{1F(x)}ntf(x)t=kn1n!t!(nt1)!F(x)t{1F(x)}nt1f(x)\displaystyle\sum_{t=k}^n{}_n\mathrm{C}_ttF(x)^{t-1}\{1-F(x)\}^{n-t}f(x)\\ -\displaystyle\sum_{t=k}^n{}_n\mathrm{C}_t(n-t)F(x)^t\{1-F(x)\}^{n-t-1}f(x)\\ =\displaystyle\sum_{t=k}^n\dfrac{n!}{(t-1)!(n-t)!}F(x)^{t-1}\{1-F(x)\}^{n-t}f(x)\\ -\displaystyle\sum_{t=k}^{n-1}\dfrac{n!}{t!(n-t-1)!}F(x)^t\{1-F(x)\}^{n-t-1}f(x)

となるが,(第1項で ttt+1t+1 にすると第2項と一致するので)うまく打ち消し合って,第1項の t=kt=k の項のみが残る。

一様分布の場合の例

区間 [0,1][0,1] 上の一様分布に,上記の結果を適用してみます。

累積分布関数は F(x)=xF(x)=x なので「X1,,XnX_1,\dots,X_n のうち,小さい方から kk 番目」が従う分布の 確率密度関数は,

Cxk1(1x)nkCx^{k-1}(1-x)^{n-k}

となります(ただし,CC は正規化定数)。

これは,パラメータが (k,nk+1)(k,n-k+1) であるベータ分布です。そこで,ベータ分布の期待値の公式を使うと「小さい方から kk 番目」の期待値が

kn+1\dfrac{k}{n+1}

になることが分かります。

参考:ベータ分布の意味と平均・分散の導出

一般論(確率密度関数の導出で項が打ち消し合うところ)も具体例(乱数の期待値が等間隔に並ぶところ)もきれいです。