最大値と最小値の分布（一般論と例）

更新 2021/03/07

$0$ 以上 $1$ 以下の数字をランダムに独立に $n$ 個生成する。このとき，小さい方から $k$ 番目の数の期待値は $\dfrac{k}{n+1}$ となる。

最大値や最小値など「小さい方から $k$ 番目」が従う確率分布の公式について考えます。最後に公式を一様分布に適用することで，上記の性質を確認します。

最大値が従う分布

確率変数 $X_1,\dots, X_n$ が互いに独立に同一の分布（累積分布関数が $F(x)$ ）に従うとします。このとき， $X_1,\dots,X_n$ の最大値や最小値が従う分布について考えてみます。

まず「最大値の分布」の累積分布関数は $F(x)^n$ になります。

導出

「最大値が $x$ 以下の確率」

＝「 $X_1,\dots,X_n$ が全て $x$ 以下になる確率」

$=F(x)\times \dots \times F(x)\\ =F(x)^n$

最小値が従う分布

「最小値の分布」の累積分布関数は $1-\{1-F(x)\}^n$ になります。

導出

「最小値が $x$ 以下の確率」

＝「少なくとも1つは $x$ 以下になる確率」

＝１－「全部 $x$ より大きい確率」

$=1-\{1-F(x)\}^n$

順序統計量が従う分布

「 $X_1,\dots,X_n$ のうち，小さい方から $k$ 番目」が従う分布の累積分布関数は，

$\displaystyle\sum_{t=k}^n{}_n\mathrm{C}_tF(x)^t\{1-F(x)\}^{n-t}$

最小値の分布（ $k=1$ の場合），最大値の分布（ $k=n$ の場合）の一般化です。

導出の概略

小さい方から $k$ 番目が $x$ 以下である確率

＝「 $n$ 個のうちちょうど $t$ 個が $x$ 以下である確率」を $t=k$ から $t=n$ まで足し上げたもの

と考える。

累積分布関数はシグマが入っていて少し複雑ですが，実は微分するときれいになります。

「 $X_1,\dots,X_n$ のうち，小さい方から $k$ 番目」が従う分布の確率密度関数は，

$k{}_n\mathrm{C}_kF(x)^{k-1}\{1-F(x)\}^{n-k}f(x)$

※もとの分布の確率密度関数 $f(x)$ の存在は仮定します。

導出の概略

上記の累積分布関数を地道に微分すると，

$\displaystyle\sum_{t=k}^n{}_n\mathrm{C}_ttF(x)^{t-1}\{1-F(x)\}^{n-t}f(x)\\ -\displaystyle\sum_{t=k}^n{}_n\mathrm{C}_t(n-t)F(x)^t\{1-F(x)\}^{n-t-1}f(x)\\ =\displaystyle\sum_{t=k}^n\dfrac{n!}{(t-1)!(n-t)!}F(x)^{t-1}\{1-F(x)\}^{n-t}f(x)\\ -\displaystyle\sum_{t=k}^{n-1}\dfrac{n!}{t!(n-t-1)!}F(x)^t\{1-F(x)\}^{n-t-1}f(x)$

となるが，（第1項で $t$ を $t+1$ にすると第2項と一致するので）うまく打ち消し合って，第1項の $t=k$ の項のみが残る。

一様分布の場合の例

区間
[0,1][0,1][0,1]
 上の一様分布に，上記の結果を適用してみます。
累積分布関数は
F(x)=xF(x)=xF(x)=x
 なので「X1,…,XnX_1,\dots,X_nX1​,…,Xn​
 のうち，小さい方から
kkk
 番目」が従う分布の
確率密度関数は，
Cxk−1(1−x)n−kCx^{k-1}(1-x)^{n-k}Cxk−1(1−x)n−k
となります（ただし，CCC
 は正規化定数）。
これは，パラメータが
(k,n−k+1)(k,n-k+1)(k,n−k+1)
 であるベータ分布です。そこで，ベータ分布の期待値の公式を使うと「小さい方から
kkk
 番目」の期待値が
kn+1\dfrac{k}{n+1}n+1k​
になることが分かります。
参考：ベータ分布の意味と平均・分散の導出
一般論（確率密度関数の導出で項が打ち消し合うところ）も具体例（乱数の期待値が等間隔に並ぶところ）もきれいです。

この記事の監修者

マスオ

東京大学大学院情報理工学系研究科修了／2014年にWebサイト『高校数学の美しい物語』を立ち上げ／著書累計 50,000部突破／「わかりやすいこと」と「ごまかさないこと」の両立を意識している。 →著者情報・書籍一覧を見る