二項分布の正規近似(ラプラスの定理)

二項分布の正規近似(ド・モアブル--ラプラスの定理)

二項分布 Bin(n,p)\mathrm{Bin}(n,p)nn が十分大きいとき,平均 npnp,分散 np(1p)np(1-p) の正規分布に近づく。

ド・モアブル-ラプラスの定理の嬉しさ,中心極限定理との関係など。

ド・モアブル-ラプラスの定理

XiX_i を確率 pp111p1-p00 を取る確率変数とします(XiX_i たちは互いに独立とする)。このとき,X=i=1nXiX=\displaystyle\sum_{i=1}^nX_i は二項分布 Bin(n,p)\mathrm{Bin}(n,p) に従います。→二項分布の平均と分散の二通りの証明

このように,二項分布は反復試行の成功回数を表現する重要な分布ですが,nn が大きいと扱いにくいので,(正規分布表なども用意されていて)扱いやすい正規分布で近似してやろうという話です。

標準化バージョン

冒頭の主張は正規分布の標準化を使うことにより,

XXBin(n,p)\mathrm{Bin}(n,p) に従うとき Xnpnp(1p)\dfrac{X-np}{\sqrt{np(1-p)}} は近似的に標準正規分布に従う。

と言うこともできます。

応用例

以上をふまえて,二項分布の正規近似の嬉しさを実感できる例題を解説します。

例題

公平なコインを10000回投げるとき,表が5100回以上出る確率を求めよ。

解答

二項分布から直接計算するのは厳しい。試行回数が多いので正規分布で近似できる。表が出た回数 XX は二項分布 Bin(10000,12)\mathrm{Bin}(10000,\frac{1}{2}) に従う。

よって,Y=X1000012100001212=X500050Y=\dfrac{X-10000\cdot\frac{1}{2}}{\sqrt{10000\cdot \frac{1}{2}\frac{1}{2}}}=\dfrac{X-5000}{50} は近似的に標準正規分布に従う。

求める確率は,P(X5100)=P(Y2)P(X \geq 5100)=P(Y\geq 2) であり,これは標準正規分布表より,約 2.282.28 %と分かる。2シグマ区間の半分です。

注:二項分布の正規近似は仮説検定にも使うことができます。→統計学的仮説検定の考え方と手順

中心極限定理との関係

二項分布の正規近似は中心極限定理の特殊ケースになっています。中心極限定理を認めれば,ド・モアブル–ラプラスの定理はすぐに証明できます。

(中心極限定理については→大数の法則と中心極限定理の意味と関係

証明

XiX_i の平均は pp ,分散は p(1p)p(1-p) である。

よって,中心極限定理により,nn が十分大きいとき Xnp\dfrac{X}{n}-p の従う分布は平均 00 ,分散 p(1p)n\dfrac{p(1-p)}{n} の正規分布に近づく。

これは,Xnpnp(1p)\dfrac{X-np}{\sqrt{np(1-p)}} が近似的に標準正規分布に従うことを表している。

注:中心極限定理の証明は難しいですが,その特殊ケースであるド・モアブル–ラプラスの定理については,スターリングの公式を用いた式変形で証明できます(それでもけっこう大変ですが)。de Moivre–Laplace theorem(英語版Wikipedia)

最近統計の記事が多いことに関して,賛否両論ありますが,需要がある&書いていて楽しいのでこれからも続けていきます。

Tag:正規分布の基礎的な知識まとめ