負の二項分布の意味と期待値、分散

負の二項分布の意味

確率 pp で成功するような試行を繰り返すとき,kk 回成功するまでにかかる回数が従う分布は負の二項分布。

負の二項分布の意味・確率関数・期待値・分散について整理しました。

負の二項分布の意味と確率関数

  • 確率 pp で成功するような試行を繰り返すことを考えます。例えば,サイコロで「66 なら成功,55 以下なら失敗」という試行では p=16p=\dfrac{1}{6} です。
  • kk 回成功するまでにかかる回数を考えます。

p=16p=\dfrac{1}{6} の場合で自分が 33 回勝つまでにかかる試行回数が NN になる確率を計算しよう。ただし,N3N\geq 3 とする。

(N1)(N-1) 回のうち 22 回勝って,NN 回目で勝つ確率なので,求める確率は反復試行の確率の公式を使うと,

N1C2(16)2(56)N3×16{}_{N-1}\mathrm{C}_{2}\left(\dfrac{1}{6}\right)^2\left(\dfrac{5}{6}\right)^{N-3}\times\dfrac{1}{6} となる。

同様に考えると,確率 pp で成功するような試行を繰り返すとき,kk 回成功するまでに NN 回かかる確率は P(N)=N1Ck1pk(1p)NkP(N)={}_{N-1}\mathrm{C}_{k-1}p^{k}(1-p)^{N-k} となります。

つまり,負の二項分布の確率関数は以下のようになります。

負の二項分布の確率関数

P(N)=N1Ck1pk(1p)NkP(N)={}_{N-1}\mathrm{C}_{k-1}p^{k}(1-p)^{N-k}NkN\geq k

ただし,p,kp,k はパラメータです。 pp0p10\leq p\leq 1 を満たす実数,kk は整数です。

注:「kk 回成功するまでに何回失敗したか」が従う分布を負の二項分布と言うこともあります(むしろその方が一般的かもしれません)。その場合カウントが kk ずれるので注意して下さい。

他の分布との関係

  • 二項分布との関係:
    負の二項分布は(普通の)二項分布と状況が似ていますが,以下の違いがあります:

    • 二項分布 → 試行回数を固定,成功回数が確率変数
    • 負の二項分布 → 成功回数を固定,試行回数が確率変数
  • ガンマ分布との関係:
    負の二項分布の連続バージョンがガンマ分布です。 →ガンマ分布の意味と期待値,分散 負の二項分布

  • 幾何分布との関係:
    負の二項分布で k=1k=1 としたものが幾何分布です。幾何分布は初めて成功するまでの回数が従う分布です。→幾何分布の具体例と期待値,無記憶性について
    kk 回成功するまでにかかる回数」=「1回成功するまでにかかる回数」+「そこからもう1回成功するまでにかかる回数」+\cdots
    のように「11 回成功するまでにかかる回数」kk 個に分解できるので,以下が成立します。

負の二項分布と幾何分布の関係

X1,X2,,XkX_1,X_2,\cdots,X_k が独立に(パラメータ pp の)幾何分布に従うとき Y=X1+X2++XkY=X_1+X_2+\cdots +X_k は(パラメータ ppkk の)負の二項分布に従う。

負の二項分布の期待値

負の二項分布の期待値は kp\dfrac{k}{p}

※「kk 回成功するまでに何回失敗したか」の分布を負の二項分布と呼ぶ場合,期待値は kpk=k(1p)p\dfrac{k}{p}-k=\dfrac{k(1-p)}{p} になります。

証明は直接計算してもよいですが,ここでは幾何分布を利用してみます。

期待値の導出

上記の「負の二項分布と幾何分布の関係」より,負の二項分布の期待値は,

E[Y]=E[X1+X2++Xk]=E[X1]+E[X2]++E[Xk]=1p++1p=kpE[Y]\\ =E[X_1+X_2+\cdots +X_k]\\ =E[X_1]+E[X_2]+\cdots +E[X_k]\\ =\dfrac{1}{p}+\cdots +\dfrac{1}{p}\\ =\dfrac{k}{p}

ただし,2つめの等号は和の期待値は期待値の和【期待値の線形性】を使いました。3つめの等号は幾何分布の期待値が 1p\dfrac{1}{p} であることを使いました。

負の二項分布の分散

負の二項分布の分散は k(1p)p2\dfrac{k(1-p)}{p^2}

分散の導出

期待値と同様に,負の二項分布の分散は,

V[Y]=V[X1+X2++Xk]=V[X1]+V[X2]++V[Xk]=k(1p)p2V[Y]\\ =V[X_1+X_2+\cdots +X_k]\\ =V[X_1]+V[X_2]+\cdots +V[X_k]\\ =\dfrac{k(1-p)}{p^2}

ただし,2つめの等号では,X1,X2,,XkX_1,X_2,\cdots,X_k が独立なので和の分散が分散の和になることを用いました。3つめの等号は幾何分布の分散が 1pp2\dfrac{1-p}{p^2} であることを使いました。

記事にしたい確率分布はまだいくつかあります!

Tag:いろいろな確率分布の平均,分散,特性関数などまとめ