多項分布の意味と平均,分散,共分散などの計算

更新日時 2021/03/07
多項分布の定義

同時確率関数が

P(n1,,nk)=n!n1!nk!p1n1pknkP(n_1,\cdots,n_k)=\dfrac{n!}{n_1!\cdots n_k!}p_1^{n_1}\cdots p_k^{n_k} (各 nin_i が非負で n1++nk=nn_1+\cdots +n_k=n のときはこの値,それ以外のときは 00

で表されるような分布を多項分布と言う。

ただし,n,p1,,pkn,p_1,\cdots,p_k はパラメータで,p1++pk=1p_1+\cdots +p_k=1 を満たす。

目次
  • 多項分布の意味

  • 多項分布の平均と分散

  • 多項分布の共分散

  • 積率母関数,特性関数

多項分布の意味

確率 pip_i で事象 AiA_i が起こる(i=1,,ki=1,\cdots, k )ような試行を nn 回行ったとき「どの事象が何回起こったか」を表す確率分布を多項分布と言います。

事象 A1A_1n1n_1 回起こり,\cdots ,事象 AkA_knkn_k 回起こる確率は確かに P(n1,,nk)P(n_1,\cdots,n_k) となっています。

n!n1!nk!\dfrac{n!}{n_1!\cdots n_k!} がどういう順番で事象が起こるかのパターンの数,p1n1pknkp_1^{n_1}\cdots p_k^{n_k} が順番を1つ固定したときにそのような順番で事象が起こる確率)

k=2k=2 の場合,二項分布になります(n2=nn1n_2=n-n_1p2=1p1p_2=1-p_1 となる)。→二項分布の平均と分散の二通りの証明

多項分布の平均と分散

多項分布の平均は,E[Ni]=npiE[N_i]=np_i

分散は,V[Ni]=npi(1pi)V[N_i]=np_i(1-p_i)

nin_i に対応する確率変数を NiN_i と書きました)

平均と分散については二項分布の場合の結果(詳細はさきほどのリンク先)がそのまま使えます。「 AiA_i が起こらない」という事象はひとまとめに扱うことができるからです。

証明

Ni=niN_i=n_i となる確率は,反復試行の確率の考え方より nCnipini(1pi)nni{}_n\mathrm{C}_{n_i}p_i^{n_i}(1-p_i)^{n-n_i} である。これは NiN_i が(パラメータ n,pin,p_i の)二項分布に従うことを示している。よって,二項分布の平均,分散と同じ形の式になる。

多項分布の共分散

多項分布の共分散は(iji\neq j に対して),Cov(Ni,Nj)=npipj\mathrm{Cov}(N_i,N_j)=-np_ip_j

共分散はマイナスです。これは NiN_i が大きいほど NjN_j が小さくなりやすいという感覚と合致しています。

証明には共分散を計算するときに役立つ公式:

Cov(Ni,Nj)=E[NiNj]E[Ni]E[Nj]\mathrm{Cov}(N_i,N_j)=E[N_iN_j]-E[N_i]E[N_j] →共分散の意味と簡単な求め方を使います。

証明

Ni=niN_i=n_i かつ Nj=njN_j=n_j となる確率は

n!ni!nj!(nninj)!pinipjnj(1pipj)nninj\dfrac{n!}{n_i!n_j!(n-n_i-n_j)!}p_i^{n_i}p_j^{n_j}(1-p_i-p_j)^{n-n_i-n_j}

であるので,

E[NiNj]=ninjn!pinipjnj(1pipj)nninjni!nj!(nninj)!=n(n1)pipj×(n2)!pini1pjnj1(1pipj)nninj(ni1)!(nj1)!(nninj)!E[N_iN_j]\\ =\sum n_in_j\dfrac{n!p_i^{n_i}p_j^{n_j}(1-p_i-p_j)^{n-n_i-n_j}}{n_i!n_j!(n-n_i-n_j)!}\\ =n(n-1)p_ip_j\\ \:\times\sum \dfrac{(n-2)!\cdot p_i^{n_i-1}p_j^{n_j-1}(1-p_i-p_j)^{n-n_i-n_j}}{(n_i-1)!(n_j-1)!(n-n_i-n_j)!}

ただし,途中のシグマについては,1n1n,1n2n1\leq n_1\leq n,1\leq n_2\leq n かつ n1+n2nn_1+n_2\leq n を満たす n1,n2n_1,n_2 について和を取る。ここで,多項定理を用いると上式は,

n(n1)pipj{pi+pj+(1pipj)}n2=n(n1)pipjn(n-1)p_ip_j\{p_i+p_j+(1-p_i-p_j)\}^{n-2}\\ =n(n-1)p_ip_j

となる。よって共分散は,

n(n1)pipjnpinpj=npipjn(n-1)p_ip_j-np_i\cdot np_j\\ =-np_ip_j

積率母関数,特性関数

おまけです。

多項分布の積率母関数(モーメント母関数)は,

E[et1N1++tkNk]=(p1et1++pketk)nE[e^{t_1N_1+\cdots +t_kN_k}]=(p_1e^{t_1}+\cdots +p_ke^{t_k})^n

多項分布の特性関数は,

E[eit1N1++itkNk]=(p1eit1++pkeitk)nE[e^{it_1N_1+\cdots +it_kN_k}]=(p_1e^{it_1}+\cdots +p_ke^{it_k})^n

積率母関数を使って共分散を簡単に計算することもできます(tit_i で偏微分して tjt_j で偏微分して tt の各成分に 00 を代入すると E[NiNj]=n(n1)pipjE[N_iN_j]=n(n-1)p_ip_j が分かる)!

多項定理が登場する場面では式の見た目が複雑になりがちですが,内容はそんなに難しくありません。

Tag:いろいろな確率分布の平均,分散,特性関数などまとめ