正規分布の標準化の意味と証明

更新日時 2021/03/07
定理1(正規分布の一次式の分布)

XX が正規分布に従うとき,aX+baX+b も正規分布に従う。

(ただし a,ba,b は任意の実数で a0a\neq 0

定理の証明は最後で紹介します。

この定理の応用として,正規分布の標準化について解説します。

なお,正規分布についての簡単な知識は正規分布の基礎的なことをどうぞ。

目次
  • 平均と分散

  • 正規分布の標準化

  • 正規分布の標準化の嬉しさ

  • 定理2の証明

平均と分散

XX が平均 μ\mu,分散 σ2\sigma^2 の正規分布に従うとき,XN(μ,σ2)X \sim N(\mu,\sigma^2) と書くことにします。

E[aX+b]=aE[X]+b,V[aX+b]=a2V[X]E[aX+b]=aE[X]+b,\:V[aX+b]=a^2V[X] であることに注意すると,定理1は以下のように強めることができます:

定理2

XN(μ,σ2)X\sim N(\mu,\sigma^2) ならば aX+bN(aμ+b,a2σ2)aX+b\sim N(a\mu+b,a^2\sigma^2)

このように定理2は定理1からすぐに導けるので,定理1だけ覚えておけばOKです。

正規分布の標準化

正規分布の中でも平均が0,分散が1であるものを標準正規分布と言います。

正規分布に従う確率変数 XX に対して,aX+baX+b が標準正規分布に従うように a,ba,b を定めることができます。

定理3(標準化)

XN(μ,σ2)X\sim N(\mu,\sigma^2) ならば XμσN(0,1)\dfrac{X-\mu}{\sigma}\sim N(0,1)

つまり,正規分布に従う確率変数は適切に定数倍&平行移動することで標準正規分布に従う確率変数を作れる。

定理2において a=1σ,b=μσa=\dfrac{1}{\sigma},b=-\dfrac{\mu}{\sigma} としただけですが,定理3はよく使うので覚えておいてもよいでしょう。

正規分布の標準化の嬉しさ

XX が正規分布に従うとき,標準化&標準正規分布表を用いることで P(aXb)P(a\leq X\leq b) を求めることができます!

XX が平均 11,分散 99 の正規分布に従うとき,XX44 以上 1010 以下となる確率を求めよ。ただし,標準正規分布表は与えられているとする。

解答

XN(1,9)X\sim N(1,9) より,定理3を使うと X13N(0,1)\dfrac{X-1}{3}\sim N(0,1)

また,4X10    1X1334\leq X\leq 10\iff 1\leq \dfrac{X-1}{3}\leq 3

なので,求める確率は P(1X133)P(1\leq \dfrac{X-1}{3}\leq 3)

これは標準正規分布表を使って求めることができる!

実際求めると 0.1570.157 くらいになる。

正規分布は「(平行移動,定数倍で一致するのは同じものとみなすと)1種類しかない」ので全ての正規分布に対して表を用意しておかなくても標準正規分布表だけ用意しておけばどんな正規分布に対しても使えるというわけです。

定理2の証明

定理2を二通りの方法で証明します(定理2は定理1よりも強いので定理1の証明も含んでいます)。

証明1:確率密度関数を用いる素直な方法(確率密度関数の変数変換が必要)

証明

XN(μ,σ2)X\sim N(\mu,\sigma^2) のとき,確率密度関数は

f(x)=12πσexp{(xμ)22σ2}f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp \left\{-\dfrac{(x-\mu)^2}{2\sigma^2}\right\}

目標は,Y=aX+bY=aX+b の従う確率密度関数 g(y)g(y) を求めること。

そこで,y=ax+by=ax+b と変数変換すると,g(y)=f(x)dxdyg(y)=f(x)\dfrac{dx}{dy} なので

g(y)=12πσexp[((yba)μ)22σ2]1a=12πaσexp[((y(aμ+b))22(aσ)2]g(y)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp \left[-\dfrac{((\frac{y-b}{a})-\mu)^2}{2\sigma^2}\right]\cdot\dfrac{1}{a}\\ =\dfrac{1}{\sqrt{2\pi}a\sigma}\exp \left[-\dfrac{((y-(a\mu+b))^2}{2(a\sigma)^2}\right]

これは平均 aμ+ba\mu+b ,分散 a2σ2a^2\sigma^2 の正規分布の確率密度関数である。

証明2:特性関数を用いる方法(前提知識として正規分布の特性関数が必要)

証明

XX の特性関数は,

よって,aX+baX+b の特性関数は,

ϕaX+b(t)=E[eitaXeitb]=eitbE[eitaX]=eitbϕX(ta)=exp[itb+iμtaσ2t2a22]\phi_{aX+b}(t)=E[e^{itaX}e^{itb}]\\ =e^{itb}E[e^{itaX}]\\ =e^{itb}\phi_X(ta)\\ =\exp\left[itb+i\mu ta -\dfrac{\sigma^2t^2a^2}{2}\right]

これは,平均 aμ+ba\mu+b ,分散 a2σ2a^2\sigma^2 の正規分布の特性関数である。

私は特性関数を使った証明が好きです。

Tag:正規分布の基礎的な知識まとめ