母分散の意味と区間推定・検定の方法

母分散について,意味と区間推定・仮説検定の方法を整理しました。

まずは結論です。問題設定や数式の意味は後で説明します。

正規分布の母分散の区間推定・検定
  • 母平均 μ\mu既知の場合,
    1σ2i=1n(Xiμ)2\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\mu)^2 が自由度 nn のカイ二乗分布に従うことを使う。

  • 母平均が未知の場合,
    1σ2i=1n(XiX)2\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\overline{X})^2 が自由度 n1n-1 のカイ二乗分に従うことを使う。

母分散とは

  • 「観測対象全体の集合」を母集団と言います。母集団の平均を母平均と言い,母集団の分散を母分散と言います。 母分散とは

  • 母集団からの標本 (X1,X2,,Xn)(X_1,X_2,\cdots,X_n) を使って,母分散の情報を得る問題を考えます(母分散の区間推定・仮説検定)。

  • ただし,母集団は正規分布に従うものとします。

  • 母平均が既知の場合と未知の場合についてそれぞれ解説します。

母分散の区間推定

母平均が既知の場合

  • 仮定:母平均が μ\mu だとわかっている。母集団は正規分布に従う。

  • 目的:母分散 σ2\sigma^2 が分からないので,どのくらいなのか区間推定をしたい。

  • 方法:以下の定理1を使う。

定理1

X1,,XnX_1,\dots,X_n が独立に平均 μ\mu,分散 σ2\sigma^2 の正規分布に従うとき,
1σ2i=1n(Xiμ)2\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\mu)^2 は自由度 nn のカイ二乗分布に従う。

例題1

平均が μ\mu だと分かっている正規母集団から無作為に抽出した大きさ 3030 の標本について,μ\mu からの差の二乗和は 20.020.0 であった。

母分散 σ2\sigma^2 を信頼度 9090 %で区間推定せよ。

母分散を推定する例題

解答

統計量は,1σ2i=1n(Xiμ)2=20.0σ2\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\mu)^2=\dfrac{20.0}{\sigma^2}

自由度 3030 のカイ二乗分布の下側 55 %点は 18.4918.49,上側 55 %点は 43.7743.77 なので 9090 %信頼区間は,

18.4920.0σ243.7718.49\leq\dfrac{20.0}{\sigma^2}\leq 43.77

つまり 0.46σ21.080.46 \leq \sigma^2\leq 1.08

定理1の証明は,正規分布の標準化標準正規分布の二乗和がカイ二乗分布に従うことの証明 を理解していれば簡単です。

母平均が未知の場合

  • 仮定:母集団は正規分布に従うが,母平均はわからない、

  • 目的:母分散 σ2\sigma^2 が分からないので,どのくらいなのか区間推定をしたい。

  • 方法:以下の定理2を使う。

定理2

X1,,XnX_1,\dots,X_n が独立に平均 μ\mu,分散 σ2\sigma^2 の正規分布に従うとき,
1σ2i=1n(XiX)2\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\overline{X})^2 が自由度 n1n-1 のカイ二乗分布に従う。

ただし,X=X1+X2++Xnn\overline{X}=\dfrac{X_1+X_2+\dots+X_n}{n} は標本平均。

母平均が既知の場合とほとんど同じです。ただし,母平均 μ\mu のかわりに標本平均 X\overline{X} を使う点と,カイ二乗分布の自由度が n1n-1 である点が異なります。

定理2の証明は,不偏分散と自由度n-1のカイ二乗分布 に記載しています。

母分散の仮説検定

母平均が既知の場合

  • 仮定:母平均が μ\mu だとわかっている。母集団は正規分布に従う。

  • 目的:母分散 σ2\sigma^2σ02\sigma_0^2 という特定の値と等しいのかどうか仮説検定したい。

  • 方法:区間推定の場合と同じく,定理1を使う。

母平均が未知の場合

  • 仮定:母集団は正規分布に従うが,母平均はわからない、

  • 目的:母分散 σ2\sigma^2σ02\sigma_0^2 という特定の値と等しいのかどうか仮説検定したい。

  • 方法:区間推定の場合と同じく,定理2を使う。

例題2

正規母集団から無作為に抽出した大きさ 2020 の標本について,その偏差二乗和は 3535 であった。

母分散が 1.01.0 と異なるかどうか,有意水準 55 %で検定せよ。

解答

帰無仮説は σ2=1.0\sigma^2=1.0,対立仮説は σ21.0\sigma^2\neq 1.0 とし両側検定を行う。

統計量は(帰無仮説のもと),

1σ2i=1n(XiX)2=351.0=35\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\overline{X})^2=\dfrac{35}{1.0}=35

自由度 1919 のカイ二乗分布の下側 2.52.5 %点は 8.918.91 ,上側 2.52.5 %点は 32.8532.85 であり,32.85<3532.85 < 35 なので帰無仮説は棄却される。つまり母分散は 1.01.0 と異なると言える。

注:実際はデータから偏差二乗和を計算する部分も自分でやる必要があります。

母分散が未知で母平均が既知という状況はあまりない気がします。