p値の意味と具体例

p値とは,(帰無仮説のもとで)実現したデータ以上に極端な値を取る確率のこと。

pic01

p値の意味を具体例を使いながら説明します。

p値(p-value)とは

  • p値(p-value,有意確率)は統計学的仮説検定における重要な概念です。
  • 帰無仮説のもとで,実現したデータ以上に「極端」になる確率をp値と言います。
例題1

コインを100回投げたときに表が63回出た。このコインが公平(表が出る確率が 12\dfrac{1}{2})かとうか検定するときのp値は?

解答

表が出る確率が 12\dfrac{1}{2} という仮説のもとで実現したデータ以上に「極端」になる確率を計算する。つまり,表が63回以上出る確率を計算すると,0.004610.00461(0.461%)になる。

※確率の具体的な計算方法は統計学的仮説検定の考え方と手順)の「具体的な計算方法」で紹介しています。

なお,今回は片側検定で考えましたが,「極端」の意味は片側検定か両側検定かで変わります。

p値と有意水準

p値と有意水準の定義より,

  • p値 << 有意水準 \to 帰無仮説を棄却
  • p値 >> 有意水準 \to 帰無仮説は棄却できない

となります。

  • p値が小さい
    \to データ以上に極端になる確率は低い
    \to 帰無仮説が正しいとするとかなり極端なデータになっている
    \to 帰無仮説は間違っていそう(棄却)

  • p値が大きい
    \to データ以上に極端になる確率は高い
    \to 帰無仮説が正しいとしてもそんなに極端なデータにはなっていない
    \to 帰無仮説は間違っているとは言えない(帰無仮説が正しいかどうかはわからない)

カイ二乗分布,片側検定の例

例題2

正規母集団から無作為に抽出した大きさ 2020 の標本について,その偏差二乗和は 3535 であった。

母分散が 1.01.0 より小さいかどうか検定したい。p値を求めよ。

解答

帰無仮説は σ2=1.0\sigma^2=1.0,対立仮説は σ2<1.0\sigma^2 < 1.0 とし片側検定を行う。

統計量は(帰無仮説のもと),1σ2i=1n(XiX)2=351.0=35\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\overline{X})^2=\dfrac{35}{1.0}=35 であり,これが自由度 201=1920-1=19 のカイ二乗分布に従う(→不偏分散と自由度n-1のカイ二乗分布

よって求めるp値は,自由度 1919 のカイ二乗分布に従う確率変数 TT3535 よりも「極端」(=この場合対立仮説が σ2<1.0\sigma^2 < 1.0 なので「大きい」)な値を取る確率である。実際に計算すると, p値 0.0140\fallingdotseq 0.0140 となる。

つまり,有意水準 55 %なら帰無仮説は棄却され,有意水準 11 %だと棄却できません。

統計ではカイ二乗分布の他にも正規分布(詳しくは 正規分布の基礎的な知識まとめ をご覧ください),ポアソン分布(詳しくは ポアソン分布の意味と平均・分散 をご覧ください)など,さまざまな分布が登場します。いろいろな仮説検定で,p値のことを考えてみるとよいです。

p値姫というワードを見たことがあります。

確率・統計分野の記事一覧