p値の意味と具体例
p値とは,(帰無仮説のもとで)実現したデータ以上に極端な値を取る確率のこと。
p値の意味を具体例を使いながら説明します。
p値(p-value)とは
p値(p-value)とは
- p値(p-value,有意確率)は統計学的仮説検定における重要な概念です。
- 帰無仮説のもとで,実現したデータ以上に「極端」になる確率をp値と言います。
コインを100回投げたときに表が63回出た。このコインが公平(表が出る確率が )かとうか検定するときのp値は?
表が出る確率が という仮説のもとで実現したデータ以上に「極端」になる確率を計算する。つまり,表が63回以上出る確率を計算すると,(0.461%)になる。
※確率の具体的な計算方法は統計学的仮説検定の考え方と手順)の「具体的な計算方法」で紹介しています。
なお,今回は片側検定で考えましたが,「極端」の意味は片側検定か両側検定かで変わります。
p値と有意水準
p値と有意水準
p値と有意水準の定義より,
- p値 有意水準 帰無仮説を棄却
- p値 有意水準 帰無仮説は棄却できない
となります。
-
p値が小さい
データ以上に極端になる確率は低い
帰無仮説が正しいとするとかなり極端なデータになっている
帰無仮説は間違っていそう(棄却) -
p値が大きい
データ以上に極端になる確率は高い
帰無仮説が正しいとしてもそんなに極端なデータにはなっていない
帰無仮説は間違っているとは言えない(帰無仮説が正しいかどうかはわからない)
カイ二乗分布,片側検定の例
カイ二乗分布,片側検定の例
正規母集団から無作為に抽出した大きさ の標本について,その偏差二乗和は であった。
母分散が より小さいかどうか検定したい。p値を求めよ。
帰無仮説は ,対立仮説は とし片側検定を行う。
統計量は(帰無仮説のもと), であり,これが自由度 のカイ二乗分布に従う(→不偏分散と自由度n-1のカイ二乗分布)
よって求めるp値は,自由度 のカイ二乗分布に従う確率変数 が よりも「極端」(=この場合対立仮説が なので「大きい」)な値を取る確率である。実際に計算すると, p値 となる。
つまり,有意水準 %なら帰無仮説は棄却され,有意水準 %だと棄却できません。
統計ではカイ二乗分布の他にも正規分布(詳しくは 正規分布の基礎的な知識まとめ をご覧ください),ポアソン分布(詳しくは ポアソン分布の意味と平均・分散 をご覧ください)など,さまざまな分布が登場します。いろいろな仮説検定で,p値のことを考えてみるとよいです。
p値姫というワードを見たことがあります。