統計学的仮説検定の考え方と手順
とある仮説が正しいかどうかを統計学を使って判断する手法。
「仮説検定」と言わずに単純に「検定」ということも多いです。統計検定という資格と混同しないようにご注意下さい。
仮説検定の手順
対立仮説,棄却域,有意水準
仮説検定の結論
検定における誤り
仮説検定の手順
非常に大雑把ですが,まずは仮説検定の手順です。
1(設定):仮説 を立てる。
2(数学):「仮説 のもとで,統計量 が確率分布 に従う」となる を探す。
3(計算):実際にデータから計算した が の端っこにある場合, は正しくなさそうなので棄却。
は帰無仮説と呼ばれます。(多くの場合) 「間違いだ」と証明したい仮説を として持ってきます。背理法のノリです。
表が出る確率が であるコインを 回投げたときに表が 回出た。 (コインが公平である)かどうか検定せよ。
対立仮説,棄却域,有意水準
・対立仮説(証明できるかもしれない事柄):帰無仮説の反対側の仮説。上の例の場合対立仮説は「 」
・棄却域:「端っこ」のこと。
・有意水準:棄却域の広さを指定する値。 で表すことが多いです。
有意水準が小さい 棄却域が狭い
帰無仮説が棄却される可能性が低い
「安全」だが「何も言えない確率が高い」
第一種の誤り確率は低いが,第二種の誤り確率は高い(後述)
仮説検定の結論
仮説検定の結論は以下の二通りのいずれかとなります。
・成功(背理法で矛盾が示せた感じ)
帰無仮説を仮定していろいろ計算すると,統計量が棄却域に来てしまった→こんなに端っこに来るなんて考えにくい→帰無仮説は間違いだ!(帰無仮説を棄却,対立仮説を採択)
・失敗(背理法をやろうとしたけど矛盾は出てこなかった感じ)
帰無仮説を仮定していろいろ計算すると,統計量が真ん中付近にきた→「帰無仮説がおかしい」とはみなせない→ 帰無仮説が正しいかどうかは分からない。
※背理法をやろうとして
Aを仮定して議論をした結果,矛盾が導けたらAは間違いです。しかし,矛盾が導けないからと言って,Aが正しいとは限りません。
同様に,帰無仮説を仮定して,棄却域に入らないからと言って,帰無仮説が正しいとは限りません。
検定における誤り
・第一種の誤り:帰無仮説が正しいのに棄却してしまう誤り
例題の場合:コインが公平なのに「公平でない」と言ってしまう誤り
・第二種の誤り:帰無仮説が間違いなのに棄却できない誤り
例題の場合:コインが公平でないのに「公平かどうか分からない」と言ってしまう誤り
なお,有意水準 は第一種の誤りを犯してしまう確率です。
実用上は手順2(数学の部分)をブラックボックスとして使うことが多いですが,私は手順2の部分が好きです。