統計的仮説検定とは?帰無仮説・p値・有意水準をわかりやすく解説

統計的仮説検定、帰無仮説、p値、有意水準を初心者向けに図解でやさしく解説。実例と判断基準で確率の意味がすぐわかる入門ガイド。

著者: Leandro Alegsa

統計的仮説検定とは、統計学で用いられる手法の一つです。実験から得られる結果を説明するのに役立ちます。仮説検定は、ある特定の結果が偶然に起こる可能性を教えてくれます。

統計的仮説検定では、次のような質問に答えます。帰無仮説が真であると仮定して、実際に観測された値と少なくとも同じ極端な値を得る確率は何%か

つまり、例えば、その結果が偶然に起こる確率が5%であれば、実験仮説は95%の水準で支持されることになる。

基本の考え方

統計的仮説検定では、まず検証したい仮説を2つに分けて考えます。一般に

  • 帰無仮説(H0):差がない、効果がない、変化が無視できるといった「否定的」な仮説
  • 対立仮説(H1 または Ha):差がある、効果がある、変化があると主張する仮説

検定は「観測データが帰無仮説の下でどれくらいあり得るか」を確率(p値)で評価し、その確率が十分に小さければ帰無仮説を棄却します。

p値とは?

p値は「帰無仮説が正しいと仮定したときに、観測したデータと同じかそれ以上に極端なデータが得られる確率」です。小さいほど、観測結果は帰無仮説と矛盾しているとみなされます。

重要な点:

  • p値は「帰無仮説が正しい確率」や「観測結果が偶然起きた確率(単純な直感)」そのものではありません。帰無仮説が本当に正しいかどうかの確率を直接示すものではありません。
  • p値はデータと仮定(モデル)に依存します。異なるモデルや前提を使えばp値は変わります。

有意水準(α)と判断の基準

有意水準(α)は、帰無仮説を棄却するための閾値です。よく使われる値は0.05(5%)や0.01(1%)です。一般に

  • p値 < α のとき:帰無仮説を棄却(結果が「有意」)
  • p値 ≥ α のとき:帰無仮説を棄却できない(証拠不十分)

ただし「有意=重要」を意味しません。統計的有意性と実務上の重要性(効果の大きさ)は別に評価する必要があります。

検定の流れ(手順)

  1. 検証したい仮説(H0 と H1)を定める。
  2. 有意水準 α を決める(例:0.05)。
  3. 適切な検定方法を選ぶ(t検定、カイ二乗検定、ANOVA、回帰の係数検定など)。
  4. データを収集し、検定統計量を計算する。
  5. 検定統計量から p値を求め、p値と α を比較して結論を出す。
  6. 結論とともに効果量や信頼区間も報告する(推奨)。

簡単な例(コインの裏表)

公平なコイン(表の出る確率 p = 0.5)かどうかを調べるために100回投げて表が60回出たとします。帰無仮説 H0: p = 0.5、対立仮説 H1: p ≠ 0.5(両側検定)とします。

近似的に標準正規分布を使うと、期待値は50、標準偏差は sqrt(100×0.5×0.5)=5 です。観測値60のz値は (60−50)/5 = 2 となり、対応する両側のp値は約0.045です。これは α=0.05 より小さいので、帰無仮説を棄却し「コインは公平ではない」と判断できます(ただし効果の大きさは10%の偏りとなります)。

第I種・第II種誤りと検出力

  • 第I種誤り(α):帰無仮説が真であるのに誤って棄却する誤り(偽陽性)。有意水準で制御される。
  • 第II種誤り(β):帰無仮説が偽であるのに棄却できない誤り(偽陰性)。
  • 検出力(power) = 1 − β は、真に効果があるときにそれを検出できる確率。サンプルサイズ、効果量、α に依存する。

よくある誤解と注意点

  • p値が小さい=効果が大きい、とは限らない。大きなサンプルでは小さな差でも有意になり得る。
  • p値が大きい=帰無仮説が真である、とは言えない。単に証拠が不十分なだけかもしれない。
  • 複数比較を行うと偶然に有意となる確率が増えるため、補正(Bonferroniなど)が必要な場合がある。
  • 結果の報告には p値だけでなく、効果量(例えば平均差、オッズ比)や95%信頼区間を併記するのが望ましい。

まとめ

統計的仮説検定は、観測データが「偶然による変動」だけで説明できるかを客観的に評価する便利なツールです。しかし、p値・有意水準だけに頼らず、効果の大きさや実務上の意義、検定の前提条件やサンプルサイズなどを合わせて解釈することが重要です。



百科事典を検索する
AlegsaOnline.com - 2020 / 2025 - License CC3