標準偏差とは、あるグループの測定値が平均からどの程度ばらついているかを表す数値です。標準偏差が小さいと、ほとんどの数値が平均に近く、標準偏差が大きいと値が広く分散していることを意味します。単位は元のデータと同じで、分散(各値と平均の差の二乗の平均)の平方根として定義されます。

定義と種類

母標準偏差(population standard deviation)標本標準偏差(sample standard deviation)の二種類があります。

  • 母標準偏差(σ):データが母集団全体(全数)であるときに使います。式は σ = sqrt( (1/N) Σ (xi − μ)² ) です。
  • 標本標準偏差(s):母集団の一部(サンプル)しか測れないときに使います。分母に n−1 を使うことで母分散の不偏推定量とする補正(ベッセルの補正)を行います。式は s = sqrt( (1/(n−1)) Σ (xi − x̄)² ) です。

なぜ n−1 を使うのか(ベッセルの補正)

標本から母分散を推定する際、標本平均 x̄ を使うと分散の期待値が実際の母分散を過小評価する傾向があります。この偏りを補正するために分母を n−1 にして不偏推定量にします。小さな標本サイズほど影響が大きくなります。

計算の手順(簡単な例)

データ:2, 4, 4, 4, 5, 5, 7, 9

  1. 平均 x̄ = (2+4+4+4+5+5+7+9) / 8 = 5
  2. 各値と平均との差(偏差):−3, −1, −1, −1, 0, 0, 2, 4
  3. 偏差の二乗:9, 1, 1, 1, 0, 0, 4, 16 → 合計 = 32
  4. 母分散 = 32 / 8 = 4 → 母標準偏差 σ = sqrt(4) = 2
  5. 標本分散 = 32 / (8−1) ≈ 4.5714 → 標本標準偏差 s ≈ 2.138

解釈と実用例

  • 標準偏差が小さい:データが平均の周りに集中している。測定のばらつきが小さいことを示す。
  • 標準偏差が大きい:データが平均から遠く離れている値を含みやすい。ばらつきが大きい。
  • 正規分布(ガウス分布)の場合、経験則として約68%が±1σ、約95%が±2σ、約99.7%が±3σの範囲に入る(68-95-99.7ルール)。このため「報告される誤差は、通常、標準偏差の2倍です」といった表現は、正規分布を仮定したときに95%程度の範囲を示す便利な近似です。
  • 科学者は実験の平均値と標準偏差を報告し、平均値と比較して2〜3σ以上の差を統計的に重要とみなすことが多い(ただし厳密には検定やp値など別の判断が必要)。
  • 金融分野では標準偏差は「ボラティリティ(変動性)」の指標として使われます。例えば利子や投資リターンの標準偏差が大きいと、個々の人や資産の得る利子やリターンが平均から大きくずれることを意味します(お金の分野での応用)。

関連の指標と注意点

  • 標準誤差(standard error):平均の推定精度を表す指標で、標準誤差 = σ / sqrt(n)(標本の場合は s / sqrt(n))です。標準偏差とは別の意味を持ちます。
  • 変動係数(CV):平均に対する相対的なばらつきは CV = σ / μ で表します。平均が異なるデータセット同士を比較する際に便利です。
  • 標準偏差は外れ値に敏感です。データに外れ値が多い場合は四分位範囲(IQR)などのロバストな指標の併用を検討してください。
  • 分布が正規分布でないときは、±2σが95%を必ず保証するわけではありません。分布の形に応じた解釈が必要です。

まとめ

標準偏差はデータの散らばりを直感的に示す重要な統計量です。母集団全体を扱うときは σ(分母 N)、標本から母集団を推定するときは s(分母 n−1)を使います。実際の解析では、標準偏差だけでなく分布の形、外れ値の有無、標本サイズ、標準誤差なども併せて考えることが大切です(例として研究での報告や、科学者のデータ解析、サンプルからの推定、金融のボラティリティ評価などに広く使われます)。