平均の標準誤差とは?定義・計算式・解釈をわかりやすく

平均の標準誤差を定義・計算式・具体例で図解。サンプル平均の信頼性評価や実務での使い方を初心者にもわかりやすく解説。

著者: Leandro Alegsa

標準誤差とは、ある統計量のサンプリング分布の標準偏差のことです。実務では、母集団全体のパラメータの不確かさを表す「推定値」として使われることが多く、特に母集団の平均をサンプルから推定するときの誤差の大きさを示します。以下では定義、計算式、解釈、実例、よくある誤解などをわかりやすく説明します。

定義と直感

グループ全体(母集団)の平均を知りたいとき、すべてを測るのは手間やコストがかかるため、グループの一部(サンプル)の平均を使って推定することが一般的です。しかし、異なるサンプルを取れば得られる平均値は毎回ばらつきます。平均値の標準誤差は、「もし同じ方法で何度もサンプルを取り続けたら、サンプル平均がどの程度ばらつくか」を数値で表したものです。これは、サンプル平均が母平均にどれだけ近いか(どれだけ確信できるか)を示す指標です。

計算式

母集団の標準偏差 σ が既知の場合、平均の標準誤差(SE: standard error)は次の式で与えられます。

SE = σ / √n

ここで n はサンプルサイズです。通常、母標準偏差は分からないため、サンプルから計算した標準偏差 s を使って近似します。

推定値としての SE ≈ s / √n

(s はサンプルの標準偏差)

標準誤差と標準偏差の違い

  • 標準偏差(SD):データ個々の観測値のばらつき。元の測定値の散らばりを示す。
  • 標準誤差(SE):サンプル統計量(例えば平均)のばらつき。サンプル平均が母平均の周りでどの程度散らばるかを示す。

簡単に言うと、SD は「観測値のばらつき」、SE は「推定値(平均)のばらつき」です。SE は n が大きくなると √n に反比例して小さくなります(サンプルサイズが増えるほど推定が安定するため)。

解釈と利用例(信頼区間の作成)

SE を使って母平均の信頼区間を作れます。母分布が正規分布に従うか、サンプルサイズが十分大きければ中心極限定理によりサンプル平均の分布はほぼ正規になります。例えば母標準偏差が不明でサンプル標準偏差 s を使う場合、信頼区間は通常次のように求めます(大きな n では z 値、小さな n では t 値を使用)。

95% 信頼区間(大きな n の場合) = 標本平均 ± 1.96 × SE

具体例:サンプルサイズ n = 25、サンプル標準偏差 s = 10、サンプル平均 x̄ = 50 のとき、SE = 10 / √25 = 2。95% 信頼区間は 50 ± 1.96×2 = (46.08, 53.92) となり、「母平均はこの区間に約95%の信頼度で含まれる」と解釈できます(ただし正確には「この方法で作られた区間の95%が母平均を含む」)。

注意点・よくある誤解

  • 標準誤差は観測値そのもののばらつきではなく、推定量(平均など)のばらつきである点を混同しやすいので注意。
  • 論文や報告で「±」の後に書かれている値が SD なのか SE なのかを明確に確認する必要があります。SE を示すと不確かさが小さく見えがちです。
  • 母標準偏差が不明でサンプルサイズが小さい場合は、信頼区間の計算で z ではなく t 分布を使うのが適切です(自由度 n−1)。
  • 標準誤差が小さいからといって効果が実務的に重要であるとは限りません。統計的有意性と実務上の有意性は別です。

まとめ

標準誤差はサンプルから推定した平均などの統計量がどれだけ安定しているか(母集団の真の値に近づくか)を表す重要な指標です。計算は SE = σ / √n(σ 不明の場合は s / √n)で、サンプルサイズが増えるほど小さくなります。信頼区間や仮説検定でよく使われますが、標準偏差との違いや母標準偏差不明時の取り扱い(t 分布の使用)などの注意点を理解して使うことが大切です。

偏りのない正規分布の誤差でサンプリングされた値に対して、実際の値の上下に0、1、2、3の標準偏差の間に入るサンプルの割合を示したものです。Zoom
偏りのない正規分布の誤差でサンプリングされた値に対して、実際の値の上下に0、1、2、3の標準偏差の間に入るサンプルの割合を示したものです。

平均値の標準誤差の求め方

平均の標準誤差を求める一つの方法は、たくさんのサンプルを用意することです。まず,各サンプルの平均値を求めます。次に,それらのサンプルの平均値と標準偏差を求めます。すべてのサンプルの平均値の標準偏差が、平均の標準誤差です。この作業は大変なものです。時には、たくさんのサンプルを用意するのが難しすぎたり、お金がかかりすぎたりすることもあります。

平均の標準誤差を求めるもう1つの方法は、1つのサンプルだけを必要とする方程式を使用することです。平均の標準誤差は,通常,グループ全体からのサンプルの標準偏差サンプル標準偏差)をサンプルサイズの平方根で割って推定される.

S E x ¯ = s n {displaystyle SE_{\bar {x}}\ ={\frac {s}{}sqrt {n}}}} {\displaystyle SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}}

どこで

sサンプル標準偏差(すなわち、母集団の標準偏差のサンプルベースの推定値)、そして

nはサンプル内の測定数。

平均の標準誤差の推定値がグループ全体の実際の平均の標準誤差に近くなるようにするには、サンプルはどのくらいの大きさが必要ですか?サンプルには少なくとも6つの測定値が必要です。そうすれば,サンプルの平均の標準誤差は,グループ全体を測定した場合の平均の標準誤差の5%以内になります。

いくつかのケースの修正

測定数がグループ全体の5%以上の場合には、別の計算式があります。

サンプルの測定回数が20回に満たない場合には、特別な計算式があります。

グループ全体では分散していても、サンプルは一箇所から集められることがあります。また、グループ全体では長い時間をカバーしているのに、サンプルは短い時間で作られることもあります。このような場合、サンプルの数字は独立ではありません。この場合、サンプルの数字は独立していないので、これを補正するために特別な方程式が使われます。

便利さ

現実的な結果です。サンプルの測定回数を増やすことで、平均値をより確かなものにすることができます。そうすれば、標準偏差をより大きな数で割ることができるので、平均値の標準誤差は小さくなります。しかし、平均値の不確かさ(平均の標準誤差)を半分にするには、サンプルサイズ(n)を4倍にする必要があります。これは、標準偏差がサンプルサイズの平方根で割られるからです。不確かさを10分の1にするには、サンプルサイズ(n)を100倍にする必要があります。

標準誤差は簡単に計算できるので、よく使われています。

  • いくつかの個別の量の標準誤差がわかっていれば、その量のある関数の標準誤差は多くの場合、簡単に計算できます。
  • 値の確率分布がわかっている場合は、それを利用して正確な信頼区間の近似値を算出することができます。
  • 確率分布がわからない場合は、他の式を使って信頼区間を推定することができます。
  • サンプルサイズが非常に大きくなると、中心極限定理の原理により、サンプルの数字はグループ全体の数字と非常によく似ている(正規分布をしている)ことがわかります。

相対標準誤差

相対標準誤差(RSE)とは、標準誤差を平均値で割ったものです。この数値は1よりも小さい。これに100%を掛けると、平均値に対するパーセンテージになります。これは、不確実性が重要であるかどうかを示すのに役立ちます。例えば、世帯収入に関する2つの調査で、どちらもサンプル平均が50,000ドルになるとします。一方の調査の標準誤差が10,000ドル、もう一方の調査の標準誤差が5,000ドルの場合、相対標準誤差はそれぞれ20%と10%となります。相対標準誤差が小さい方の調査は、より正確な測定を行っているため(不確実性が小さい)、優れていると言えます。

実際、平均値を知る必要がある人は、情報を使用する前に、不確実性をどの程度小さくするかを決めることが多い。例えば、米国のNational Center for Health Statisticsは、相対標準誤差が30%を超える場合、平均値を報告しません。また、NCHSは、推定値を報告するために、少なくとも30個の観測値を必要としています。 []

例えば、メキシコ湾にはたくさんのアカメが生息しています。体長42cmのアカメの平均的な重さを知るためには、体長42cmのアカメをすべて計測することはできません。その代わりに、一部のアカメを測ることができる。実際に測った魚をサンプルと呼びます。表には、体長42cmのアカメの2つのサンプルの重さが示されています。最初のサンプルの平均(平均)重量は0.741kgです。2つ目のサンプルの平均重量は0.735kgで、1つ目のサンプルとは少し違います。これらの平均値は、42cmのアカメをすべて測定した場合の平均値とは少し違います(いずれにしても不可能です)。

平均値の不確かさは、サンプルの平均値が、グループ全体を測定した場合の平均値にどれだけ近いかを知るために使用できます。平均値の不確かさは、サンプルの標準偏差をサンプル数の平方根で割って1を引いたものと推定されます。この表は、2つのサンプルの平均値の不確かさが互いに非常に近いことを示しています。また、相対不確かさとは、平均値の不確かさを平均値で割ったものに100%をかけたものです。この例では、2つのサンプルの相対不確かさは2.38%と2.50%です。

平均値の不確かさを知ることで、サンプルの平均値が、グループ全体を測定した場合の平均値にどれだけ近いかを知ることができます。グループ全体の平均値は、a)サンプルの平均値に平均値の不確かさを加えたものと、b)サンプルの平均値から平均値の不確かさを差し引いたものの間にあります。この例では、メキシコ湾に生息する全長42cmのアカメ全体の平均体重は、第1サンプルでは0.723〜0.759kg、第2サンプルでは0.717〜0.753kgとなることが予想されます。

Zoom


例題で使用したアカメ(別名:レッドドラム、Sciaenops ocellatus)の例。Zoom
例題で使用したアカメ(別名:レッドドラム、Sciaenops ocellatus)の例。

質問と回答

Q: 標準誤差とは何ですか?


A: 標準誤差は統計量の標本分布の標準偏差です。

Q: 標準誤差という用語は標準偏差の推定に使えますか?


A: はい,標準誤差という用語は,全集団の標本から得られた標準偏差の推定値(良い推測値)に使うことができます.

Q: グループ全体の平均はどのように推定するのですか?


A: 集団全体の平均を推定するには、集団の一部(標本と呼ばれる)の平均を用いるのが一般的です。

Q: なぜ集団全体を測定するのは難しいのですか?


A: 多くの場合、集団全体を測定することは困難であり、またコストがかかりすぎます。

Q: 平均の標準誤差とは何ですか?


A: 平均の標準誤差は、標本の平均が全体の平均にどれだけ近いかを知る方法です。標本から得られる平均について、どの程度確信が持てるかを知る方法です。

Q: 平均の標準偏差の真の値は、実際の測定で通常知られていますか?


A: いいえ、グループ全体の平均の標準偏差の真値は、実際の測定では通常わかりません。

Q: 標本の測定回数は推定精度にどのように影響しますか?


A: 標本の測定数が多ければ多いほど,推測値はグループ全体の真の数値に近くなります.


百科事典を検索する
AlegsaOnline.com - 2020 / 2025 - License CC3