標準誤差

標準誤差とは、ある統計量のサンプリング分布の標準偏差のこと。この言葉は、全グループのサンプルから得られた標準偏差の推定値(良い推測)にも使われることがある。

グループ全体の平均値を推定するには、グループの一部(サンプルと呼ばれる)の平均値を用いるのが一般的です。グループ全体を測定するのは大変だったり、お金がかかったりします。しかし、別のサンプルを測定すれば、最初のサンプルとは少し異なる平均値が得られます。平均値の標準誤差は、サンプルの平均値がグループ全体の平均値にどれだけ近いかを知る方法です。これは、サンプルから得られる平均値についてどれだけ確信が持てるかを知る方法です。

実際の測定では、グループ全体の平均の標準偏差の真の値は通常わかりません。そのため、標準誤差という言葉は、グループ全体の真の数値に近い推測という意味で使われることが多い。サンプルに含まれる測定値が多ければ多いほど、推測はグループ全体の真の数値に近づきます。

偏りのない正規分布の誤差でサンプリングされた値に対して、実際の値の上下に0、1、2、3の標準偏差の間に入るサンプルの割合を示したものです。Zoom
偏りのない正規分布の誤差でサンプリングされた値に対して、実際の値の上下に0、1、2、3の標準偏差の間に入るサンプルの割合を示したものです。

平均値の標準誤差の求め方

平均の標準誤差を求める一つの方法は、たくさんのサンプルを用意することです。まず,各サンプルの平均値を求めます。次に,それらのサンプルの平均値と標準偏差を求めます。すべてのサンプルの平均値の標準偏差が、平均の標準誤差です。この作業は大変なものです。時には、たくさんのサンプルを用意するのが難しすぎたり、お金がかかりすぎたりすることもあります。

平均の標準誤差を求めるもう1つの方法は、1つのサンプルだけを必要とする方程式を使用することです。平均の標準誤差は,通常,グループ全体からのサンプルの標準偏差サンプル標準偏差)をサンプルサイズの平方根で割って推定される.

S E x ¯ = s n {displaystyle SE_{\bar {x}}\ ={\frac {s}{}sqrt {n}}}} {\displaystyle SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}}

どこで

sサンプル標準偏差(すなわち、母集団の標準偏差のサンプルベースの推定値)、そして

nはサンプル内の測定数。

平均の標準誤差の推定値がグループ全体の実際の平均の標準誤差に近くなるようにするには、サンプルはどのくらいの大きさが必要ですか?サンプルには少なくとも6つの測定値が必要です。そうすれば,サンプルの平均の標準誤差は,グループ全体を測定した場合の平均の標準誤差の5%以内になります。

いくつかのケースの修正

測定数がグループ全体の5%以上の場合には、別の計算式があります。

サンプルの測定回数が20回に満たない場合には、特別な計算式があります。

グループ全体では分散していても、サンプルは一箇所から集められることがあります。また、グループ全体では長い時間をカバーしているのに、サンプルは短い時間で作られることもあります。このような場合、サンプルの数字は独立ではありません。この場合、サンプルの数字は独立していないので、これを補正するために特別な方程式が使われます。

便利さ

現実的な結果です。サンプルの測定回数を増やすことで、平均値をより確かなものにすることができます。そうすれば、標準偏差をより大きな数で割ることができるので、平均値の標準誤差は小さくなります。しかし、平均値の不確かさ(平均の標準誤差)を半分にするには、サンプルサイズ(n)を4倍にする必要があります。これは、標準偏差がサンプルサイズの平方根で割られるからです。不確かさを10分の1にするには、サンプルサイズ(n)を100倍にする必要があります。

標準誤差は簡単に計算できるので、よく使われています。

  • いくつかの個別の量の標準誤差がわかっていれば、その量のある関数の標準誤差は多くの場合、簡単に計算できます。
  • 値の確率分布がわかっている場合は、それを利用して正確な信頼区間の近似値を算出することができます。
  • 確率分布がわからない場合は、他の式を使って信頼区間を推定することができます。
  • サンプルサイズが非常に大きくなると、中心極限定理の原理により、サンプルの数字はグループ全体の数字と非常によく似ている(正規分布をしている)ことがわかります。

相対標準誤差

相対標準誤差(RSE)とは、標準誤差を平均値で割ったものです。この数値は1よりも小さい。これに100%を掛けると、平均値に対するパーセンテージになります。これは、不確実性が重要であるかどうかを示すのに役立ちます。例えば、世帯収入に関する2つの調査で、どちらもサンプル平均が50,000ドルになるとします。一方の調査の標準誤差が10,000ドル、もう一方の調査の標準誤差が5,000ドルの場合、相対標準誤差はそれぞれ20%と10%となります。相対標準誤差が小さい方の調査は、より正確な測定を行っているため(不確実性が小さい)、優れていると言えます。

実際、平均値を知る必要がある人は、情報を使用する前に、不確実性をどの程度小さくするかを決めることが多い。例えば、米国のNational Center for Health Statisticsは、相対標準誤差が30%を超える場合、平均値を報告しません。また、NCHSは、推定値を報告するために、少なくとも30個の観測値を必要としています。 []

例えば、メキシコ湾にはたくさんのアカメが生息しています。体長42cmのアカメの平均的な重さを知るためには、体長42cmのアカメをすべて計測することはできません。その代わりに、一部のアカメを測ることができる。実際に測った魚をサンプルと呼びます。表には、体長42cmのアカメの2つのサンプルの重さが示されています。最初のサンプルの平均(平均)重量は0.741kgです。2つ目のサンプルの平均重量は0.735kgで、1つ目のサンプルとは少し違います。これらの平均値は、42cmのアカメをすべて測定した場合の平均値とは少し違います(いずれにしても不可能です)。

平均値の不確かさは、サンプルの平均値が、グループ全体を測定した場合の平均値にどれだけ近いかを知るために使用できます。平均値の不確かさは、サンプルの標準偏差をサンプル数の平方根で割って1を引いたものと推定されます。この表は、2つのサンプルの平均値の不確かさが互いに非常に近いことを示しています。また、相対不確かさとは、平均値の不確かさを平均値で割ったものに100%をかけたものです。この例では、2つのサンプルの相対不確かさは2.38%と2.50%です。

平均値の不確かさを知ることで、サンプルの平均値が、グループ全体を測定した場合の平均値にどれだけ近いかを知ることができます。グループ全体の平均値は、a)サンプルの平均値に平均値の不確かさを加えたものと、b)サンプルの平均値から平均値の不確かさを差し引いたものの間にあります。この例では、メキシコ湾に生息する全長42cmのアカメ全体の平均体重は、第1サンプルでは0.723〜0.759kg、第2サンプルでは0.717〜0.753kgとなることが予想されます。

Zoom


例題で使用したアカメ(別名:レッドドラム、Sciaenops ocellatus)の例。Zoom
例題で使用したアカメ(別名:レッドドラム、Sciaenops ocellatus)の例。

質問と回答

Q: 標準誤差とは何ですか?


A: 標準誤差は統計量の標本分布の標準偏差です。

Q: 標準誤差という用語は標準偏差の推定に使えますか?


A: はい,標準誤差という用語は,全集団の標本から得られた標準偏差の推定値(良い推測値)に使うことができます.

Q: グループ全体の平均はどのように推定するのですか?


A: 集団全体の平均を推定するには、集団の一部(標本と呼ばれる)の平均を用いるのが一般的です。

Q: なぜ集団全体を測定するのは難しいのですか?


A: 多くの場合、集団全体を測定することは困難であり、またコストがかかりすぎます。

Q: 平均の標準誤差とは何ですか?


A: 平均の標準誤差は、標本の平均が全体の平均にどれだけ近いかを知る方法です。標本から得られる平均について、どの程度確信が持てるかを知る方法です。

Q: 平均の標準偏差の真の値は、実際の測定で通常知られていますか?


A: いいえ、グループ全体の平均の標準偏差の真値は、実際の測定では通常わかりません。

Q: 標本の測定回数は推定精度にどのように影響しますか?


A: 標本の測定数が多ければ多いほど,推測値はグループ全体の真の数値に近くなります.

AlegsaOnline.com - 2020 / 2023 - License CC3