信頼区間

統計学における信頼区間とは,あるパラメータを推定するための特別な方法である.この方法では,パラメータの1つの値の代わりに,パラメータの許容値の全区間が与えられ,パラメータの実際の値(未知の値)が区間内にある可能性も示される.信頼区間はサンプルからの観測値に基づいているため、サンプルごとに異なります。パラメータが区間内に入る可能性を信頼度といいます。多くの場合,これはパーセンテージで示される.信頼区間は常に信頼度と一緒に示されます。人々は「95%信頼区間」について話すことがある。信頼区間の終点は信頼限界と呼ばれる。与えられた状況で与えられた推定手順では、信頼レベルが高いほど、信頼区間は広くなります。

信頼区間の計算には,一般に推定プロセスの性質に関する仮定が必要であり,これは主にパラメトリックな手法である.一般的な仮定の1つは、サンプルの元となった母集団の分布が正規分布であることです。そのため、後述する信頼区間は頑健な統計ではありませんが、頑健性を高めるために変更を加えることは可能です。

"自信 "という言葉の意味

自信という言葉は、統計学においても一般的に使われているような同様の意味を持っています。一般的な使用法では、何かに対する95%の信頼性の主張は、通常、事実上の確実性を示しているとみなされます。統計学では、95%信頼度の主張は、単に研究者が多数の可能な区間の中から1つの可能な区間を見たことを意味し、20の区間のうち19の区間がパラメータの真の値を含んでいることを意味する。

実用例

A factory assembly line fills margarine cups to a desired 250g +/- 5g

カップにマーガリンを充填する機械があります。この例では、カップの中身が250gのマーガリンになるように機械を調整します。機械はすべてのカップに正確に250gのマーガリンを充填することはできないので、個々のカップに加えられる内容物はある程度のばらつきがあり、これを確率変数Xとします。機械が適切に校正されているかどうかを判断するために、n = 25カップのマーガリンのサンプルを無作為に選び、カップの重量を測定します。マーガリンの重さは X1, ..., X25 であり,これは X からの無作為なサンプルである.

期待値μの印象を得るためには、推定値を与えることで十分です。適切な推定値は標本平均です。

μ ^ = X ¯ = n1 ∑ i = n1 X i .{本来ならば、このようにして得られた結果を、さらに発展させていくことができる。} {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}

サンプルでは、平均値を持つ実際のウェイトx1, ...,xが示されて25います。

x125 ¯ = ∑ i = x 125i = 250.2grams .{グラム数を示す。} {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.}

さらに25個のカップをサンプルとして採取した場合、250.4gや251.1gといった値が容易に予想されます。しかし、カップの平均含有量が実際に250gに近いのであれば、サンプル平均値が280gになることは極めて稀です。観察されたサンプル平均値250.2の周囲には、全体の母平均が実際にこの範囲内の値を取る場合、観察されたデータが特に異常であるとは考えられないような区間があります。このような区間は,パラメータμの信頼区間と呼ばれます。区間の端点はサンプルから計算されなければならないので、それらは統計であり、サンプルX1, ..., Xの関数で25あり、したがって確率変数そのものです。

今回のケースでは、正規分布するサンプルからのサンプル平均Xも正規分布し、期待値μは同じだが、標準誤差σ/√n=0.5(グラム)であると考えることで、終点を決めることができます。標準化することで、確率変数

Z = X ¯ - μ σ / n = X ¯ - μ {\0.5displaystyle Z={\frac {{bar {X}}-mu }{\sigma /{\sqrt {n}}}}={\frac {{bar {X}}-\mu }{0.5}}}}。 {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}

したがって、μに依存しない数-zzを見つけることができ、Zはその間に1-αの確率で位置します。ここでは、1 - α = 0.95 とします。つまり、次のようになります。

P ( - z ≤ Z ≤ z ) = -1 α 0.95= . {\displaystyle P(-z\leq Z\leq z)=1-alpha =0.95.\, }. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}

zは累積分布関数に従う。

Φ ( z ) = P ( Z ≤ z 1) = - α = , 20.975z = Φ - (1 Φ ( z ) ) = Φ - ( ) = , {10.9751.96˶‾᷄ -̫ ‾᷅˵}\Phi (z)&=P(Z\leq z)=1-{tfrac {\alpha }{2}}=0.975,\\^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,end{aligned}}。 {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}

と出てきます。

0.951= - α = P ( - z ≤ Z ≤ z ) = P 1.96( - ≤ X ¯ - μ σ / n ≤ ) =1.96 P ( X ¯ - 1.96σ n ≤ μ ≤ X ¯ + σ1.96 n ) = P ( X ¯ -1.96 × ≤ 0.5μ ≤ X ¯ + ×1.96 ) =0.5 P ( X ¯ - ≤0.98 μ ≤ X0.98 ¯ + ) .{aligning}0.95&=1-\\ =P(-z˶ˆ꒳ˆ˵ ) =P\left(-1.96˶ˆ꒳ˆ˵ ) }\frac {{bar {X}}-mu }{˶ˆ꒳ˆ˵ }{sigma /{sqrt {n}}}}˶ˆ꒳ˆ˵ )96right)♪\\=P\left({{bar {X}}-1.96{\sqrt {n}}\\\=P\=P\=P\=Please)96{frac {\\}}\\\\\\\\\\\\\\\\\\\\\\∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮96times 0.5\\\\\\\\\\\\\\\\\\\\\\\\\\\\⁾⁾。 {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}

これは次のように解釈できます:確率0.95で、確率的な終点の間にパラメータμを満たす信頼区間を見つけることができる。

X0 ¯ - . 98 {X}}-0{.}98%%}。 {\displaystyle {\bar {X}}-0{.}98\,}

そして

X0.98¯ + ... {displaystyle {bar {X}}+0.98.\\, }. {\displaystyle {\bar {X}}+0.98.\,}

これは、計算された区間でパラメータμを満たす確率が0.95であることを意味するものではありません。測定を繰り返すたびに、サンプルの平均値Xには別の値が入ります。95%の場合、μはこの平均値から計算されたエンドポイントの間に入りますが、5%の場合は入りません。実際の信頼区間は、測定された重みを式に入力して計算されます。私たちの0.95の信頼区間は次のようになります。

( x0.98 ¯ - ; x ¯ 250.2250.2251.18+ ) = ( - ; + ) = ( ; ) .0.980.980.98249.22{\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}

μの希望値250が結果的に信頼区間内に収まっているので、機械の校正が間違っているとは考えられない。

計算された区間には固定の終点があり、μはその間にあるかもしれません(あるいはないかもしれません)。したがって、このイベントは確率が0か1のどちらかです。とは言えません。"確率(1 - α)でパラメータμは信頼区間内にある" とは言えません。私たちが知っているのは、繰り返すことによって、100(1 - α)%のケースでμが計算された区間に入るということだけです。しかし、100α%のケースではそうではありません。そして残念ながら、どの場合にそうなるのかはわかりません。これが私たちがこう言う理由です。"信頼度100(1 - α) %で、μは信頼区間内にある。"

右の図は、任意の母平均μに対する信頼区間の50個の実測値を示しています。実測値をランダムに1つ選ぶと、95%の確率でパラメータを含む区間を選んだことになりますが、運悪く間違ったものを選んでしまったかもしれません。しかし、運悪く間違ったものを選んでしまうかもしれません。私たちは知る由もありません。

縦の線分は、μの信頼区間の50回の実測値を表しています。Zoom
縦の線分は、μの信頼区間の50回の実測値を表しています。

質問と回答

Q: 統計学における信頼区間とは何ですか?


A: 信頼区間とは,母平均などのパラメータを推定するために使用される特別な区間で,パラメータに単一の値ではなく,許容できる値の範囲を与えるものです.

Q: なぜ単一の値ではなく,信頼区間が使われるのですか?


A: 信頼区間は,標本に基づいてパラメータを推定する際の不確実性を考慮し,パラメータの実際の値が区間内にある可能性を示すために,単一の値の代わりに使用されます.

Q: 信頼水準とは何ですか?


A: 信頼水準とは,推定されるパラメータが信頼区間内にある可能性を示すもので,しばしばパーセンテージで与えられる(例:95%信頼区間).

Q: 信頼限界とは何ですか?


A: 信頼限界とは、信頼区間の終点であり、推定されるパラメータの許容値の範囲を定義するものです。

Q: 信頼水準は信頼区間にどのような影響を与えるのか?


A: ある推定方法において、信頼水準が高いほど信頼区間は広くなります。

Q: 信頼区間を計算するためにはどのような前提が必要ですか?


A: 信頼区間の計算には,一般に,標本の元となった母集団の分布が正規であるという仮定など,推定プロセスの性質に関する仮定が必要です。

Q: 信頼区間はロバスト統計なのか?


A: 信頼区間は,以下に述べるように,ロバスト統計ではありませんが,ロバスト性を付加するための調整を行うことは可能です.

AlegsaOnline.com - 2020 / 2023 - License CC3