信頼区間とは:定義・意味・95%信頼区間の計算と解釈
信頼区間の定義と意味を図解で簡潔に解説。95%信頼区間の計算方法・解釈と前提条件、実例での読み解き方を掲載。
統計学における信頼区間とは,あるパラメータを推定するための方法の一つで,点推定(1つの値)ではなくパラメータが取り得る範囲(区間)を与えるものです。観測データ(サンプル)に基づいて区間を構成し,その構成手順を繰り返したときに、真のパラメータがその区間に入る割合が所定の値(信頼度)になるように設定します。信頼度は通常パーセンテージで示され、例えば「95%信頼区間」といえば信頼度が95%であることを意味します。区間の上下の値は信頼限界と呼ばれます。一般に同じ推定法を用いると,信頼度が高いほど区間は広くなり,逆に信頼度が低いほど区間は狭くなります。
信頼区間の算出には推定手順や母集団に関する仮定が必要になることが多く,これは主にパラメトリックな手法です。よくある仮定の一つは母集団が正規分布に従うことですが,サンプルサイズが大きければ中心極限定理により正規近似が使える場合もあります。仮定が破られると,得られた信頼区間は厳密には正しくない可能性があるため,頑健な手法やブートストラップなどの非パラメトリック手法で補強することができます。
代表的な計算式(概要)
- 母分散が既知の場合(稀):平均の信頼区間は x̄ ± z_{α/2} · σ / √n (ここで z_{α/2} は標準正規分布の上側確率 α/2 の分位点,σ は母標準偏差,n はサンプルサイズ)
- 母分散が未知の場合(通常):平均の信頼区間は x̄ ± t_{α/2, ν} · s / √n (s は標本標準偏差,ν = n − 1 は自由度,t_{α/2, ν} は t 分布の分位点)
- 比率(割合 p)の場合:標準的なワルド区間は p̂ ± z_{α/2} · √(p̂(1−p̂)/n) だが,n が小さいか p̂ が 0 または 1 に近い場合は Wilson スコア区間や正規近似を補正した方法が推奨される
95%信頼区間の具体例
たとえばサンプルサイズ n = 25,標本平均 x̄ = 100,標本標準偏差 s = 15 のとき,母分散が未知なので t 分布を用います。自由度 ν = 24 に対する t_{0.975,24} ≈ 2.064。標準誤差は s / √n = 15 / 5 = 3。したがって 95% 信頼区間は
100 ± 2.064 × 3 = 100 ± 6.192 → (約 93.81,106.19)
この区間は「同じ方法で多数回サンプリングして信頼区間を作ると,そのうち約95%の区間が真の母平均を含む」と解釈します。
解釈とよくある誤解
- 正しい解釈(頻度主義):95%信頼区間とは「同じ手順で無限に近い回数のサンプリングを繰り返して区間を作ると,約95%の区間が真の値を含む」という意味です。
- よくある誤解:単一の得られた区間について「この区間に真のパラメータが95%の確率で入っている」と言うのは誤りです。点推定とは異なり,区間は既に観測で確定しており,確率的記述は構成手順全体に対しての頻度的なものです(ただしベイズ統計の「信用区間(credible interval)」は事後確率的解釈を与えます)。
- 信頼区間はデータとモデルに依存します。モデルの仮定(分布形,独立性など)が破られると覆い方が変わる可能性があります。
幅に影響する要因
- サンプルサイズ n:大きいほど幅は狭くなる(√n に反比例)。
- データのばらつき(標準偏差 s):大きいほど幅は広くなる。
- 信頼度(例:90% vs 95% vs 99%):高い信頼度ほど対応する z や t の分位点が大きくなり,区間は広くなる。
仮定が満たされない場合の代替法
- ブートストラップ法:元のサンプルから再標本抽出を多数回行い,その分布のパーセンタイルから区間を作る。分布の形を仮定しないため柔軟性が高い。
- ロバスト推定:外れ値や非正規性に強い推定量(トリム平均やM推定量など)と対応する信頼区間を用いる。
- 比率の信頼区間:小サンプルや極端確率のときは Wilson 法や Agresti–Coull 法を使うことが推奨される。
報告の仕方(実務的な注意)
- 点推定とともに信頼区間を示す:例「平均 = 100(95% CI: 93.8–106.2), n = 25」
- 使用した信頼水準(例:95%)と計算方法(t 分布,正規近似,ブートストラップなど)を明記する。
- 必要に応じて自由度や母分散が既知か否かも記載する。
- 多重比較を行う場合は有意水準の補正だけでなく,区間幅の解釈にも注意する。
まとめると,信頼区間は点推定だけでは伝わらない不確実性を定量的に示す有用な手段です。ただしその解釈は頻度主義的なものであり,計算に用いる仮定やサンプルの特性に注意して使用・報告する必要があります。必要ならばブートストラップやロバスト法を併用して頑健性を確認してください。
"自信 "という言葉の意味
自信という言葉は、統計学においても一般的に使われているような同様の意味を持っています。一般的な使用法では、何かに対する95%の信頼性の主張は、通常、事実上の確実性を示しているとみなされます。統計学では、95%信頼度の主張は、単に研究者が多数の可能な区間の中から1つの可能な区間を見たことを意味し、20の区間のうち19の区間がパラメータの真の値を含んでいることを意味する。
実用例
カップにマーガリンを充填する機械があります。この例では、カップの中身が250gのマーガリンになるように機械を調整します。機械はすべてのカップに正確に250gのマーガリンを充填することはできないので、個々のカップに加えられる内容物はある程度のばらつきがあり、これを確率変数Xとします。機械が適切に校正されているかどうかを判断するために、n = 25カップのマーガリンのサンプルを無作為に選び、カップの重量を測定します。マーガリンの重さは X1, ..., X25 であり,これは X からの無作為なサンプルである.
期待値μの印象を得るためには、推定値を与えることで十分です。適切な推定値は標本平均です。
μ ^ = X ¯ = n1 ∑ i = n1 X i .{本来ならば、このようにして得られた結果を、さらに発展させていくことができる。}
サンプルでは、平均値を持つ実際のウェイトx1, ...,xが示されて25います。
x125 ¯ = ∑ i = x 125i = 250.2grams .{グラム数を示す。}
さらに25個のカップをサンプルとして採取した場合、250.4gや251.1gといった値が容易に予想されます。しかし、カップの平均含有量が実際に250gに近いのであれば、サンプル平均値が280gになることは極めて稀です。観察されたサンプル平均値250.2の周囲には、全体の母平均が実際にこの範囲内の値を取る場合、観察されたデータが特に異常であるとは考えられないような区間があります。このような区間は,パラメータμの信頼区間と呼ばれます。区間の端点はサンプルから計算されなければならないので、それらは統計であり、サンプルX1, ..., Xの関数で25あり、したがって確率変数そのものです。
今回のケースでは、正規分布するサンプルからのサンプル平均Xも正規分布し、期待値μは同じだが、標準誤差σ/√n=0.5(グラム)であると考えることで、終点を決めることができます。標準化することで、確率変数
Z = X ¯ - μ σ / n = X ¯ - μ {\0.5displaystyle Z={\frac {{bar {X}}-mu }{\sigma /{\sqrt {n}}}}={\frac {{bar {X}}-\mu }{0.5}}}}。
したがって、μに依存しない数-zとzを見つけることができ、Zはその間に1-αの確率で位置します。ここでは、1 - α = 0.95 とします。つまり、次のようになります。
P ( - z ≤ Z ≤ z ) = -1 α 0.95= . {\displaystyle P(-z\leq Z\leq z)=1-alpha =0.95.\, }.
数zは累積分布関数に従う。
Φ ( z ) = P ( Z ≤ z 1) = - α = , 20.975z = Φ - (1 Φ ( z ) ) = Φ - ( ) = , {10.9751.96˶‾᷄ -̫ ‾᷅˵}\Phi (z)&=P(Z\leq z)=1-{tfrac {\alpha }{2}}=0.975,\\^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,end{aligned}}。
と出てきます。
0.951= - α = P ( - z ≤ Z ≤ z ) = P 1.96( - ≤ X ¯ - μ σ / n ≤ ) =1.96 P ( X ¯ - 1.96σ n ≤ μ ≤ X ¯ + σ1.96 n ) = P ( X ¯ -1.96 × ≤ 0.5μ ≤ X ¯ + ×1.96 ) =0.5 P ( X ¯ - ≤0.98 μ ≤ X0.98 ¯ + ) .{aligning}0.95&=1-\\ =P(-z˶ˆ꒳ˆ˵ ) =P\left(-1.96˶ˆ꒳ˆ˵ ) }\frac {{bar {X}}-mu }{˶ˆ꒳ˆ˵ }{sigma /{sqrt {n}}}}˶ˆ꒳ˆ˵ )96right)♪\\=P\left({{bar {X}}-1.96{\sqrt {n}}\\\=P\=P\=P\=Please)96{frac {\\}}\\\\\\\\\\\\\\\\\\\\\\∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮∮96times 0.5\\\\\\\\\\\\\\\\\\\\\\\\\\\\⁾⁾。
これは次のように解釈できます:確率0.95で、確率的な終点の間にパラメータμを満たす信頼区間を見つけることができる。
X0 ¯ - . 98 {X}}-0{.}98%%}。
そして
X0.98¯ + ... {displaystyle {bar {X}}+0.98.\\, }.
これは、計算された区間でパラメータμを満たす確率が0.95であることを意味するものではありません。測定を繰り返すたびに、サンプルの平均値Xには別の値が入ります。95%の場合、μはこの平均値から計算されたエンドポイントの間に入りますが、5%の場合は入りません。実際の信頼区間は、測定された重みを式に入力して計算されます。私たちの0.95の信頼区間は次のようになります。
( x0.98 ¯ - ; x ¯ 250.2250.2251.18+ ) = ( - ; + ) = ( ; ) .0.980.980.98249.22{\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}
μの希望値250が結果的に信頼区間内に収まっているので、機械の校正が間違っているとは考えられない。
計算された区間には固定の終点があり、μはその間にあるかもしれません(あるいはないかもしれません)。したがって、このイベントは確率が0か1のどちらかです。とは言えません。"確率(1 - α)でパラメータμは信頼区間内にある" とは言えません。私たちが知っているのは、繰り返すことによって、100(1 - α)%のケースでμが計算された区間に入るということだけです。しかし、100α%のケースではそうではありません。そして残念ながら、どの場合にそうなるのかはわかりません。これが私たちがこう言う理由です。"信頼度100(1 - α) %で、μは信頼区間内にある。"
右の図は、任意の母平均μに対する信頼区間の50個の実測値を示しています。実測値をランダムに1つ選ぶと、95%の確率でパラメータを含む区間を選んだことになりますが、運悪く間違ったものを選んでしまったかもしれません。しかし、運悪く間違ったものを選んでしまうかもしれません。私たちは知る由もありません。


縦の線分は、μの信頼区間の50回の実測値を表しています。
質問と回答
Q: 統計学における信頼区間とは何ですか?
A: 信頼区間とは,母平均などのパラメータを推定するために使用される特別な区間で,パラメータに単一の値ではなく,許容できる値の範囲を与えるものです.
Q: なぜ単一の値ではなく,信頼区間が使われるのですか?
A: 信頼区間は,標本に基づいてパラメータを推定する際の不確実性を考慮し,パラメータの実際の値が区間内にある可能性を示すために,単一の値の代わりに使用されます.
Q: 信頼水準とは何ですか?
A: 信頼水準とは,推定されるパラメータが信頼区間内にある可能性を示すもので,しばしばパーセンテージで与えられる(例:95%信頼区間).
Q: 信頼限界とは何ですか?
A: 信頼限界とは、信頼区間の終点であり、推定されるパラメータの許容値の範囲を定義するものです。
Q: 信頼水準は信頼区間にどのような影響を与えるのか?
A: ある推定方法において、信頼水準が高いほど信頼区間は広くなります。
Q: 信頼区間を計算するためにはどのような前提が必要ですか?
A: 信頼区間の計算には,一般に,標本の元となった母集団の分布が正規であるという仮定など,推定プロセスの性質に関する仮定が必要です。
Q: 信頼区間はロバスト統計なのか?
A: 信頼区間は,以下に述べるように,ロバスト統計ではありませんが,ロバスト性を付加するための調整を行うことは可能です.
百科事典を検索する