中心極限定理をわかりやすく解説|定義・正規分布・主要な一般化
中心極限定理を図解と直感でやさしく解説:定義・正規分布の理由・リンデベルグ/リアプノフなど主要な一般化を丁寧に紹介
中心極限定理は、確率論の基本的かつ強力な定理で、独立な確率変数の和(または平均)を適切に標準化すると、その極限分布が正規分布(ガウス分布)に近づくことを主張します。一般に言うと、個々の確率変数の分布がどのような形であっても、分散が有限であれば合計は「安定した」形になり、それが正規分布になる場合が多い、という性質です。ここでは直感、厳密な形式、主要な一般化と応用をわかりやすくまとめます。
定義と標準化(最も基本的な形)
もっともよく示される形は、同じ確率分布に従う独立同分布(i.i.d.)の確率変数列についてのものです。確率論の文脈で次のように書かれます。
- X1, X2, … を互いに独立で同じ分布に従う確率変数とし、期待値 E[Xi]=μ、分散 Var(Xi)=σ^2 (<σ^2<∞>) が存在するとする。
- 合計 Sn = X1 + X2 + … + Xn とおくと、標準化した変数 (Sn − nμ) / (σ √n) は n → ∞ のとき標準正規分布 N(0,1) に分布収束します。
簡潔に書くと、(Sn − nμ)/(σ√n) →d N(0,1)(「→d」は分布収束)です。ここでの「標準化」は、合計が成長する平均を引き、ばらつきを √n で割って一定のスケールにする操作です。
直感
- 多数の独立した小さなランダム要因が合わさると、それぞれの非対称性や偏りは互いに打ち消し合い、全体としては「左右対称でベル型」の分布になる。これが正規分布の形につながる直感です。
- コイン投げ(成功確率 p)のような二値の独立試行を n 回繰り返すと、成功回数の分布は二項分布 B(n,p) ですが、n が大きいとその平均 np、分散 np(1−p) の正規分布で近似できます(De Moivre–Laplace の定理)。
主要な一般化
中心極限定理には多くの一般化があり、次のようなものが重要です。
- 独立だが同一分布でない場合: 各確率変数が同じ分布である必要はありません。代表的な条件としては、リアプノフ条件(Lyapunov 条件)やリンデベルグ条件(Lindeberg 条件)などがあり、これらを満たせば標準化した和は正規分布に収束します。
- 三角配列(各 n 毎に分布が変わる場合): 各 n で Xi,n(i=1,…,kn)が独立な三角配列でも、適切な条件下で CLT が成り立ちます。これが Lindeberg の枠組みです。
- 多変量版: ベクトル値確率変数についても、多変量正規分布への収束を主張する多変量中心極限定理があります。
- 分散が無限の場合: 分散が無限だと正規分布に収束しないことがあり、代わりに Lévy α-安定分布などの安定分布に収束する場合があります。
リンデベルグ条件とリアプノフ条件(簡潔な説明)
- リアプノフ条件: 各確率変数の絶対モーメントの適当な次数が揃って小さくなることを要求する条件。直感的には「いくつかの変数が非常に大きな振る舞いをして合計を支配しない」ことを保証します。
- リンデベルグ条件: より精密で一般的な条件。任意のε>0 に対し、個々の大きな値が全体の分散に与える寄与が無視できることを要求します。これを満たすと三角配列の CLT が成り立ちます。
収束の種類と近似の精度
- 中心極限定理は「分布収束」を主張します(確率変数の分布関数が目標分布の分布関数に収束)。
- 近似の速さを評価する定理としては Berry–Esseen の定理 があり、三次絶対モーメントが有限なら誤差は O(1/√n) 程度で抑えられることが示されます。実務的には n が十分大きければ正規近似はかなり良好です。
典型的な応用例
- 標本平均の分布の近似:標本平均は母平均に近づき、その標準化は正規分布に従うため、信頼区間や検定の理論的基盤になります。
- 二項分布の正規近似(De Moivre–Laplace): B(n,p) ≈ N(np, np(1−p))。特に n が大きく p が極端でなければ有用です(連続補正を使う場合もあります)。
- モンテカルロ法や統計シミュレーション:多くの独立した乱数の和が正規に近づく性質を利用して誤差評価や近似の正当化を行います。
補足:歴史と有名な貢献者
中心極限定理に関する研究は長い歴史があり、確率論の発展と共に多くの数学者が寄与しています。早期の重要な結果としては de Moivre、Laplace の仕事があり、後に Lyapunov(リアプノフ条件)や Lindeberg(リンデベルグ条件)らが一般化を与えました。George Pólya もこの分野に関する重要な論考を残しています。
最後に:注意点
- 中心極限定理は「漸近的(n→∞)」な結果なので、有限 n では近似誤差がある点に注意してください。
- 分散が有限であることや、「極端に大きい値が支配しない」などの条件が満たされているかを確認することが重要です。
補足として、より厳密な数式や証明、リンデベルグ・リアプノフの具体的条件や Berry–Esseen の定量評価などに興味があれば、さらに詳細に解説できます。
質問と回答
Q:中心極限定理とは何ですか?
A:中心極限定理(CLT)とは、集約された確率分布の極限動作に関する定理です。独立した多数の確率変数が与えられたとき、それらの和が安定した分布に従うことを述べています。乱数変数の分散が有限であれば、ガウス分布になる。
Q:この定理のもとになった論文は誰が書いたのですか?
A:ジョージ・ピュブリャが1920年に書いた論文「確率論における中心極限定理とモーメント問題について」が、この定理のもとになっています。
Q:すべての確率変数が有限分散を持つとき、どのような分布になるのか?
A:すべての確率変数が有限分散のとき、CLTを適用すると、ガウス分布または正規分布になります。
Q:CLTには一般化されたものがあるのですか?
A: はい,すべての確率変数の分布が同一であることを必要としない,CLTのさまざまな一般化されたものがあります.これらの一般化にはリンデベルグ条件とリアプノフ条件が含まれ、一つの確率変数が結果に対して他のものより大きな影響を与えないようにします。
Q:これらの一般化はどのように働くのですか?
A:これらの一般化は,リンデベルグ条件やリアプノフ条件などの前提条件を追加することで,結果に対して単一の確率変数が他よりも大きな影響を及ぼさないことを保証しています.
Q:同じ分布を持つ独立な確率変数の標本平均と多数の和について,CLTはどのように言っていますか?
A: CLTでは、平均ى {displaystyle \mu }、標準偏差ى {displaystyle \sigma }を持つ同一分布で独立なn個の確率変数がある場合、それらの標本平均(X1)、標本総和(X2)は、CLTによれば とすると、それらの標本平均(X1+...+Xn)/nは平均がى{displaystyle \mu }、標準偏差がَ/√n {displaystyle {tfrac {sigma }{sqrt {n}}} で近似正規分布となります。さらに、それらの和X1+...+Xnも平均値nى、標準偏差√nَ {displaystyle {thqrt {n}} {sigma }で近似正規分布となる。} .
百科事典を検索する