平均(算術平均)とは?定義・計算方法・例と外れ値の影響
平均(算術平均)の定義と計算方法を図解と具体例で解説。外れ値が平均に与える影響と適切な対処法もわかりやすく紹介。
平均値は、すべての値を足し合わせて、値の数で割って算出します。
例:1、2、2、100、100は数字や点数の集合です。すべての数字を足すと、答えは205になります。この数字を数字の数で割ると、平均は41であることがわかります。この特定の数字の集合の難しさは、このグループの誰も41点のような点数を取っていないことであり、平均はこれらの数字がどのような点数を表しているかについてはあまり教えてくれません。
算術平均(平均値)の定義と計算式
算術平均(算術的平均)は、データの各値を足し合わせ、その合計をデータの個数で割った値です。n 個の観測値 x1, x2, …, xn があるとき、算術平均 x̄(エックスバー)は次のように表されます:
x̄ = (x1 + x2 + … + xn) / n
例として元のデータをもう一度計算すると:
- 合計:1 + 2 + 2 + 100 + 100 = 205
- 個数:5
- 平均:205 ÷ 5 = 41
平均の読み取りと注意点
- 代表値としての利点:算術平均は計算が簡単で、データ全体の中心傾向を一つの数値で表すのに便利です。多くの統計解析や推定で基本的な役割を果たします。
- 外れ値に敏感:極端に大きい(または小さい)値が含まれると、平均はその影響を強く受けます。例のデータでは、ほとんどの値が1〜2の範囲にあるのに平均が41になっており、実際の「典型的な値」を反映していません。
- 分布の形状に依存:データが左右対称に近い場合は平均は有用ですが、歪んだ分布やカテゴリデータでは中央値や最頻値(モード)の方が適切なことがあります。
外れ値への対処と代替指標
外れ値による影響を避けたい場合、以下の方法がよく使われます:
- 中央値(中央値はデータを小さい順に並べたとき中央に位置する値)— 外れ値に強い。
- トリム平均(切り捨て平均)— 上下の一定割合のデータを除いて平均をとる方法。
- 加重平均— 重要度に応じて各値に重みをつける(例:頻度や信頼度に応じる場合)。
- ロバスト推定量(例えばM推定など)— ノイズや外れ値に頑健な推定方法。
母平均と標本平均、記号
- 母集団全体の平均は通常ギリシャ文字の μ(ミュー) で表されます。
- 標本から計算される平均は x̄(エックスバー)で表され、母平均の推定量として使われます。標本平均は、無作為抽出であれば一般に母平均の良い推定量(不偏推定量)になります。
性質と計算上の便利な公式
- 線形性:平均は線形演算に対して安定です。すなわち、a を定数、b を定数ベクトルのシフトとすると mean(aX + b) = a·mean(X) + b が成り立ちます。
- 分割計算:全体の合計が既知なら、部分集合の平均と個数から全体の平均を効率的に計算できます。
実務上のヒント
- データに外れ値がありそうなときは、まずヒストグラムや箱ひげ図で分布を確認しましょう。
- 平均だけで判断せず、中央値や分散(標準偏差)などの指標も併せて確認するとデータの性質がよく分かります。
- 重みを考慮すべき場合(例:各観測が異なる重要度や頻度を持つとき)は、加重平均を使うと実態に即した値が得られます。
まとめ
算術平均は簡潔で広く使われる代表値ですが、外れ値や偏った分布の存在によって「典型的な値」を正しく表さないことがあります。目的やデータの性質に応じて、中央値・トリム平均・加重平均など適切な指標を選択することが重要です。
計算の詳細
N個の{displaystyle N} の平均を求めるには、N個の{displaystyle N}
の数値を加算して、その合計をN個の{displaystyle N}
で割る。
記号では、数値がX 1 {}displaystyle X_{1}} の場合, X 2 {}displaystyle X_{2}} である。
X 3 {displaystyle X_{3}} とする。
, ...X N {displaystyle X_{N}} , 合計は次の通りである。
となり、合計は
x 1 + x 2 + x 3 + ....+ X N {} {displaystyle X_{1}+X_{2}+X_{3}+...+X_{N}}
その合計をN {displaystyle N}
で割って平均を出す。
x 1 + x 2 + x 3 + ....+ X N N {displaystyle {X_{1}+X_{2}+X_{3}+...+X_{N}} {displaystyle {X_{1}+X_{2}+X_{3}+...+X_{N}}}\N}
事例紹介
- ルーシーは5歳。トムは6歳。エミリーは7歳です。平均年齢を求めるには
- 3つの数字を足す。
5 + 6 + 7 = 18 {displaystyle 5+6+7=18}.
· 合計は18です。合計 18 を 3 で割る。
18 / 3 = 6 {displaystyle 18/3=6}.
· 3つの数値の平均は6です。
5 + 6 + 7 3 {displaystyle { {frac {5+6+7}}}}.
したがって、ルーシー、トム、エミリーの平均年齢は6歳である。
関連計算
平均の考え方は、多数の測定値(値)を1つの値だけで表すことである。しかし、そのような表す値を計算する方法は様々です。
- 中央値とは、サンプルの半分がそれより下になり、残りの半分がそれより上になるように、すべてのサンプルを分割した数値のことです。例:1, 10, 50, 100, 100 は、数字またはスコアの集合です。これらのスコアを見ると、50という数字は数字の範囲の真ん中に位置し、半分の数字またはスコアがこの数字より上にあり、半分の数字またはスコアがこの数字より下にあることを教えてくれることがわかります。これは、この数字群について何を調べようとしているかによって、より多くの情報を得ることができるのです。高い方のグループと低い方のグループをそれぞれちょうど半分にすることは必ずしも可能ではありませんが(例:1、2、2)、それが理想的です。
- モーダスまたはモードは、最も頻繁に出現する数字である。例:1, 2, 2, 100, 200は、数字またはスコアの集合である。この数字を見ると、2という数字が最も多く出現しており、このグループの中で2という数字や点数が最も一般的な点数や数字であることがわかります。
- 算術平均は、あくまでも平均値であり、すべての値の和をその数で割った値である。これが、最もよく言われる平均値である。
- 調和平均は、算術平均の逆数のことである。レートやパーセンテージの平均を求めるときによく使われる。
- 二乗平均平方根は、数値の二乗の算術平均の平方根である。二乗平均平方根は、少なくとも算術平均と同じ高さであり、通常はより高い。
人がいろいろな測定をすれば、いろいろな結果が出ます。それらの結果は一定の分布を持っており、ある平均値を中心にした分布になることもあります。この平均値を数学者は算術平均と呼んでいます。
平均値は期待値を表すこともある。
質問と回答
Q:平均値とは何ですか?
A:平均とは、数学や統計学で使われる平均値の一種です。
Q:算術平均はどのように計算するのですか?
A:算術平均は、すべての値を加算し、値の数で割って計算します。
Q:平均の他にどんな種類がありますか?
A:中央値、最頻値、調和平均などがあります。
Q:平均の種類には何がありますか?
A:算術平均、幾何平均、調和平均がある。
Q:一組の数字がどのような点数を表しているか、どのように調べればよいのでしょうか?
A:どのような点数であるかを知るには、個々の点数や値を調べて、どのような種類や範囲に含まれるかを理解することが必要である。
Q:この例では、205を5で割るとどうなるのでしょうか?A:この例で205を5で割ると、算術平均が41であることがわかります。
百科事典を検索する