数学統計学では、平均の別称である。

平均値は、すべての値を足し合わせて、値の数で割って算出します。

例:1、2、2、100、100は数字や点数の集合です。すべての数字を足すと、答えは205になります。この数字を数字の数で割ると、平均は41であることがわかります。この特定の数字の集合の難しさは、このグループの誰も41点のような点数を取っていないことであり、平均はこれらの数字がどのような点数を表しているかについてはあまり教えてくれません。

算術平均(平均値)の定義と計算式

算術平均(算術的平均)は、データの各値を足し合わせ、その合計をデータの個数で割った値です。n 個の観測値 x1, x2, …, xn があるとき、算術平均 x̄(エックスバー)は次のように表されます:

x̄ = (x1 + x2 + … + xn) / n

例として元のデータをもう一度計算すると:

  • 合計:1 + 2 + 2 + 100 + 100 = 205
  • 個数:5
  • 平均:205 ÷ 5 = 41

平均の読み取りと注意点

  • 代表値としての利点:算術平均は計算が簡単で、データ全体の中心傾向を一つの数値で表すのに便利です。多くの統計解析や推定で基本的な役割を果たします。
  • 外れ値に敏感:極端に大きい(または小さい)値が含まれると、平均はその影響を強く受けます。例のデータでは、ほとんどの値が1〜2の範囲にあるのに平均が41になっており、実際の「典型的な値」を反映していません。
  • 分布の形状に依存:データが左右対称に近い場合は平均は有用ですが、歪んだ分布やカテゴリデータでは中央値や最頻値(モード)の方が適切なことがあります。

外れ値への対処と代替指標

外れ値による影響を避けたい場合、以下の方法がよく使われます:

  • 中央値(中央値はデータを小さい順に並べたとき中央に位置する値)— 外れ値に強い。
  • トリム平均(切り捨て平均)— 上下の一定割合のデータを除いて平均をとる方法。
  • 加重平均— 重要度に応じて各値に重みをつける(例:頻度や信頼度に応じる場合)。
  • ロバスト推定量(例えばM推定など)— ノイズや外れ値に頑健な推定方法。

母平均と標本平均、記号

  • 母集団全体の平均は通常ギリシャ文字の μ(ミュー) で表されます。
  • 標本から計算される平均は (エックスバー)で表され、母平均の推定量として使われます。標本平均は、無作為抽出であれば一般に母平均の良い推定量(不偏推定量)になります。

性質と計算上の便利な公式

  • 線形性:平均は線形演算に対して安定です。すなわち、a を定数、b を定数ベクトルのシフトとすると mean(aX + b) = a·mean(X) + b が成り立ちます。
  • 分割計算:全体の合計が既知なら、部分集合の平均と個数から全体の平均を効率的に計算できます。

実務上のヒント

  • データに外れ値がありそうなときは、まずヒストグラムや箱ひげ図で分布を確認しましょう。
  • 平均だけで判断せず、中央値や分散(標準偏差)などの指標も併せて確認するとデータの性質がよく分かります。
  • 重みを考慮すべき場合(例:各観測が異なる重要度や頻度を持つとき)は、加重平均を使うと実態に即した値が得られます。

まとめ

算術平均は簡潔で広く使われる代表値ですが、外れ値や偏った分布の存在によって「典型的な値」を正しく表さないことがあります。目的やデータの性質に応じて、中央値・トリム平均・加重平均など適切な指標を選択することが重要です。