算術平均(相加平均)と幾何平均(相乗平均)|データが対数正規分布の場合は幾何平均【統計学・統計解析講義基礎】
最もよく使われるのは算術平均(相加平均)だが、必ずしも算出平均が妥当でない場合もある。データが対数正規分布の場合は幾何平均(相乗平均)を使う
目次 算術平均(相加平均)と幾何平均(相乗平均)|データが対数正規分布の場合は幾何平均【統計学・統計解析講義基礎】
算術平均(相加平均):必ずしも最適でない
売り上げ高を調べたら、昨年は一昨年の2倍であったとします。
また、今年は昨年の8倍あったとします。
さて、2年間の平均値は何倍といえるでしょうか。
@算術平均(相加平均)はデータの総和をデータ数で割ったものなので、年平均は(2+8)÷2=5倍となる。
A一昨年の2倍で、されにその8倍だから、今年は一昨年の16倍である。したがって、年平均は、16÷2=8倍 となる。
B年平均4倍と考えれば、2年で4×4=16倍とちょうどなるので、4倍である。
さて、@の年平均5倍とすると、2年では5×5=25倍となります。
また、Aの年平均8倍とすると、2年では8×8倍となるでしょう。
どう考えても大きく見積もりすぎです。
そこで、本当は何倍になるかを方程式を立てて考えます。
年平均をX倍とすると、2年後にはXの2乗倍になります。
これが2×8=16倍になるので、
Xの2乗=16 を計算すればよいことになります。
これを満たすXは4となります。
年平均4倍とすると、2年で4×4=16倍となるので納得できます。
平均値にはいくつかの種類があります。
最もよく使われるのは算術平均ですが、必ずしも算出平均だけではありません。
上の@のように、(2+8)÷2=5 という計算はまさに算術平均です。相加平均ともいいます。
この場合は、√(2×8)という計算が妥当ということになります。
つまり2つの数を掛け算してその平方根をとるという計算です。
幾何平均(相乗平均)
一般にn個の数を掛け算してそのn乗根をとって得られた平均を、幾何平均といいます。
相乗平均ともいいます。
先の例では幾何平均を使うべきである、といえます。
対数正規分布では幾何平均を使う
データが、1、10、100、1000のように10倍単位で激しく変わる分布を、対数正規分布といいます。
たとえば、ある企業で働く人の年収が仮に以下であるとします。
新入社員 100万円
中堅社員 1000万円
役員 10000万円
社長 100000万円
このような分布は、対数正規分布といいます。
対数正規分布の場合、算術平均をとるとおかしなことになります。
上の例で、算術平均をとる、つまり全部足して4で割ると、2億円を超えます。
この企業は平均年収が2億円だ、と公表したら、入社したい社員が殺到するでしょう。
しかし、冷静に考えると算術平均を代表値とするのはよくありません。明らかに、社長の年収が外れ値となっています。
このような場合、幾何平均をとります。
つまり、全部掛け算をしてその4乗根をとります。
計算すると、約3160万円となります。高めではありますが、2億円に比べたら現実により近い値といえるでしょう。
一般に、算術平均≧幾何平均 という関係があります。
つまり幾何平均は算術平均よりも小さい値になります。
また、対数正規分布をとるデータの場合は、幾何平均を平均値とする、というのも覚えておきましょう。
幾何平均は、ExcelではGEOMEANという関数を使うと一発で計算することができます。
関連リンク