Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学で重要な算術平均と幾何平均【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学で重要な算術平均と幾何平均【統計解析講義基礎】

統計学で重要な算術平均と幾何平均【統計解析講義基礎】


統計学で重要な算術平均と幾何平均【統計解析講義基礎】

 

売り上げ高を調べたら、昨年は一昨年の2倍であったとします。

 

また、今年は昨年の8倍あったとします。

 

さて、2年間の平均は何倍といえるでしょうか。

 

@平均はデータの総和をデータ数で割ったものなので、年平均は(2+8)÷2=5倍となる。

 

A一昨年の2倍で、されにその8倍だから、今年は一昨年の16倍である。したがって、年平均は、16÷2=8倍 となる。

 

B年平均4倍と考えれば、2年で4×4=16倍とちょうどなるので、4倍である。

 

さて、@の年平均5倍とすると、2年では5×5=25倍となります。

 

また、Aの年平均8倍とすると、2年では8×8倍となるでしょう。

 

どう考えても大きく見積もりすぎです。

 

そこで、本当は何倍になるかを方程式を立てて考えます。

 

年平均をX倍とすると、2年後にはXの2乗倍になります。

 

これが2×8=16倍になるので、

 

Xの2乗=16 を計算すればよいことになります。

 

これを満たすXは4となります。

 

年平均4倍とすると、2年で4×4=16倍となるので納得できます。

 

平均にはいくつかの種類があります。

 

最もよく使われるのは算術平均ですが、必ずしも算出平均だけではありません。

 

上の@のように、(2+8)÷2=5 という計算はまさに算術平均です。相加平均ともいいます。

 

この場合は、√(2×8)という計算が妥当ということになります。

 

つまり2つの数を掛け算してその平方根をとるという計算です。

 

一般にn個の数を掛け算してそのn乗根をとって得られた平均を、幾何平均といいます。相乗平均ともいいます。

 

この例では幾何平均を使うべきである、といえます。

 

対数正規分布

 

データが、1、10、100、1000のように10倍単位で激しく変わる分布を、対数正規分布といいます。

 

たとえば、ある企業で働く人の年収が仮に以下であるとします。

 

新入社員 100万円

 

中堅社員 1000万円

 

役員   10000万円

 

社長   100000万円

 

このような分布は、対数正規分布といいます。

 

対数正規分布の場合、算術平均をとるとおかしなことになります。

 

上の例で、算術平均をとる、つまり全部足して4で割ると、2億円を超えます。

 

この企業は平均年収が2億円だ、と公表したら、入社したい社員が殺到するでしょう。

 

しかし、冷静に考えると算術平均を代表値とするのはよくありません。明らかに、社長の年収が外れ値となっています。

 

このような場合、幾何平均をとります。

 

つまり、全部掛け算をしてその4乗根をとります。

 

計算すると、約3160万円となります。高めではありますが、2億円に比べたら現実により近い値といえるでしょう。

 

一般に、算術平均≧幾何平均 という関係があります。

 

つまり幾何平均は算術平均よりも小さい値になります。

 

また、対数正規分布をとるデータの場合は、幾何平均を平均とする、というのも覚えておきましょう。

 

幾何平均は、ExcelではGEOMEANという関数を使うと一発で計算することができます。

セミナー詳細こちら                    解析ご相談こちら


 

統計学で重要な算術平均と幾何平均【統計解析講義基礎】

統計学で重要な算術平均と幾何平均【統計解析講義基礎】

統計学で重要な算術平均と幾何平均【統計解析講義基礎】