Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における平均値の重心としての性格【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における平均値の重心としての性格【統計解析講義基礎】

統計学における平均値の重心としての性格【統計解析講義基礎】


統計学における平均値の重心としての性格【統計解析講義基礎】

 

では、ふつうもっともありふれた非対称型の場合、平均値は最頻値からどれくらいずれるでしょうか。

 

正確には平均値を計算してみる以外にありませんが、非対称の度合が著しいほどずれるのは当然です。

 

ところで、平均値は数学的には度数分布の重心の位置にあります。

 

これは次のように証明されます。

 

先に述べた「偏差の和=0」から、度数×偏差の合計を計算すると、平均値の左右でイコールになります。

 

そこで、度数=おもり、平均値=支点 とみなせば、テコの原理でバランスがとれるのです。

 

私たちは、生まれて以来、この地球にずっと住みついていて、重力にはお馴染みで、また重心の感知能力はきわめて高いといえます。

 

その能力なくして2本足での直立歩行などできるものではないからです。

 

うちの飼い猫を見ていると、4本足のせいか、塀の上でもどこでも無造作に歩いて、バランスをとる気苦労などすこしもなさそうです。

 

ということで、平均値の存在理由は、単に抽象的な計算結果などではなく、データの重心という、きわめて具体的、直接的、普遍的な特質にあるのです。

 

このおなじみの特質を早速利用しない手はありません。

 

平均値の位置を直感的に知るために、度数分布の山型に描かれた部分を切り抜いて、鉛筆のような棒にのせて左右のバランスをとります。

 

そこが平均値の位置なのです。

 

実際に紙を切り抜いたりの手間をかけなくても、長らく地球人をやってきている読者には、想像力だけで、「平均はこの辺りだな」とおおよその見当はつくはずです。
頭だけの理屈で考えると、分布の左右の面積をイコールにすればいいと誤解する向きもあるでしょう。

 

しかし、体験的直観はそうでないことを教えてくれます。

 

ただ、異常値があると、テコのおもりがずっと端のほうに寄ったようなもので、平均値(支点)はそれによって大きくずれて、重心の位置の見当がつきにくくなります。

 

バランスをとるのに十分気をつけたいところですが、やはり平均値は異常値に弱いといえます。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学における平均値の重心としての性格【統計解析講義基礎】

統計学における平均値の重心としての性格【統計解析講義基礎】

統計学における平均値の重心としての性格【統計解析講義基礎】