Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学で重要な要約統計量:最頻値【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学で重要な要約統計量:最頻値【統計解析講義基礎】

統計学で重要な要約統計量:最頻値【統計解析講義基礎】


統計学で重要な要約統計量:最頻値【統計解析講義基礎】

 

目次  統計学で重要な要約統計量:最頻値【統計解析講義基礎】

 

最頻値(モード)

 

最頻値(モード)も、代表値として用いられる場合があります。

 

最頻値は、読んで字のごとくもっとも頻度が高く(頻繁に)出現する値のことです。

 

図は、総理府が毎年実施している国民生活基礎調査のレポートから、各世帯の所得金額の分布を示したものです。

 

このデータでは、全世帯の平均所得は538万円であり、中央値はそれより100万円低い427万円となっています。

 

最頻値は、所得が300〜400万円の階級が最も多いので、約350万円とみなすことができます。

 

つまり、この所得分布の代表値をみると、最頻値が最も小さく、その次が中央値、その次が平均となっています。

 

この状況からまとめると次のようになります。

 

最頻値から判断すると、年間所得が350万円付近の階層が最も多数を占める

 

中央値から判断すると、真ん中の世帯は427万円の所得を得ている

 

低所得者層から高所得者層までを平均した所得は538万円です。

 

いずれの表現も当を得ており、間違いではありません。

 

最頻値(モード)はもっともありふれた階層とみなせますので、これは「ふつうの世帯」としてランキングされたともいえます。

 

中央値(メジアン)は言うまでもなく真ん中の値です。

 

ところが平均はこれらよりもかなり高い所得のところにあり、国民の実感とはかなりずれているといえるでしょう。

 

国民の所得は、最低のゼロから始まって上は何億円という人もいるはずです。

 

ということは、平均よりも桁外れに多い所得を得ている人が少数だけ存在しているために、実感とはかけ離れた平均所得が統計に現れることになります。

 

この種の統計では、得てして平均の値があたかも一般庶民のものであるかのようにメディアでも政治でも扱われがちですが、それは実は虚像であって、最頻値や中央値の方が、国民の実態を反映した代表値であると考えるのが妥当といえます。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学で重要な要約統計量:最頻値【統計解析講義基礎】

統計学で重要な要約統計量:最頻値【統計解析講義基礎】

統計学で重要な要約統計量:最頻値【統計解析講義基礎】