Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における中心傾向の測度とは【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における中心傾向の測度とは【統計解析講義基礎】

統計学における中心傾向の測度とは【統計解析講義基礎】


統計学における中心傾向の測度とは【統計解析講義基礎】

 

最頻値、中央値、平均値といった中心傾向の測度は、データの特徴を表現するために使われる記述統計量の1つのタイプです。

 

もう一つのタイプの統計量はデータの変動の測度で、分散、標準偏差などがあります。

 

中心傾向の測度は、代表値とも呼ばれ、データのうち最も中心的、あるいは代表的な点を反映しています。

 

言い換えれば、データを代表させるためにデータの中からたった1つの得点を選ばなければならないとしたら、中心傾向の測度を選ぶことになります。

 

たとえば、近郊にあるホンダ販売店の8月1ヶ月当たりの車の販売台数を最もよく代表させる必要があるなら、記述統計量として毎年8月の売り上げの平均値を利用するでしょう。

 

中心傾向の測度として何を利用するかは、扱っているデータのタイプによります。

 

中央値は、得点を最小のものから最大のものまで順に並べていったときに、それらの得点の真ん中にくる得点です。

 

中央値は、得点の50%がその値より大きく、得点の50%がその値より小さくなるような点と定義されます。

 

中央値は、得点に極端な(非常に高い、あるいは非常に低い)値が含まれているとき、それらの代表値を計算する際にしばしば利用されます。

 

最頻値は、中心傾向の測度としていちばん厳密性に欠けるが、データの中で最も多く現れる得点の値です。

 

最頻値は、名義的あるいはカテゴリー的なデータの場合によく用いられます。

 

平均値は、計算で求める代表値です。

 

平均値にはいくつかのタイプがありますが、算術平均とは、データを全部足してその数で割ったものです。

 

そのデータのバランスがとれている点、すなわちさまざまな得点からみて代表となるような点です。

 

これらの中心傾向の測度はそれぞれ異なるタイプのデータに用いられますが、最も重要な利用法の一つは、変動の測度と共にデータを記述し、標準得点を算出する基準点として用いることです。

 

付け加えるなら、どんなタイプのデータを扱うときにも興味深い応用上の問いは、代表的な得点と代表的でない得点あるいは典型的でない得点の間にどのような関係があるかということです。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学における中心傾向の測度とは【統計解析講義基礎】

統計学における中心傾向の測度とは【統計解析講義基礎】

統計学における中心傾向の測度とは【統計解析講義基礎】