Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における中心傾向の測度の決め方【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における中心傾向の測度の決め方【統計解析講義基礎】

統計学における中心傾向の測度の決め方【統計解析講義基礎】


統計学における中心傾向の測度の決め方【統計解析講義基礎】

 

中心傾向のどの測度を用いるべきかは、基本的に、検討しようとしているデータの種類に依存します。

 

以下、どの測度をいかなるときに選択すべきについてまとめました。

 

@データが実質的にカテゴリーあるいは名義尺度であれば、最頻値を用います。

 

カテゴリーデータあるいは名義尺度のデータは、いずれか1つのカテゴリーにのみ当てはまり、ラベルや名前によってのみ、その値を区別することができる情報です。

 

量的な値はありません。これらの例は、髪の色、所属する政党、車種、好きな野球チームなどです。

 

たとえば、政治マニアの集まりで、所属政党の値は、共和党、民主党、無党派であったとしましょう。

 

この集まりの所属政党に関する最も代表的な値を決める場合、共和党員の出席者の数が最も多ければ、それが最頻値であり、中心傾向の最も正確な測度となります。

 

Aもしデータに極端な値が含まれていれば、中心傾向の最も適切な測度は中央値です。

 

たとえば、ある大都市における家屋の代表的な価格を決める必要がある場合、非常に高価な家もあれば非常に安価な家もあることがわかっていたなら、最も適切な測度は中央値でしょう。

 

なぜなら、中央値は極端な値に左右されないからです。

 

Bもしデータがカテゴリーでなく、極端な得点も含んでいなければ、使用する中心傾向の測度として、平均値が最も適切です。

 

たとえば、ある6年生のグループにおける単語の書き取り得点の代表値を算出する必要があり、20問中正しく書けた単語の数を得点としていたなら、平均値が正しい選択です。

 

以下は、これら3つの測度の区別に関して覚えておくべき重要な2つの事項です。

 

@平均値は中央値よりもより精密であり、中央値は最頻値よりもより精密です。可能であれば、最も精密な測度である平均値を使いましょう。

 

A平均値を用いて結果を表すことができるなら、おそらくは中央値、あるいは最頻値でも結果を表すことができるでしょう。

 

同様に、中央値を用いて結果を表すことができるなら、最頻値でも表すことができるでしょう。

セミナー詳細こちら                    解析ご相談こちら


 

統計学における中心傾向の測度の決め方【統計解析講義基礎】

統計学における中心傾向の測度の決め方【統計解析講義基礎】

統計学における中心傾向の測度の決め方【統計解析講義基礎】