データ種類別!中心傾向測度の選び方ガイド【ChatGPT統計解析】
中心傾向の測度選択はデータの種類による。名義尺度やカテゴリーデータでは最頻値が適切。極端値を含む場合は中央値が最も適切であり、それ以外で精密な測定が可能な場合は平均値が最良。平均は中央値より精密、中央値は最頻値よりもそう。カテゴリーデータには最頻値、極端値が影響する状況では中央値、平均が使用可能ならそれが最適。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
中心傾向の測度の決め方
中心傾向のどの測度を用いるべきかは、基本的に、検討しようとしているデータの種類に依存します。
以下、どの測度をいかなるときに選択すべきについてまとめました。
@データが実質的にカテゴリーあるいは名義尺度であれば、最頻値を用います。
カテゴリーデータあるいは名義尺度のデータは、いずれか1つのカテゴリーにのみ当てはまり、ラベルや名前によってのみ、その値を区別することができる情報です。
量的な値はありません。これらの例は、髪の色、所属する政党、車種、好きな野球チームなどです。
たとえば、政治マニアの集まりで、所属政党の値は、共和党、民主党、無党派であったとしましょう。
この集まりの所属政党に関する最も代表的な値を決める場合、共和党員の出席者の数が最も多ければ、それが最頻値であり、中心傾向の最も正確な測度となります。
Aもしデータに極端な値が含まれていれば、中心傾向の最も適切な測度は中央値です。
たとえば、ある大都市における家屋の代表的な価格を決める必要がある場合、非常に高価な家もあれば非常に安価な家もあることがわかっていたなら、最も適切な測度は中央値でしょう。
なぜなら、中央値は極端な値に左右されないからです。
Bもしデータがカテゴリーでなく、極端な得点も含んでいなければ、使用する中心傾向の測度として、平均値が最も適切です。
たとえば、ある6年生のグループにおける単語の書き取り得点の代表値を算出する必要があり、20問中正しく書けた単語の数を得点としていたなら、平均値が正しい選択です。
平均値・中央値・最頻値のどれを用いるべきか
以下は、これら3つの測度の区別に関して覚えておくべき重要な2つの事項です。
@平均値は中央値よりもより精密であり、中央値は最頻値よりもより精密です。可能であれば、最も精密な測度である平均値を使いましょう。
A平均値を用いて結果を表すことができるなら、おそらくは中央値、あるいは最頻値でも結果を表すことができるでしょう。
同様に、中央値を用いて結果を表すことができるなら、最頻値でも表すことができるでしょう。
関連リンク