平均、中央値、最頻値:データの心を読む【ChatGPT統計解析】
平均値はデータの中心を表すが、必ずしも真ん中の値ではない。中央値はデータの真ん中の値であり、最頻値は最も出現頻度の高い値を表す。平均値や中央値、最頻値は対称な分布では同じ値になるが、非対称な分布では異なる。平均値は長くなった分布に引っ張られる性質がある。値を並べると平均値、中央値、最頻値の順番になるが、統計データを解釈する際には平均値が必ずしも真ん中を表すとは限らないことに注意が必要。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
全体像を知るためのツール
平均値は必ずしも真ん中ではありません。
平均は、データの中心がどれくらいの値なのかを表しています。
全てのデータの値を足し、データの個数で割った値が平均値です。
中心を表す指標ではありますが、データの真ん中の値でないことに注意が必要です。
真ん中の値を表す指標は、中央値と呼ばれます。
中央値は、9個の値があったときに、ちょうど真ん中である5番目の値を表します(偶数個あれば、真ん中の2つの値の平均値が中央値になります)。
もうひとつデータの中心を表す指標として、最頻値と呼ばれるものがあります。
これは、最もたくさんあるデータの値を示す指標です。
数値でなくても、男性女性のような名義変数にも最頻値は使えます。
一方、平均値や中央値は数値にしか使えず、男性女性のような名義変数には使えません。
左右が完全対称に分布しているデータは、平均値、中央値、最頻値の3つの指標は同じ値になります。
反対に、左右が対称になっていない分布は、これら3つの指標は異なる値になるので注意が必要です。
平均値は、分布が長くなっているほうに引っ張られる性質があります。
統計的な性質として値を並べると、平均値、中央値、最頻値の順番になることが知られています。
平均値が必ずしも真ん中を表現しているとは限らないことに注意しながら、統計データを見るようにしましょう。
関連記事