全体像を知るためのツール|【ビジネス統計学・統計解析】
全体像を知るためのツール
平均値は必ずしも真ん中ではありません。
平均は、データの中心がどれくらいの値なのかを表しています。
全てのデータの値を足し、データの個数で割った値が平均値です。
中心を表す指標ではありますが、データの真ん中の値でないことに注意が必要です。
真ん中の値を表す指標は、中央値と呼ばれます。
中央値は、9個の値があったときに、ちょうど真ん中である5番目の値を表します(偶数個あれば、真ん中の2つの値の平均値が中央値になります)。
もうひとつデータの中心を表す指標として、最頻値と呼ばれるものがあります。
これは、最もたくさんあるデータの値を示す指標です。
数値でなくても、男性女性のような名義変数にも最頻値は使えます。
一方、平均値や中央値は数値にしか使えず、男性女性のような名義変数には使えません。
左右が完全対称に分布しているデータは、平均値、中央値、最頻値の3つの指標は同じ値になります。
反対に、左右が対称になっていない分布は、これら3つの指標は異なる値になるので注意が必要です。
平均値は、分布が長くなっているほうに引っ張られる性質があります。
統計的な性質として値を並べると、平均値、中央値、最頻値の順番になることが知られています。
平均値が必ずしも真ん中を表現しているとは限らないことに注意しながら、統計データを見るようにしましょう。
関連記事