中央値と度数分布|累積度数分布の50%の横線との交点から下ろした垂線の位置が中央値【統計学・統計解析講義基礎】
中央値は、中位数またはメディアン(median)とも呼ばれ、データを大きさの順に並べたときちょうど真ん中にくる値。累積度数分布の、50%の横線と分布の折れ線の交点から下ろした、垂線の足の位置が中央値
中央値と度数分布
中央値は、中位数またはメディアン(median)とも呼ばれます。
いくつかのデータがあって、それらを大きさの順に並べたとき、ちょうど真ん中にくる値です。
データの個数が偶数のときは、真ん中に近い2つのデータの平均をとってそれを中央値とします。
学校の生徒を、背の高さの順に横でも縦でも1列に整列させます。
その列のちょうど真ん中の生徒の身長が、中央値です。
中央値の説明はまさしくそれにつきます。
平均値とちがってまわりくどくありません。
きわめて具体的直截的です。
なお、付け加えるならば、この場合、真ん中の生徒の身長だけを測ればいいのです。
100人いたら50番目と51番目だけ測って、あとの98人は不要です。
平均値がほしいなら、もちろん100人分、全部測らなければなりません。
だから中央値がすぐれていると早合点してはいけません。
たまたま、身長の例では並べて目でみれば高いか低いかわかるからなのです。
10個のリンゴの重さの中央値はどうか、見た感じで並べるのを試してもいいですが、そう簡単ではありません。
この場合は平均値のほうが10個まとめて測って10で割り算すればいいので、はるかに手っ取り早いといえます。
累積度数分布の50%の横線との交点
度数分布が与えられたとき、それから正確な中央値を求めることはできません。
しかし、どのクラスに中央値が含まれているかはわかります。
度数分布の端のほうからデータ個数を順に勘定していけば、それが半数を越えたときのクラスに、中央値が含まれています。
この場合、もし累積度数分布が描かれていれば、50%の横線と分布の折れ線の交点から下ろした、垂線の足の位置が中央値にあたります。
先の「平均値は度数分布の重心」という話に似ていますが、度数分布の絵の上で垂直の線を移動させ、その線で切られる分布の左右の面積がちょうど等しくなるあたりに見当をつけて、そのときの線の位置が中央値なのです。
左右の面積はそれぞれ左右の度数トータルに他ならないので、当然その境界が中央値になります。
またよけいな話ですが、目で見当をつけて面積を等分するという技術が要求されることが何かあるでしょうか。
昔、子沢山の母親は、子どもたちが見守るなかで1枚のパイを誤りなく等分するという、すばらしい技術を身につけていました。
関連リンク