四分位数:順序統計量|箱ヒゲ図の箱の上・中・下【統計学・統計解析講義基礎】
四分位数は、データを小さい方から順番に並べ同数に4等分したときに、全体の1/4、2/4、3/4の位置に相当する順序統計量。小さい方から第1四分位数、第2四分位数、第3四分位数。四分位数は箱ヒゲ図の箱の上・中・下
四分位数(Quartile)とは
データを小さい方から順番に並べ同数に4等分したときに、全体の1/4、2/4、3/4の位置に相当する順序統計量を四分位数といいます。
小さい方から第1四分位数、第2四分位数、第3四分位数といいます。
第2四分位数は中央値と同じです。
例えば以下の例で考えてみましょう。全部で9つのデータを、以下のように小さいものから順に並べました。
1 2 5 7 10 11 14 17 19
先ず、中央値はいくつでしょう。
これはすぐわかりますね。順番にならべた真ん中の値ですから、10が中央値です。
これを別の見方をすると、自分自身の10を除くと全部で8個のデータがありますが、10より小さい値は1、2、5、7の4個です。
パーセント値は、自分より小さい値の数/自分を除く全データ数 ×100 で計算できますので、
10は、4/8×100=50%値 ということができます。
中央値=50%値=第2四分位数 です。
今度は、上のデータの7について考えてみます。
自分自身の7を除くと全部で8個のデータです。このうち、7より小さい数は1,2の2個だけです。
したがって、2/8×100=25%値 ということができます。
25%値=第1四分位数 です。
今度は、上のデータの14について考えてみます。
自分自身の14を除くと全部で8個のデータです。このうち、14より小さい数は1、2、5、7、10、11の6個です。
したがって、6/8×100=75%値 ということができます。
75%値=第3四分位数 です。
四分位数は箱ヒゲ図の箱の上・中・下
順序統計量を視覚化する手法として、箱ヒゲ図という記述統計の手法があります。
このように、最小値の最大値をヒゲの先端、第1〜3四分位数を箱で表した図を箱ヒゲ図といいます。
実際に箱ヒゲ図を作成する機会というのは少ないかと思いますが、論文でたまに登場するのでその意味は理解しておく必要があります。
第1四分位数は箱の最下部、第2四分位数は箱の中を貫く(中央とは限りません)、第3四分位数は箱の最上部です。