四分位数と箱ヒゲ図で解き明かすデータの秘密

四分位数と箱ヒゲ図で解き明かすデータの秘密 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

四分位数と箱ヒゲ図で解き明かすデータの秘密

四分位数と箱ヒゲ図で解き明かすデータの秘密
四分位数は、データを順に並べた時に全体を4等分する点を指し、第1四分位数(Q1)、中央値(Q2)、第3四分位数(Q3)から成ります。Q1はデータの下25%を、Q2は中央値を、Q3は上25%を示します。これらはデータの分布、中央値、偏り、散らばりを把握する上で重要です。箱ヒゲ図では、これら四分位数を視覚化し、箱の下部(Q1)、中央(Q2)、上部(Q3)にそれぞれ表示し、データの分布や外れ値を一目で理解できるようにします。四分位数と箱ヒゲ図は、統計分析やデータサイエンスでデータの特性を明らかにするために広く用いられます。


目次  四分位数と箱ヒゲ図で解き明かすデータの秘密

 

四分位数(Quartile)とは

 

データを小さい方から順番に並べ同数に4等分したときに、全体の1/4、2/4、3/4の位置に相当する順序統計量四分位数といいます。

 

小さい方から第1四分位数、第2四分位数、第3四分位数といいます。

 

第2四分位数は中央値と同じです。

 

例えば以下の例で考えてみましょう。全部で9つのデータを、以下のように小さいものから順に並べました。

 

1  2  5  7  10  11  14  17  19

 

先ず、中央値はいくつでしょう。

 

これはすぐわかりますね。順番にならべた真ん中の値ですから、10が中央値です。

 

これを別の見方をすると、自分自身の10を除くと全部で8個のデータがありますが、10より小さい値は1、2、5、7の4個です。

 

パーセント値は、自分より小さい値の数/自分を除く全データ数 ×100 で計算できますので、

 

10は、4/8×100=50%値 ということができます。

 

中央値=50%値=第2四分位数 です。

 

今度は、上のデータの7について考えてみます。

 

自分自身の7を除くと全部で8個のデータです。このうち、7より小さい数は1,2の2個だけです。

 

したがって、2/8×100=25%値 ということができます。

 

25%値=第1四分位数 です。

 

今度は、上のデータの14について考えてみます。

 

自分自身の14を除くと全部で8個のデータです。このうち、14より小さい数は1、2、5、7、10、11の6個です。

 

したがって、6/8×100=75%値 ということができます。

 

75%値=第3四分位数 です。

 

 

四分位数は箱ヒゲ図の箱の上・中・下

 

順序統計量を視覚化する手法として、箱ヒゲ図という記述統計の手法があります。

 

四分位数と箱ヒゲ図で解き明かすデータの秘密

 

このように、最小値の最大値をヒゲの先端、第1〜3四分位数を箱で表した図を箱ヒゲ図といいます。

 

実際に箱ヒゲ図を作成する機会というのは少ないかと思いますが、論文でたまに登場するのでその意味は理解しておく必要があります。

 

第1四分位数は箱の最下部、第2四分位数は箱の中を貫く(中央とは限りません)、第3四分位数は箱の最上部です。

 

 

四分位数と箱ヒゲ図で解き明かすデータの秘密


セミナー詳細                    解析ご相談                    LINEでお友達

 

 

四分位数と箱ヒゲ図で解き明かすデータの秘密

四分位数と箱ヒゲ図で解き明かすデータの秘密