標準偏差とパーセンタイル:データの真実【ChatGPT統計解析】
標準偏差はデータのばらつきを示すが、正規分布を前提とするため、他の分布では有効ではない。正規分布以外の場合はパーセンタイルを利用し、最小値、第1四分位点、中央値、第3四分位点、最大値で表現することが一般的。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
標準偏差とパーセンタイル
2つの指標を使い分ける
正規分布でないデータの指標化
標準偏差はデータの広がりを表す指標ですが、データが正規分布の形になっていることが前提ですので、注意が必要です。
データが正規分布に従っているときには、1シグマ範囲に68%のデータが入りますが、データが正規分布から大きく離れた分布の形をしているときはこの性質は成り立ちません。
正規分布になっていないデータの広がりを表すときには、標準偏差ではなくパーセンタイルを利用します。
パーセンタイルは、値の小さい順にデータを並べ替えたとき、あるパーセントの順番にあるデータの値を示します。
例えば、0パーセンタイルは最小値で、100パーセンタイルは最大値、50パーセンタイルは中央値と同じ値になります。
正規分布の形をしていないデータの広がりを表現するときは、最小値、25パーセンタイル、中央値、75パーセンタイル、最大値を利用することが多いです。
25パーセンタイルのことを第1四分位点、75パーセンタイルのことを第3四分位点と呼ぶこともあります。
関連記事