分布の広がりを知るための数値|【ビジネス統計学・統計解析】
分布の広がりを知るための数値
データの広がりを数値化する
標準偏差で広がりを表現する
標準偏差は、データがどれくらいの範囲に広がっているのかを表す指標です。
標準偏差のことをシグマと呼ぶこともあります。
一般的には、平均値を中心にして、標準偏差の値だけプラスマイナスした範囲に、約68%のデータが集まっています。
この範囲のことを±1シグマ範囲と呼びます。
±2シグマ範囲には約95%、±3シグマ範囲には約99.7%のデータが集まっています。
分散は、標準偏差を2乗した値で、これも広がりの目安を表す指標です。
標準偏差の単位は、もとのデータと同じです。
例えば年収の標準偏差の単位は、円です。
しかし、分散は2乗しているので、単位も2乗されています。
これでは、どれくらい広がっているのかイメージをつけることは難しいです。
そのため、ビジネス統計では、分散よりも標準偏差を提示するほうが、広がりを直接的に表現することができます。
平均値だけでは、分布の特徴を表現するには不十分です。
分散と標準偏差を使うことで、分布の広がりの特徴を表すことができます。
関連記事