標準偏差:データ広がりの直感的指標【ChatGPT統計解析】
標準偏差は、データの範囲を示す指標であり、シグマとも呼ばれる。一般的に、平均値からプラスマイナス1シグマの範囲に約68%、2シグマに約95%、3シグマに約99.7%のデータが含まれる。分散は標準偏差の2乗であり、同じ単位を持つが、広がりの具体的なイメージは難しい。したがって、ビジネス統計では標準偏差の方が分布の広がりをより直接的に示す。平均値だけでは分布の特徴を十分に表現できず、分散と標準偏差を使用することで、広がりをより詳細に把握できる。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
分布の広がりを知るための数値
データの広がりを数値化する
標準偏差で広がりを表現する
標準偏差は、データがどれくらいの範囲に広がっているのかを表す指標です。
標準偏差のことをシグマと呼ぶこともあります。
一般的には、平均値を中心にして、標準偏差の値だけプラスマイナスした範囲に、約68%のデータが集まっています。
この範囲のことを±1シグマ範囲と呼びます。
±2シグマ範囲には約95%、±3シグマ範囲には約99.7%のデータが集まっています。
分散は、標準偏差を2乗した値で、これも広がりの目安を表す指標です。
標準偏差の単位は、もとのデータと同じです。
例えば年収の標準偏差の単位は、円です。
しかし、分散は2乗しているので、単位も2乗されています。
これでは、どれくらい広がっているのかイメージをつけることは難しいです。
そのため、ビジネス統計では、分散よりも標準偏差を提示するほうが、広がりを直接的に表現することができます。
平均値だけでは、分布の特徴を表現するには不十分です。
分散と標準偏差を使うことで、分布の広がりの特徴を表すことができます。
関連記事