Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学で標準偏差の計算に自由度を用いる理由【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学で標準偏差の計算に自由度を用いる理由【統計解析講義基礎】

統計学で標準偏差の計算に自由度を用いる理由【統計解析講義基礎】


統計学で標準偏差の計算に自由度を用いる理由【統計解析講義基礎】

 

標準偏差とは、データにおいて、ある中心点からの各得点の平均的距離です。

 

そして、この平均は、距離の総計をデータ数で割ることによって計算されます。

 

しかし、このとき、標本の大きさ(サンプルサイズ)を表すnを用いる代わりにn−1を用いました。なぜでしょう。

 

統計量を積極的に使用する一般的な考え方は、統計的な結果が、検討されていることを可能な限り正確に指し示すという意味で、信頼できる値と結果を生み出すというものです。

 

私たちは、母集団の特徴を推定するために、標準偏差、分散の標本値を用いているということを忘れてはいけません。

 

標準偏差と分散の場合、これらの記述的指標は、母集団の測度の真値を過小に推定している可能性があるという意味で、偏りがあると考えられています。

 

この偏りを補正するために、標準偏差(そして分散)の式の分母から1を減じて、不偏推定値と呼ばれるものにします。

 

これにより、算出された値は真の母集団値を過大に推定するかもしれませんが、偏りのある値よりも、より正確な推定値であると考えられます。

 

そして、この偏りの修正について非常に興味深いことは、標本が小さいほど、偏りのある値から偏りのない値への修正がより重要になるということです。

 

論文では、たいてい、不偏推定量が報告されています。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学で標準偏差の計算に自由度を用いる理由【統計解析講義基礎】

統計学で標準偏差の計算に自由度を用いる理由【統計解析講義基礎】

統計学で標準偏差の計算に自由度を用いる理由【統計解析講義基礎】