標準偏差の計算に自由度を用いる理由|母集団の測度の真値を過小に推定している可能性【統計学・統計解析講義基礎】
母集団の特徴を推定するために、標準偏差、分散の標本値を用いているが、これらの記述的指標は、母集団の測度の真値を過小に推定している可能性があるという意味で、偏りがあると考えられる。この偏りを補正するために、標準偏差(そして分散)の式の分母から1を減じて、不偏推定値としている
標準偏差の計算に自由度を用いる理由
標準偏差とは、データにおいて、ある中心点からの各得点の平均的距離です。
そして、この平均値は、距離の総計をデータ数で割ることによって計算されます。
しかし、このとき、標本の大きさ(サンプルサイズ)を表すnを用いる代わりにn−1を用いました。なぜでしょう。
統計量を積極的に使用する一般的な考え方は、統計的な結果が、検討されていることを可能な限り正確に指し示すという意味で、信頼できる値と結果を生み出すというものです。
私たちは、母集団の特徴を推定するために、標準偏差、分散の標本値を用いているということを忘れてはいけません。
標準偏差と分散の場合、これらの記述的指標は、母集団の測度の真値を過小に推定している可能性があるという意味で、偏りがあると考えられています。
母集団の測度の真値を過小に推定している可能性
この偏りを補正するために、標準偏差(そして分散)の式の分母から1を減じて、不偏推定値と呼ばれるものにします。
これにより、算出された値は真の母集団値を過大に推定するかもしれませんが、偏りのある値よりも、より正確な推定値であると考えられます。
そして、この偏りの修正について非常に興味深いことは、標本が小さいほど、偏りのある値から偏りのない値への修正がより重要になるということです。
論文では、たいてい、不偏推定量が報告されています。
関連リンク