Python・R・エクセルによるデータサイエンス | 統計解析講義

統計解析における分散の不偏性【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計解析における分散の不偏性【統計解析講義基礎】

統計解析における分散の不偏性【統計解析講義基礎】

統計解析における分散の不偏性【統計解析講義基礎】

目次  統計解析における分散の不偏性【統計解析講義基礎】


分散の不偏性

標本の平均は、母平均の良い推定になります。これを不偏性といいます。

 

標本をランダムに抽出し、抽出する標本のサイズ(標本の中のデータの数)が大きいほど、より良い推定になります。

 

さて、それでは標本の分散は、母分散の良い推定になるでしょうか。

 

実は分散の不偏性が成立するためには、あるトリッキーな作業が必要です。

 

それは、標本の数から1を引いて計算するということです。

 

つまり分散の計算は偏差平方和をnで割りますが、nではなく、n−1つまり自由度で割ります。

 

これを不偏分散といいます。

 

母分散を推定する際には、不偏分散のほうが良い推定になるのです。

 

母標準偏差の推定も、不偏分散の平方根が良い推定になります。

 

なぜ1を引くのかというのはとても難しい話なので、覚えるしかありません。

 

昔アイルランドの首都ダブリンにあるギネスビール工場で品質管理の仕事をしていたゴセットという技師がいました。

 

ビールの麦芽汁を発酵させる酵母の数を測定することはビールの品質を安定させるために重要です。

 

しかし、測定の際に容器の中の酵母液全体を調べるわけにはいけません。

 

そこで、ゴセットは容器の中から数滴の小標本をとり出して、酵母の数を数えるということを何度も繰り返し行いました。
そしてその数の分布を調べたところ、標準正規分布(平均が0、分散が1の正規分布)から少しずれた分布であることを発見しました。

 

標準正規分布とt-分布

標準正規分布より少し裾野が広い分布(t-分布と呼びます)で、この分布の方が推定に適していることを見出したのです。

 

母集団の分布(標準正規分布)と、標本から得られた分布(t-分布)は、少しだけ違うのです。

 

この「少しだけ」の違いというのが、先に述べた母分散の式の分母nをn−1とすることにより解決されます。

 

Nが十分大きければ、t-分布はほとんど標準正規分布と同じになります。

 

標本の平均は母平均の良い推定値ですが、標本の分散の場合は、分母から1を引くと、母分散の良い推定になる、ということです。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計解析における分散の不偏性【統計解析講義基礎】

統計解析における分散の不偏性【統計解析講義基礎】

統計解析における分散の不偏性【統計解析講義基礎】