Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学におけるスチューデントのt分布【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学におけるスチューデントのt分布【統計解析講義基礎】

統計学におけるスチューデントのt分布【統計解析講義基礎】


統計学におけるスチューデントのt分布【統計解析講義基礎】

t統計量

 

母集団分布が母平均μ、母分散σ2の正規分布であり、そこからサイズnの標本をとりだしたときの標本平均がXであるとき

 

Z=(X−μ)/√(σ2/n)

 

とおくと、Zは標準正規分布N(0, 1)にしたがいます。

 

では、母分散σ2が不明であるとしましょう。

 

このときは、μとσ2の2つの未知量がありますから、これでは母平均μの区間推定ができません。

 

そこで、母分散σ2を、標本から計算される不偏分散s2で置き換えた、

 

t=(X−μ)/√(s2/n)

 

というものを考えます。このtをt統計量といいます。

 

不偏分散の不偏とは、簡単にいえば「ひいきをしない」ということです。

 

たとえば、野球の試合を考えてみましょう。

 

審判の間違いはもちろん少ないほうがいいんですが、審判も人間だから間違えることがあるのは仕方ありません。

 

しかし、その間違いが、片方のチームが有利になるような間違いばかりであっては困ります。つまり、審判は何よりもまず「不偏」でなければならないのです。

 

t統計量の分布

 

Zは標準正規分布にしたがいますが、tすなわちt統計量はどのような分布にしたがうでしょうか。

 

このt統計量がしたがう確率分布は、標準正規分布に似てはいますが、微妙に違っています。

 

それは自由度n−1のt分布(スチューデントのt分布)という確率分布で、

 

これをt(n−1)と書きます。

 

t分布の確率密度関数は標準正規分布とよく似ており、t=0を中心とした左右対称の形になっています。

 

t分布を発見したゴセット

 

このt分布を発見した(ここが重要ですが、考案ではなく発見です)は、英国の統計学者ウィリアム・ゴセットです。

 

ゴセットはギネスビール社のエンジニアで、会社との契約で本名では論文が出せなかったため、ペンネームの「スチューデント」で発表したのだそうです。

 

酒造りなどの醸造業は、昔から統計学が活躍している分野です。

 

それは、酒などができる醗酵という現象は、技術者が自分の手で直接行っているものではなく、無数の微生物の作用や分子の化学反応によって生じるものだからです。

 

技術者は、微生物や分子の作用を、温度や時間などの全体的な量を変化させて調節しているだけです。

 

どう調節すれば、無数の微生物や分子の作用が「全体として」望ましい方向に進むかを知るには、統計学の手法が必要です。

セミナー詳細こちら                    解析ご相談こちら


 

統計学におけるスチューデントのt分布【統計解析講義基礎】

統計学におけるスチューデントのt分布【統計解析講義基礎】

統計学におけるスチューデントのt分布【統計解析講義基礎】