統計学における変動の分解|【実験計画法の統計学・統計解析】
統計学における変動の分解
実験によって得られたデータのバラツキが、もし因子や誤差の要因成分に分解することができるのなら、因子の効果を合理的に判定できるでしょう、と直感的に考えました。
はたして、データの変動をうまく分解することができるのでしょうか。
一般に、因子を1つとり上げた実験では、表のような形式のデータが得られます。
今、データの変動を偏差平方和(sum of squares)で表すとして、要因成分に分解することを検討してみましょう。
先ず、総変動Sは、個々のデータと総平均との差の平方和ですから、
と表すことができます。
因子Aの水準間の変動、すなわち級間変動(SA)は、各水準の平均値が総平均に対してどのようにばらつくかで表せばよいですから、
となります。
さらに、各水準内での変動、すなわち級内変動(SE)は、個々のデータが各水準の平均値に対してどのようにばらつくかで表せばよいですから、
と定義することができます。そして、
ここで右辺を展開すると、
となります。しかるに、右辺の第二項は、
この結果を代入すると、
となります。よって、
の関係となります。
すなわち、データの総変動が、因子の水準を変えたための変動、水準の中の誤差変動という2つの要因に分解できたことになります。
では実際に計算してみましょう。
総変動Sは、
同様に、SAを求めると、
さらに、SEを求めると、
上式の関係から、
すなわち、
一般には、数字の丸めにおける誤差の範囲内で、上式が成立します。
関連記事