統計学における変動の分解|【実験計画法の統計学・統計解析】
実験データのバラツキを因子や誤差の要因に分解できれば、因子の影響を正確に評価できると考えられる。一般的に、実験では因子によってデータが得られる。データの変動を偏差平方和で表し、因子成分に分解することを検討する。総変動Sは個々のデータと全体平均の差の平方和であり、因子の水準間の変動SAは各水準の平均値が全体平均からのばらつき、水準内変動SEは各水準内のデータが平均値からのばらつきを表す。この分解から、データの総変動は因子の水準変動と水準内の誤差変動に分解される。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
統計学における変動の分解
実験によって得られたデータのバラツキが、もし因子や誤差の要因成分に分解することができるのなら、因子の効果を合理的に判定できるでしょう、と直感的に考えました。
はたして、データの変動をうまく分解することができるのでしょうか。
一般に、因子を1つとり上げた実験では、表のような形式のデータが得られます。
今、データの変動を偏差平方和(sum of squares)で表すとして、要因成分に分解することを検討してみましょう。
先ず、総変動Sは、個々のデータと総平均との差の平方和ですから、
と表すことができます。
因子Aの水準間の変動、すなわち級間変動(SA)は、各水準の平均値が総平均に対してどのようにばらつくかで表せばよいですから、
となります。
さらに、各水準内での変動、すなわち級内変動(SE)は、個々のデータが各水準の平均値に対してどのようにばらつくかで表せばよいですから、
と定義することができます。そして、
ここで右辺を展開すると、
となります。しかるに、右辺の第二項は、
この結果を代入すると、
となります。よって、
の関係となります。
すなわち、データの総変動が、因子の水準を変えたための変動、水準の中の誤差変動という2つの要因に分解できたことになります。
では実際に計算してみましょう。
総変動Sは、
同様に、SAを求めると、
さらに、SEを求めると、
上式の関係から、
すなわち、
一般には、数字の丸めにおける誤差の範囲内で、上式が成立します。
関連記事