偏差は絶対値でなく2乗する|絶対値は中の値の正負で別の手続きが必要【統計学・統計解析講義基礎】
偏差は個々のデータについてですが、データを総合的にみたばらつきを表現するのには偏差平方和を用い、さらに、偏差平方和はデータの数に依存するため、データの数に依存しない平均のばらつきの指標として、偏差平方和をデータの数で割った分散が用いられる。2乗の計算は、どんな数に対しても同じ手続きでできるが、絶対値の計算は、中の値の正負で別の手続きが必要で煩雑なため、偏差の2乗の平均である分散が用いられている
偏差は絶対値でなく2乗する
データのばらつきを端的に表現したものが偏差です。
偏差は、各データの値から平均を引いたものです。
偏差は個々のデータについてですが、データを総合的にみたばらつきを表現するのには、偏差平方和を用います。
さらに、偏差平方和はデータの数に依存するため、データの数に依存しない平均のばらつきの指標として、偏差平方和をデータの数で割った分散が用いられます。
言い換えれば、分散は偏差の2乗の平均ということができます。
なぜ偏差の絶対値をとらず2乗するのか
たしかに、偏差の絶対値を使って計算しても、偏差を全部正の値にしてから平均するという目的は達せられます。
しかし、絶対値の計算は2乗よりも一見簡単そうですが、実はそうではありません。
絶対値は中の値の正負で別の手続きが必要
2乗の計算は、どんな数に対しても同じ手続きでできますが、絶対値の計算は、そのなかの値が正の数と負の数となるそれぞれの場合で別の手続きが必要なのです。
実際、高校の数学には、Y=|2X+3|のグラフを描け、といったややこしい場合分けをする問題がよく出てきます。
こういう煩雑さを避けたいという事情で、偏差の絶対値の平均はあまり用いられず、偏差の2乗の平均である分散が用いられているのです。
また、2乗を考えると、これを3乗、4乗、・・・・に発展させることもできます。
これらは分布のモーメントと呼ばれているもので、これらもまた分散の特徴を表しています。
関連リンク