Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学では絶対値でなく2乗する【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学では絶対値でなく2乗する【統計解析講義基礎】

統計学では絶対値でなく2乗する【統計解析講義基礎】


統計学では絶対値でなく2乗する【統計解析講義基礎】

偏差・偏差平方和・分散

 

データのばらつきを端的に表現したものが偏差です。

 

偏差は、各データの値から平均を引いたものです。

 

偏差は個々のデータについてですが、データを総合的にみたばらつきを表現するのには、偏差平方和を用います。

 

さらに、偏差平方和はデータの数に依存するため、データの数に依存しない平均のばらつきの指標として、偏差平方和をデータの数で割った分散が用いられます。

 

言い換えれば、分散は偏差の2乗の平均ということができます。

 

なぜ偏差の絶対値をとらず2乗するのか

 

たしかに、偏差の絶対値を使って計算しても、偏差を全部正の値にしてから平均するという目的は達せられます。

 

しかし、絶対値の計算は2乗よりも一見簡単そうですが、実はそうではありません。

 

2乗の計算は、どんな数に対しても同じ手続きでできますが、絶対値の計算は、そのなかの値が正の数と負の数となるそれぞれの場合で別の手続きが必要なのです。

 

実際、高校の数学には、Y=|2X+3|のグラフを描け、といったややこしい場合分けをする問題がよく出てきます。

 

こういう煩雑さを避けたいという事情で、偏差の絶対値の平均はあまり用いられず、偏差の2乗の平均である分散が用いられているのです。

 

また、2乗を考えると、これを3乗、4乗、・・・・に発展させることもできます。

 

これらは分布のモーメントと呼ばれているもので、これらもまた分散の特徴を表しています。

セミナー詳細こちら                    解析ご相談こちら


 

統計学では絶対値でなく2乗する【統計解析講義基礎】

統計学では絶対値でなく2乗する【統計解析講義基礎】

統計学では絶対値でなく2乗する【統計解析講義基礎】