Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における分散の加法則【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における分散の加法則【統計解析講義基礎】

統計学における分散の加法則【統計解析講義基礎】


統計学における分散の加法則【統計解析講義基礎】

2つの変数の和の分散

 

変数XとYがあったとき、(X+Y)という新しい変数を作る。

 

この新しい変数の平均値はいくらでしょうか。

 

いうまでもなく、それぞれの変数の平均値の合計だとわかります。

 

たとえば、初婚夫婦の結婚年齢を考えましょう。

 

それが平均して、男性29歳、女性26歳とすれば、

 

結婚年齢計の平均値は29+26=55歳です。

 

では年齢計のバラツキはどうでしょうか。

 

2人とも非常に若いカップルからどちらも晩婚といった感じのカップルまで、その幅はかなり大きいでしょう。

 

その分散を計算してみましょう。

 

これはさほど簡単ではありませんが、直感的発想でいえば次のようになります。

 

(x+y)2=x2+2xy+y2

 

の2次式の展開からの類推で、以下の式が成立します。

 

変数(X+Y)の分散=Xの分散+2(X・Yの共分散)+Yの分散

 

これが変数の和の正しい分散の式です。

 

差(X−Y)の分散の場合は、上式右辺の真ん中の項がマイナスとなります。

 

分散の加法則

 

いま変数XとYがお互いに無関係であるとします。

 

このとき2つの変数の間には相関は発生しないし、したがって共分散も相関係数もゼロです。

 

すると先の式の真ん中の項が消えるので、

 

変数(X+Y)の分散=Xの分散+Yの分散

 

となります。

 

単純明快な関係です。

 

しかし実は、統計学ではこの分散の性質があるがゆえに、理論的な面で分散が大いに活躍することになります。

 

つけくわえると、変数(X−Y)の分散は、Xの分散−Yの分散 とはなりません。

 

こちらについても、

 

変数(X−Y)の分散=Xの分散+Yの分散

 

となります。

 

何となくおかしいような気がする人は、もし右辺の分散同士の引き算が成り立つのなら左辺の分散がマイナスになる可能性もあるわけですから、マイナスの分散こそ、より非常識であると考えられます。

 

毎朝の出勤所要時間の計算

 

自宅から会社までの所要時間は、バスの時間と電車の時間について、以下がわかっているとします。

 

バス時間: 平均30分、標準偏差10分
電車時間: 平均35分、標準偏差7分

 

このとき、毎朝の出勤所要時間はどのくらいか、その平均値および標準偏差を求めてみましょう。

 

解答

 

平均値: 30+35=65(分)
標準偏差: √(100+49)=12.2(分)

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学における分散の加法則【統計解析講義基礎】

統計学における分散の加法則【統計解析講義基礎】

統計学における分散の加法則【統計解析講義基礎】