分散の加法則で解く日常の謎:通勤時間編【ChatGPT統計解析】
新しい変数(X+Y)の作成時、その平均値は変数XとYの平均値の合計となり、分散はXの分散、Yの分散、および2倍のXとYの共分散の合計です。変数XとYが相互に独立している場合、(X+Y)および(X−Y)の分散はXの分散とYの分散の合計に等しくなります。これを分散の加法則と呼びます。例えば、バスと電車での通勤時間を合計した場合の平均値は65分で、標準偏差は約12.2分になります。これは、統計学で分散の性質を理解するための重要な概念であり、実際のデータ解析にも応用されます。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
2つの変数の和の分散
変数XとYがあったとき、(X+Y)という新しい変数を作る。
この新しい変数の平均値はいくらでしょうか。
いうまでもなく、それぞれの変数の平均値の合計だとわかります。
たとえば、初婚夫婦の結婚年齢を考えましょう。
それが平均して、男性29歳、女性26歳とすれば、
結婚年齢計の平均値は29+26=55歳です。
では年齢計のバラツキはどうでしょうか。
2人とも非常に若いカップルからどちらも晩婚といった感じのカップルまで、その幅はかなり大きいでしょう。
その分散を計算してみましょう。
これはさほど簡単ではありませんが、直感的発想でいえば次のようになります。
(x+y)2=x2+2xy+y2
の2次式の展開からの類推で、以下の式が成立します。
変数(X+Y)の分散=Xの分散+2(X・Yの共分散)+Yの分散
これが変数の和の正しい分散の式です。
差(X−Y)の分散の場合は、上式右辺の真ん中の項がマイナスとなります。
分散の加法則
いま変数XとYがお互いに無関係であるとします。
このとき2つの変数の間には相関関係は発生しないし、したがって共分散も相関関係もゼロです。
すると先の式の真ん中の項が消えるので、
となります。
単純明快な関係です。
しかし実は、統計学ではこの分散の性質があるがゆえに、理論的な面で分散が大いに活躍することになります。
つけくわえると、変数(X−Y)の分散は、Xの分散−Yの分散 とはなりません。
こちらについても、
となります。
何となくおかしいような気がする人は、もし右辺の分散同士の引き算が成り立つのなら左辺の分散がマイナスになる可能性もあるわけですから、マイナスの分散こそ、より非常識であると考えられます。
毎朝の出勤所要時間の計算
自宅から会社までの所要時間は、バスの時間と電車の時間について、以下がわかっているとします。
バス時間: 平均値30分、標準偏差10分
電車時間: 平均値35分、標準偏差7分
このとき、毎朝の出勤所要時間はどのくらいか、その平均値および標準偏差を求めてみましょう。
解答
平均値: 30+35=65(分)
標準偏差: √(100+49)=12.2(分)
関連リンク