平均への回帰の例:回帰直線|父親と息子の身長・世帯員数とある商品の購入量【統計学・統計解析講義基礎】
身長の高い父親ほどその息子の身長は父親より低く、身長の低い父親ほどその息子の身長は父親より高い。世帯員数に対して購入量があと戻りするのは、収入が限られているのでほしいものを我慢して引っ込めようという意図が示唆される
父子の身長のグラフ
いま、たくさんの父親と息子について、その身長を点グラフに表してみます。
図のグラフの横軸が父親の身長、縦軸が息子の身長です。
また、1つ1つの点はそれぞれ父親・息子の組です。
また、グラフの中の傾斜した線(実線)は、それらの点の集まりの真ん中を通過するように引いたものです。
もし、父親と息子の身長が等しくなるという傾向があるならば、この線は原点のゼロを通って45度の傾斜を持つ(点線)はずですが、どうも見たところそうはなりません。
父親と息子の身長のグラフの中心を通って引かれている直線こそ、まさにゴールトンの述べた、身長の高い父親ほどその息子の身長は父親より低く、身長の低い父親ほどその息子の身長は父親より高いという、回帰現象を表すのです。
この直線は回帰直線と呼ばれています。
購入量の回帰直線
次のグラフは、世帯員数とある商品の購入量との関係を表したものです。
対象数は10世帯です。
ここでも10個の点の間を通って、直線が右上がりに引かれています。
この線によって、世帯員数が多くなると購入量も多くなる傾向が示されます。
この直線もやはり回帰直線と呼ばれています。
世帯員数と購入量では、ゴールトンが感激してその意味を託した回帰という用語とは縁もゆかりもないものになっています。
英語のregressionを辞書で見ると、あと戻り、復帰、退歩などとあります。
そして最後に(統計)回帰とありました。
なぜ世帯員数に対して購入量があと戻りするのでしょうか。
家族が増えるほど購入量は増えません。なにせ収入が限られていますから、といってほしいものを我慢して引っ込めようという皮肉な意味がこめられているかもしれません。
要するに、変数X、Yで点グラフを描いて、その間を通る直線を引けば、意味があってもなくても、それを回帰直線と呼ぶのです。
関連リンク