身長と購入量の不思議な関係:統計学で解く【ChatGPT統計解析】
このテキストは統計学に関する例として、「身長の高い父親とその息子」と「世帯員数と商品の購入量」の関係を示しています。父親が身長が高い場合、その息子の身長は平均より低くなる傾向があり、その逆もまた真であることを示す「平均への回帰」の現象が観察されます。一方で、世帯員数が多い家庭では、収入の制限から必要なものを我慢する傾向があり、購入量が必ずしも多くなるわけではないことが示唆されています。これらの関係はグラフ上で点として表され、その中を通る直線が回帰直線として描かれており、これにより変数間の関係性が解析されています。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
父子の身長のグラフ
いま、たくさんの父親と息子について、その身長を点グラフに表してみます。
図のグラフの横軸が父親の身長、縦軸が息子の身長です。
また、1つ1つの点はそれぞれ父親・息子の組です。
また、グラフの中の傾斜した線(実線)は、それらの点の集まりの真ん中を通過するように引いたものです。
もし、父親と息子の身長が等しくなるという傾向があるならば、この線は原点のゼロを通って45度の傾斜を持つ(点線)はずですが、どうも見たところそうはなりません。
父親と息子の身長のグラフの中心を通って引かれている直線こそ、まさにゴールトンの述べた、身長の高い父親ほどその息子の身長は父親より低く、身長の低い父親ほどその息子の身長は父親より高いという、回帰現象を表すのです。
この直線は回帰直線と呼ばれています。
購入量の回帰直線
次のグラフは、世帯員数とある商品の購入量との関係を表したものです。
対象数は10世帯です。
ここでも10個の点の間を通って、直線が右上がりに引かれています。
この線によって、世帯員数が多くなると購入量も多くなる傾向が示されます。
この直線もやはり回帰直線と呼ばれています。
世帯員数と購入量では、ゴールトンが感激してその意味を託した回帰という用語とは縁もゆかりもないものになっています。
英語のregressionを辞書で見ると、あと戻り、復帰、退歩などとあります。
そして最後に(統計)回帰とありました。
なぜ世帯員数に対して購入量があと戻りするのでしょうか。
家族が増えるほど購入量は増えません。なにせ収入が限られていますから、といってほしいものを我慢して引っ込めようという皮肉な意味がこめられているかもしれません。
要するに、変数X、Yで点グラフを描いて、その間を通る直線を引けば、意味があってもなくても、それを回帰直線と呼ぶのです。
関連リンク