回帰分析で明確にする原因と結果の関係【ChatGPT統計解析】
回帰分析では、原因と結果の関係を明確にすることが重要です。横軸に原因、縦軸に結果を設定し、回帰直線を描くことでその関係を示します。相関分析とは異なり、回帰分析では原因と結果の特定が前提となります。例えば、父親の身長が原因で息子の身長が結果とされます。実際に、グラフ上で回帰直線を2通り計算し縦横を逆にすると、2本の異なる直線が描けます。この現象は、楕円を縦横に切ってそれぞれ中点を結ぶ線を描く実験で確認できます。この2本の直線は一致せず、異なる角度で交差します。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
回帰分析における原因と結果
相関分析の分析の直接の目的は、2つの変数の間の増減傾向が同一方向か反対方向か、またその傾向の強さはどの程度かについて知ることでした。
そして相関分析については、どちらが原因でどちらが結果かについてはノーコメントでした。
これに対し、回帰分析では、原因と結果の関係を明確にしておくことが前提となります。
あるいは、どちらの変数でどちらを説明するのか、それを決めておくことが前提となります。
ゴールトンの分析では父親の身長が原因で息子の身長は結果であることが明らかです。
決してその反対ではありません。
世帯員数・購入量の分析では、世帯員数によって購入量の多い少ないを説明しようとしているのです。
これもその反対はありえません。
つまり、回帰直線が描かれるグラフでいえば、横軸の変数が原因となり、縦軸の変数が結果となります。
この原因・結果の関係は、回帰式の計算に入る前に決定しておかねばなりません。
結果を見てから判断するのではありません。
相関分析では原因・結果には触れないのでこの必要はありませんが、回帰直線では必要になります。
真ん中を通過する直線は縦にみるか横に見るかで2本引ける
ここで、回帰式における2つの変数のどちらかをXにし、どちらかをYにしようとも、回帰直線は同一ではないのか、あるいは単にグラフの縦横をひっくり返すだけではないのか、という疑問がおこります。
なぜならば、散布した点の集まりのちょうど真ん中を通過する直線は1本しかありえないのですから。
実はこれが誤りなのです。
そのような直線はグラフを縦にみるか、横に見るかでなんと2本引けるのです。
実際に縦横逆にして、回帰直線を2通り計算してグラフ上に描いてみれば決して重ならないことが確認できます。
もっと簡単には次の実験をしてみるとわかります。
まず、斜めに傾いている楕円を1個、手書きで描いてみます。
それほど正確である必要はありません。
この楕円を縦に切るように何本かの縦線を平行に書き入れます。
それぞれの線分の中点を求めて線で結びます。
その線は楕円の傾きに沿ってほぼ真ん中を通過するでしょう。
次に、今とまったく同じ楕円に、横に切るように平行な横線を書き入れて、以下同様とします。
すると、どちらも楕円の傾きの真ん中を通過しながら別々の線であることに気がつくはずです。
この2つの図を重ねてみると、楕円は全く一致しますが、2本の直線は、ある角度で互いに交差して一致しないことがわかります。
@はじめの線は、グラフの横軸を原因、縦軸を結果としたときの、回帰直線です。
Aあとの線は、反対に、縦軸を原因、横軸を結果としたときの回帰直線です。
関連リンク