Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における変数間の因果関係【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における変数間の因果関係【統計解析講義基礎】

統計学における変数間の因果関係【統計解析講義基礎】


統計学における変数間の因果関係【統計解析講義基礎】

因果関係が前提

 

相関関係の分析の直接の目的は、2つの変数の間の増減傾向が同一方向か反対方向か、またその傾向の強さはどの程度かについて知ることでした。

 

そしてその関係については、どちらが原因でどちらが結果かについてはノーコメントでした。

 

これに対し、回帰分析では、原因と結果の関係を明確にしておくことが前提となります。

 

あるいは、どちらの変数でどちらを説明するのか、それを決めておくことが前提となります。

 

ゴールトンの分析では父親の身長が原因で息子の身長は結果であることが明らかです。

 

決してその反対ではありません。

 

世帯員数・購入量の分析では、世帯員数によって購入量の多い少ないを説明しようとしているのです。

 

これもその反対はありえません。

 

つまり、回帰直線が描かれるグラフでいえば、横軸の変数が原因となり、縦軸の変数が結果となります。

 

この原因・結果の関係は、回帰式の計算に入る前に決定しておかねばなりません。

 

結果を見てから判断するのではありません。

 

相関分析では原因・結果には触れないのでこの必要はありませんが、回帰分析では必要になります。

 

なぜ先に因果関係か

 

ここで、回帰式における2つの変数のどちらかをXにし、どちらかをYにしようとも、回帰直線は同一ではないのか、あるいは単にグラフの縦横をひっくり返すだけではないのか、という疑問がおこります。

 

なぜならば、散布した点の集まりのちょうど真ん中を通過する直線は1本しかありえないのですから。

 

実はこれが誤りなのです。

 

そのような直線はグラフを縦にみるか、横に見るかでなんと2本引けるのです。

 

実際に縦横逆にして、回帰直線を2通り計算してグラフ上に描いてみれば決して重ならないことが確認できます。

 

もっと簡単には次の実験をしてみるとわかります。

 

まず、斜めに傾いている楕円を1個、手書きで描いてみます。

 

それほど正確である必要はありません。

 

この楕円を縦に切るように何本かの縦線を平行に書き入れます。

 

それぞれの線分の中点を求めて線で結びます。

 

その線は楕円の傾きに沿ってほぼ真ん中を通過するでしょう。

 

次に、今とまったく同じ楕円に、横に切るように平行な横線を書き入れて、以下同様とします。

 

すると、どちらも楕円の傾きの真ん中を通過しながら別々の線であることに気がつくはずです。

 

統計学における変数間の因果関係【統計解析講義基礎】

 

この2つの図を重ねてみると、楕円は全く一致しますが、2本の直線は、ある角度で互いに交差して一致しないことがわかります。

 

@はじめの線は、グラフの横軸を原因、縦軸を結果としたときの、回帰直線です。

 

Aあとの線は、反対に、縦軸を原因、横軸を結果としたときの回帰直線です。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学における変数間の因果関係【統計解析講義基礎】

統計学における変数間の因果関係【統計解析講義基礎】

統計学における変数間の因果関係【統計解析講義基礎】