相関と因果の違いを解明!個人内共変関係の重要性【ChatGPT統計解析】
相関関係とは、2つの変数の間に見られる統計的な関係を指し、因果関係とは一方の変数が他方に影響を与えることを示す。たとえば、年齢とパソコン技能の間に負の相関があり、年齢と年収の間には正の相関がある。しかし、相関関係があっても必ずしも因果関係があるとは限らない。個人内の共変関係では、個人の変化が他の要素にどのように影響するかを観察し、因果関係を明確にするのに役立つ。集団と個人の関係には違いがあり、個人内の共変関係は因果関係を理解するために有効である。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
集団における相関関係と個人内の共変関係
相関関係と因果関係
勉強時間とテスト成績の関係とか、塩分摂取量と血圧の関係など、2つのものの間の関係が話題になることが多い。
そうした関係を表現するとき、「相関関係」と「因果関係」という言葉がよく使われる。
まず、これらの言葉の意味について説明しておこう。
ある会社の社員の「年齢」、「パソコン技能」、「年収」の間の関係を考えてみよう。
一般的にいって、高齢の社員ほどパソコン技能は低い傾向がある。
その一方で、現在の日本の給与体系を反映して、高齢の社員ほど年収は多い。
これらの関係を、年齢とパソコン技能の間には負の相関関係があるといい、年齢と年収の間には正の相関関係があるという。
また、ここまでの説明から、結果的に、パソコン技能の高い社員(主に若手)ほど年収が少ないというように、パソコン技能と年収の間には負の相関関係があることがわかる。
さて、2つのものの間に相関関係があるとき、私たちはすぐに原因と結果の関係、つまり因果関係があるかのように考えてしまう傾向がある。
たとえば、塩分摂取が多い人ほど血圧が高いという相関関係が見つかると、血圧が高いのは塩分摂取が原因であり、したがって塩分摂取量を減らすことによって血圧を下げることができると考える。
しかし、よくいわれるように、相関関係と因果関係は別ものである。
たとえば、先に説明したように、パソコン技能と年収の間には負の相関関係があることが推測されるが、だからといって、パソコン技能が高いから年収が少ないとか、パソコン技能が低いから年収が高いといった因果関係がないのは明らかである。
むしろパソコン技能を高めて資格などをとれば、それによって年収は上がることが予想される。
このように、相関関係から推測されるような因果関係があるとは限らず、場合によっては、それとは逆の因果関係があることもある。
個人内の共変関係
この問題をもう少し深く掘り下げてみよう。
相関関係はふつう、たくさんの人を想定して、その中で、たとえば塩分摂収量の多い人は、同時に血圧も高い人である傾向があるということを示すものである。
これに対し因果関係は、ひとりの人の中で、ある原因が生じ、それによって結果が生じるというように、個人の中での関係であるといえる。
そこで、集団を対象とした相関関係ではなく、個人の中で、一方のものが変化したとき、他方のものがそれと連動してどのように変化したかを調べることが、因果関係に迫るにはより適していると考えられる。
このような、個人の中で連動する関係は、「個人内の共変関係」とよばれる。
下の図では、横軸に勉強時間、縱軸にテスト成績をとって、3人の生徒のデータをプロットしてある。
1回目のテストのときのデータは黒印で示してある。
この黒印のデータから、1回目のテストのときの勉強時間とテスト成績の相関係数や回帰直線(図中の実線)を求めることができる。
これは、「勉強時間の長い生徒ほどテスト成績が高い」という傾向がどの程度あるかという、集団における相関関係を示す指標となる。
この図には、実際には5回のテストについて、3人の生徒の勉強時間とテスト成績のデータをプロットしてある。
そして、各人5個ずつのデータに対して求めた個人内の回帰直線を点線で示してある。
これは、各生徒について、「勉強時間をたくさんとったときほどテスト成績が高い」という傾向がどの程度あるかという、個人内の共変関係を示すものである。
この図では、個人内での勉強時間とテスト成績の関係に比べて、黒印のデータについて求めた集団での関係が弱くなっている。
その理由は、生徒Bが生徒Cよりも全般的に勉強時間は短いのにテスト成績が高いからである。
これは、テスト成績の個人差が勉強時間以外の個人差(たとえば集中力やすでにもっている知識の量など)にも依存することを示唆している。
この例の場合、各個人において勉強時間を増やすことの効果を知るという目的のためには、実線で表された集団における相関関係よりも、点線で表された個人内の共変関係のほうが直接的に有用な情報を与えることになる。
関連リンク