相関と因果の迷宮:データから真実を読み解く【ChatGPT統計解析】
相関関係と因果関係は異なり、前者が存在するからと言って後者があるとは限らない。例えば、国民所得と酒の消費量に正の相関が見られる場合、所得増加が酒消費の増加を引き起こす可能性はあるが、その逆を示すものではない。常識に反する例や直感に頼らない分析が求められる場面では、統計的なデータから安易に因果関係を推測するのは避けるべき。例えば、電器製品の普及率が年々倍増している場合、その成長は指数関数的であり、直線的な相関関係で説明できない。また、「少し太っている方が長生き」という観測についても、それが健康に直接関連していると結論づけるには医学的なさらなる研究が必要となる。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
相関関係は因果関係とは異なる
相関関係は因果関係とは異なります。
「国民所得と酒の消費量の間には正の相関がある。したがって、国民が酒をたくさん飲めば所得が増える」
この記述、どこかおかしくないですか?
相関関係は、因果関係については何も述べていません。
つまり、所得が増えたから酒をたくさん飲むのか、酒をたくさん飲むから所得が増えるのかという因果関係については、相関関係自体は前者であるとも後者であるとも言っていません。
相関関係から不用意に因果関係を推測しないように注意
上の例の場合は誰でも所得が増えたから酒をたくさん飲むとわかりますが、それは常識で言っているだけであって、統計学とは別の話です。
このような常識がはたらかない問題では、相関関係から不用意に因果関係を推測しないように注意する必要があります。
また、
「ある電器製品の普及台数は、発売以来毎年倍に増えている。発売後の年数と普及台数の相関関係は、非常に強い相関であるから、ほぼ1である。」
という記述はどうでしょうか。
年数と台数の相関関係が1であるとは、年数と台数の増減に直線的な関係があることを意味しています。
この問題の場合は、年数と台数の間に(毎年倍に増えているという仮定から)指数関数の関係があるので、相関関係はほぼ1にはなりません。
このような場合、台数のほうを対数関数で変換すると、年数と「台数の対数」の増減に直線的な関係ができ、相関関係としてとり扱うことができます。
では、このような例はどうでしょう。
「少々太っているほうが長生きできる」
一生懸命ダイエットするより、少し太り気味のほうがいいんだと思いたくなりますが、もしかしたら、年をとって太れるほど、胃腸が丈夫で健康だから、長生きできるのかもしれません。
どちらなのかは、常識によっても、統計学によってもわからず、医学そのもののさらなる研究が必要です。
関連リンク