Python・R・エクセルによるデータサイエンス | 統計解析講義

相関と因果【統計解析講義応用】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

相関と因果【統計解析講義応用】

相関と因果【統計解析講義応用】


相関と因果【統計解析講義応用】

相関と因果

 

多重回帰を使って何らかの結果をモデルにするとき,1つ1つの変数についてその意味を解釈したくなることがあるだろう。

 

例えば,ある人の体重やコレステロールなどからその大が心臓麻痺になる確率を求めるような場合,何千人もの大規模調査して,心臓麻痺になったことがあるかをたずね,徹底的に身体検査をして,モデルを作る。

 

そして,「体重を減らし,コレステロール値を健康な範囲に収めましょう」という健康に関する助言を与えるためにこのモデルを使うのだ。

 

こうした助言に従えば,心臓麻痺になる割合は30%減少するだろうというわけだ。

 

 しかし,これはモデルが表しているものとは違う。

 

モデルは,コレステロールと体重が健康な範囲に収まっている人の心臓麻痺のリスクが30%低いということを表しているのだ。

 

過体重の大にダイエットと日常的な運動をさせた場合,心臓麻痺になる可能性が低くなると言っているわけではない。

 

そう言えるデータは集めていない。

 

どうなるかを知るために,ボランティアで研究に参加してくれた人の体重・コレステロール値に介入して変化させることはしなかったのだ。

 

 ここには交絡変数がある可能性がある。肥満と高コレステロール値は,心臓麻痺も引き起こす可能性がある他の要因から生じた症状なだけかもしれない。

 

運動や薬のスタチンは,肥満と高コレステロール値を改善させるかもしれないが,心臓麻痺には何も影響しないかもしれない。

 

回帰モデルは,コレステロール値が低いほど心臓麻痺が少ないということを示すが,これは相関であって因果ではない。

 

 この問題に関する事例が. 2010年に起きている。

 

この例では,オメガ3脂肪酸という,魚油に含まれていたり,健康サプリメントとして普通に売られていたりするものが,心臓麻痺のリスクを減らせるかということについて試験された。

 

オメガ3脂肪酸が心臓麻痺のリスクを減らすという主張はいくつかの観察研究と実験データによって支持されていた。

 

脂肪酸には抗炎作用があり,さらに血流中のトリグリセリド値を下げることができる。

 

そして,これら2つの特徴が心臓麻痺のリスクを下げることと相関していることが知られている。このため,オメガ3脂肪酸が心臓病のリスクを下げるはずだと考えられたのだ。
 しかし,証拠は観察によるものだった。

 

トリグリセリド値が低い患者は心臓の問題が少なく,魚油はトリグリセリド値を下げるので,魚油が心臓の問題を防ぐはずだという結論が誤ってなされた。

 

2013年になってようやく,患者に対して魚油か偽薬(オリーブオイル)を与えて,経過を5年間見た大規模なランダム化比較試験の結果が公表された。

 

そこには,魚油に有益な効果があるという証拠はなかった。

 

 複数の交絡因子を統制しているときには,他の問題も生じうる。

 

「他の変数が変化しない場合,体重が1ポンド(およそ0.54キログラム)増えるごとに心臓麻痺になる割合は……だけ増える」といった形で結果を解釈することはよくあることで,これは正しいのかもしれない。

 

だが,他のすべての変数を変化しないままにすることは,実際には不可能かもしれない。

 

回帰方程式から数字を引っぱってくることはいつでもできるが,現実には体重が1ポンド増えるときには他の変化も起こる。

 

他のすべての変数をそのままにした上で体重を1ポンド増やすということは,誰にもできない。

 

だから,回帰方程式は現実に置き換えることができないのだ。

 

セミナー詳細こちら                    解析ご相談こちら


 

相関と因果【統計解析講義応用】

相関と因果【統計解析講義応用】

相関と因果【統計解析講義応用】