交絡要因の正体と解析での回避法【ChatGPT統計解析】
交絡とは、観察研究において因果関係を正しく評価する際に、調べたい要因(曝露)以外の条件がグループ間で異なり影響を受けることで、原因と結果の関係を混乱させる要因を指します。交絡要因は、調べたい要因と比較するグループ間の特徴の違いにより、イベント発生に関係している要因です。例えば、喫煙と肺がんの関係を調べる際、性別や年齢などが交絡要因となり得ます。交絡の影響を除去するには、交絡要因で層別解析を行い、統計的に調整することが重要です。中間変数とは、原因と結果の途中に位置し、交絡要因とは異なるもので、解析結果を歪める可能性があります。交絡要因を特定するには、統計的仮説検定だけでなく、医学的な知見や過去の研究結果を用いることが必要です。出生時体重を例にしたbirth weight paradoxでは、中間変数を用いた層別解析が誤った結果をもたらすことが示されました。解析において交絡要因と中間変数を適切に区別することが不可欠です。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
交絡の問題
交絡とは
観察研究では、人為的操作のできないもの(介入できないもの)の影響を主として調べます。
このため、観察研究では、一般に、調べたい要因(原因)以外の条件がグループ間で異なってしまうので、単純には因果関係を調べることができないということでした。
例えば、喫煙と肺がんの間の関係を調べることを考えてみましょう。
喫煙ありグループと喫煙なしグループで、性別や年齢といったいろいろな要因が異なっている可能性が高いですよね。
男性の喫煙割合が高いだろうし、若い世代よりも中高年世代で喫煙割合が高いかもしれません。
そうだとすると、喫煙ありのグループに男性で中高年の人が(相対的に)多くなってしまいますよね。他の要因もグループ間で偏っているかもしれません。
こうなってしまうと、喫煙すると肺がんに罹りやすいのか、男性だから、中高年だから肺がんに罹りやすいのか、あるいは他のことが原因で肺がんになりやすいのか、さっぱりわからなくなってしまいます。
このような状況のことを「交絡が起きている」と言います。
交絡が起きているとは、調べたい要因(曝露)がイベント発生に関係しているのか、比較するグループ間の特徴の違いがイベント発生に関係しているのかが、区別できなくなってしまうことをいいます。
交絡要因とは
そして、交絡を引き起こしている要因のことを交絡要因と言います。
単純に、交絡要因で層別して解析すれば交絡の影響はなくなります。
例えば、喫煙と肺がんの間の関係を調べるときに、男性だけをピックアップして解析すれば、全員男性なので、喫煙と肺がんの間の関係を調べる際、性別の影響は受けなくなります。
このような解析方法をサブグループ解析と言います。
さらに、交絡要因をすべてデータとして観察することができれば、交絡を調整する統計解析をすることができるのです。
交絡を調整する統計解析をすることによって、交絡の影響を除去することができます。
したがって、交絡を調整する統計解析をすることによって、調べたい要因(曝露)と結果との間の因果関係が調べられることになるのです。
ある要因が交絡要因であるための条件
交絡を調整する統計解析の方法として、先ずは交絡要因となる要因を特定しなければなりません。
ある要因Aが交絡要因であるためにはどのような条件が必要か調べましょう。
交絡が起きているとは、調べたい要因(例えば喫煙や飲酒)がイベント発生に関係しているのかが、区別できなくなってしまう状態のことを言います。
要因Aがイベント発生に関係していないと明確にわかっていると仮定してみましょう。
すると、調べたい要因(曝露)がイベント発生に関係しているのか、要因Aがイベント発生に関係しているのかが、区別できないということはありませんよね。
要因Aはイベント発生に関係していないのですから。
よって、要因Aが交絡要因であるためには、
要因Aが交絡要因であるための条件:要因Aは対象としているイベントのリスク要因である
ことが、まず1つ目の条件となります。
次に、要因Aが調べたい要因(曝露)と関連していないと仮定してみましょう。
すると、要因Aという要因のある人ほど曝露ありグループに集まったり、逆に、曝露なしグループに集まったりすることはありませんよね。
結果として、曝露ありグループと曝露なしグループで要因Aが偏らない、つまり、分布が等しくなります。
このようなときに曝露ありグループと曝露なしグループでイベント発生の比較をしてみましょう。
要因Aについては、分布の等しいもの同士でイベント発生の比較をすることになります。
したがって、要因Aが曝露と関連していないときには、調べたい要因(曝露)がイベント発生に関係しているのか、要因Aがイベント発生に関係しているのかが、区別できなくなってしまうということはないのです。
よって、要因Aが交絡要因であるためには:要因Aは曝露と関連がある
ことが2つ目の条件になります。
それから、最後に、
要因Aは中間変数ではない
というのも条件になります。
中間変数
例えば、降圧薬投与の有無と心筋梗塞発生の有無の間の関係を考えてみましょう。
降圧薬の投与によって血圧が下がって、血圧が下がった結果、心筋梗塞が予防できることになります。つまり、降圧薬と心筋梗塞の間には、
降圧薬投与⇒血圧低下⇒心筋梗塞発生の予防
というルートが存在することになります。
このように、原因から結果へ至るルートの途中にあるものを中間変数と言います。
では、なぜ中間変数は交絡要因ではないのでしょうか。
仮に、血圧(中間変数)以外の要因、例えば、飲酒の有無については、降圧薬を投与するグループと投与しないグループで飲酒者の割合が等しいとします。
このとき、もし血圧が交絡要因であるなら、高血圧と高血圧でないサブグループに層別すれば、高血圧の人での降圧薬と心筋梗塞の関係が適切に調べられることになるはずです。
同じように、高血圧ではない人たちにおいても降圧薬と心筋梗塞の関係が適切に調べられることになるはずです。
しかし、降圧薬を投与するグループでは、降圧薬のおかげで飲酒者でも血圧が下がるかもしれません。
そうだとすると、降圧薬を投与したグループでは、高血圧の人の中に(相対的に)飲酒者は少なくなります。
逆に、降圧薬を投与しないグループでは、飲酒者で血圧が下がる人は少ないだろうと考えられます。
降圧薬を投与しないグループでは、高血圧の人の中に(相対的に)飲酒者が多くなってしまうのです。
ということは、血圧(中間変数)で層別して高血圧の人だけをピックアップすると、降圧薬を投与するグループの飲酒者の割合が、降圧薬を投与しないグループよりも少なくなってしまうのです。
もともとは飲酒者の割合が2つのグループ間で等しかったのに、です。
つまり、
中間変数で層別したり、中間変数の影響を除去しようとする解析をしたりすると、解析結果が間違ったものになってしまうのです。
中間変数を交絡要因と同じように扱ってはいけないのです。
交絡要因のまとめ
これまでのところをまとめると、ある要因Aが交絡要因であるためには、
@要因Aは対象としているイベントのリスク要因である
A要因Aは曝露と関連がある
B要因Aは中間変数ではない
をすべて満たすことが必要です。
交絡要因の特定
肺がん発生のリスクが高いと考えられる人で喫煙と肺がんの間の関係を調べた仮想的なコホート研究の結果をみてみましょう。
喫煙あり、肺がんあり:800人
喫煙あり、肺がんなし:9200人
喫煙なし、肺がんあり:400人
喫煙なし、肺がんなし:9600人
リスク比は、
800/10000/400/10000=2.00
になりますね。これをある要因Aで層別すると、次の表のようになりました。
<要因Aあり>
喫煙あり、肺がんあり:768人
喫煙あり、肺がんなし:7232人
喫煙なし、肺がんあり:288人
喫煙なし、肺がんなし:2712人
<要因Aなし>
喫煙あり、肺がんあり:32人
喫煙あり、肺がんなし:1968人
喫煙なし、肺がんあり:112人
喫煙なし、肺がんなし:6888人
リスク比は要因Aありの層では、
768/8000/288/3000=1.00
となって、要因Aなしの層でも、
32/2000/112/7000=1.00
となります。
要因Aで層別しない場合のリスク比は2.00だけど、層別すると、要因Aあり、要因Aなしの両方の層で1.00になっています。
一見矛盾しているようにも見えることが起こっています。
これはシンプソンのパラドックスと呼ばれ、どのようにこの結果を解釈すればよいかについて議論されてきました。
交絡要因を特定するための統計的仮説検定
要因Aが交絡要因であるかどうかを少し丁寧に考えてみましょう。
そのために、要因Aが交絡要因であるための条件を当てはめてみます。
まず、「要因Aは対象としているイベントのリスク要因である」に当てはまるかどうかを検討してみましょう。
同じデータを、要因Aの有無と肺がん発生の有無で集計し直すと、
要因Aあり、肺がんあり:1056人
要因Aあり、肺がんなし:9944人
要因Aなし、肺がんあり:144人
要因Aなし、肺がんなし:8856人
となります。
統計的仮説検定をすると、両側p値はp<0.001となります。
有意差ありです。
したがって、要因Aは対象としているイベントのリスク要因であることに当てはまると考えるかもしれません。
同様に、要因Aは曝露と関連があるかについても見てみましょう。
要因Aの有無と喫煙の関係で集計し直すと、
要因Aあり、喫煙あり:8000人
要因Aあり、喫煙なし:3000人
要因Aなし、喫煙あり:2000人
要因Aなし、喫煙なし:7000人
統計的仮説検定をすると、両側p値はp <0.001となります。
有意差ありなので、要因Aは曝露と関連があることにも当てはまると考えるかもしれません。
しかし、このように、統計的仮説検定を用いて交絡要因であるか否かを判断するのは、正しくないやり方なのです。
統計的仮説検定は一種の背理法です。
わざわざ反対の「差がない」という仮説を立てて、この仮説が否定されるかどうかを考えました。
ここで注意しなければならないことは、仮説が否定できなかったからといって、差がないとは言えないということです。
差があるとは言えなかった、以上のことは何も言えないのです。
要因Aについては、「要因Aと肺がん発生の有無には関係がない」
「要因Aと喫煙の有無には関係がない」
という仮説に対して統計的仮説検定をしていることになります。
有意差がなかったとしても、これらの間に関係がないとは絶対に言えないのです。
つまり、統計的仮説検定の結果から「要因Aが交絡要因ではない」と判断することはできないのです。
また、統計的仮説検定には、まったく意味のないような差であっても、人数が多いだけで、有意差ありとなったり、逆に意味のあるような差であっても人数が少ないだけで有意差なしとなったりする特徴があります。
要因Aについては、単に人数が多いだけで有意差ありとなったのかもしれません。
これらのことからわかるように、
ある要因が交絡要因であるかどうかを検討するために統計的仮説検定をすることにはあまり意味がない。
のです。
それからもう1つ、統計的仮説検定を用いるように、機械的に交絡要因であるか否かを判断するやり方では、「要因Aは中間変数ではない」については調べることができません。
要因Aが何者なのかがわからないと、要因Aが曝露の原因なのか結果なのかが判別できません。
ある要因が交絡要因であるかどうかを機械的に検討することはできないのです。
では、いったいどうやって、ある要因が交絡要因であるかどうかを検討すればよいのでしょうか。
機械的に検討することができないのだから、機械的ではない方法で検討すればよいのです。
つまり、
医学的な常識や過去の研究結果からの知見に基づいて、ある要因が交絡要因であるかどうかを検討するのです。
例えば、要因Aが年齢だとしましょう。
すると、要因Aは対象としているイベントのリスク要因であることにあてはまると考えられます。年齢が高いほど肺がんに罹る可能性が高くなるというのは、医学的な常識でしょう。
要因Aは曝露と関連がある、にもあてはまります。若い世代よりも中高年で喫煙割合が高いのではないでしょうか。
要因Aは中間変数ではない、にも当然あてはまります。喫煙するほど実年齢が高くなったり低くなったりすることはありません。
したがって、年齢は交絡要因と判断されることになり、年齢(要因A)で層別していない結果(リスク比=2.00)は正しくないことになります。
では、要因Aが飲酒の有無だったらどうでしょう。
要因Aは対象としているイベントのリスク要因である、にはきっとあてはまりません。飲酒が肺がんのリスク要因だという話はないと思います。
だとすると、今度は飲酒(要因A)で層別した結果(リスク比=1.00)が正しくないことになります。
交絡要因であるかどうかの判断が異なると、解析結果も異なる可能性があります。
当たり前といえば当たり前なのですが、その道のエキスパートでない人が研究をすると、誤った結論を導き出してしまう可能性があるのです。
出生時体重のパラドックス
先ずは、次の文章を読んでみてください。
次の表は、アメリカでシングルマザーを対象として、母親の妊娠中の喫煙の有無別に、1997年に生まれた乳児の生後1年以内の死亡をまとめたものです。
母親の妊娠中の喫煙 出生児数 生後1年以内の死亡
あり 393718 3921
なし 2590787 15225
合計 2984505 19146
リスク比を計算すると、
3921/393718/15225/2590787=1.69
です。喫煙ありグループでは、喫煙なしグループに比べて、乳児の生後1年以内の死亡が1.69倍多かったということです。
多くの人が思っているだろう通り、妊娠中に喫煙する方が乳児の死亡リスクが高くなっています。
この表を、乳児の出生時体重2500g以上と未満で層別して集計すると、次の表のようになります。
乳児の出生時体重 妊娠中喫煙 出生児数 生後1年以内の死亡
2500g以上 あり 353335 1729
2500g以上 なし 2453633 5838
2500g未満 あり 40383 2192
2500g未満 なし 137154 9387
リスク比を計算すると、出生時体重2500g以上の層では、
1729/353335/5838/2453633=2.06
となります。やはり妊娠中に喫煙する方が乳児の死亡リスクが高くなっています。
しかし、出生時体重2500g未満の層では、
2192/40383/9387/137154=0.79
となります。
リスク比の値が1よりも小さくなっているので、出生時体重が2500g未満の場合においては、逆に、妊娠中に喫煙しない方が乳児の死亡リスクが高くなることになってしまいます。
ほとんどの人があり得ないと思っていることが起こっているので、これはbirth weight paradoxと呼ばれています。
この結果を鵜呑みにすると、子どもの出生時体重が2500g未満になるのだったら、母親はタバコを吸っていた方がいい、ということになってしまいます。
本当にそうなのでしょうか。
出生時体重2500g未満の層では、妊娠中に喫煙しない方が乳児の死亡リスクが高くなるという結果でした。
出生時体重が交絡要因であるかどうかを検討するために、
先ず、出生時体重が対象としているイベントのリスク要因であるかどうかを考えます。
これは当てはまると考えられます。出生時体重が低いと死亡リスクは高くなります。
次に、出生時体重は曝露と関連があるかどうかですが、これも当てはまると考えられます。母親が妊娠中に喫煙すると、乳児の出生時体重が低くなる傾向があります。
最後に、出生時体重は中間変数ではない、についてですが、これは当てはまらないと考えられます。
母親が喫煙することによって乳児の出生時体重が低くなり、その結果として、乳児の死亡リスクが高くなると考えられます。
つまり、出生時体重は中間変数なのです。
また、中間変数で層別したり、中間変数の影響を除去しようとする解析をしたりすると、解析結果が間違ったものになってしまいます。
だから、出生時体重で層別したこの結果は正しくないことになります。
交絡の影響を除去することによって、母親の喫煙の乳児に死亡への効果(因果関係)がわかったとしたら、次の段階として、直接的な効果(母親が喫煙することが出生時体重に影響し、その結果として乳児の死亡リスクがどうなるのか)に興味がうつるかもしれません。
このような直接的な効果と間接的な効果を推定する方法が整備されてきています。
統計学も進歩しているのです。
交絡とは、観察研究において因果関係を評価する際に、調べたい要因(曝露)以外の条件がグループ間で異なることで因果関係の判定が難しくなる現象を指します。観察研究では人為的操作ができないものを主に調べるため、グループ間の様々な要因が異なる可能性があり、それにより因果関係を単純に明らかにすることは難しくなります。たとえば、喫煙と肺がんの関係を調べるとき、喫煙グループと非喫煙グループの性別や年齢などの要因が異なることが考えられます。一般的に男性の喫煙率は高く、また年齢が上がるほど喫煙率が高くなる傾向があります。このように、喫煙者の中には相対的に中高年の男性が多くなり、他の要因も偏る可能性があります。この状況では、喫煙そのものが肺がんリスクを高めているのか、あるいは男性や中高年であることがリスクを高めているのか、はたまた別の要因が関与しているのか判別できなくなります。このような状況を「交絡が起きている」と言います。交絡とは、調べたい要因(曝露)がイベント発生に関係しているか、比較するグループ間の特徴の違いが関係しているかが区別できなくなる状態を指します。交絡を引き起こす要因は交絡要因と呼ばれ、これを適切に特定し、影響を除去することが因果関係を正しく評価するために不可欠です。例えば、喫煙と肺がんの関係を調べるとき、性別が交絡要因である場合、男性だけをピックアップして解析することで、全員が男性であるため性別の影響を排除した上で因果関係を調べることができます。このような解析手法はサブグループ解析と呼ばれます。さらに、交絡要因がデータとして観察されている場合、統計解析を用いて交絡を調整し、その影響を除去することができます。統計的に交絡を調整することで、調べたい要因と結果との因果関係を明確にすることができます。交絡要因を特定するためには、まずその要因が交絡要因となる条件を検討しなければなりません。交絡が起きているとは、調べたい要因がイベント発生に関係しているかが区別できなくなる状態です。ある要因Aが交絡要因であるかどうかを調べるためには、まずその要因が対象イベントのリスク要因であることが必要です。要因Aがイベント発生に関係していない場合、調べたい要因がイベント発生に関係しているかどうかが区別できなくなることはありません。したがって、要因Aが交絡要因であるためには、対象イベントのリスク要因であることが条件となります。次に、要因Aが調べたい要因(曝露)と関連していることも条件です。要因Aが曝露と関連していない場合、曝露ありグループと曝露なしグループで要因Aの分布が等しくなり、要因Aがイベント発生に影響を与える可能性は低くなります。このため、要因Aが交絡要因であるためには曝露と関連があることが必要です。さらに、要因Aは中間変数ではないことも条件です。中間変数とは、原因と結果の間に位置し、因果関係を媒介する役割を果たします。例えば、降圧薬の投与が血圧を下げ、その結果として心筋梗塞のリスクを低下させる場合、血圧が中間変数となります。中間変数を交絡要因として扱うと解析結果が誤ったものになる可能性があります。交絡要因として扱うには、因果関係が単純ではなくなるため注意が必要です。交絡要因を適切に特定し、因果関係を評価するためには、統計的仮説検定の使用には注意が必要です。統計的仮説検定は、差がないという仮説を否定することで検定が進められますが、仮説が否定できなかった場合、差がないと断言することはできません。有意差があっても、それが本質的な違いを反映しているかどうかを判断するためには、検討対象の背景や研究のコンテキストを踏まえる必要があります。統計的仮説検定はサンプルサイズによって結果が変わることもあり、大きなサンプルサイズでは微小な差でも有意差として検出されることがあります。逆に、サンプルサイズが小さい場合には実際に意味のある差が有意差として検出されないこともあります。したがって、統計的仮説検定だけで交絡要因の有無を判断することは適切ではありません。また、統計的仮説検定だけで要因Aが中間変数であるかどうかを判断することもできません。要因Aが交絡要因であるかどうかを判断するためには、機械的な手法だけではなく、過去の研究や医学的常識などの知見に基づく検討が求められます。例えば、年齢が交絡要因であるかどうかを判断する際、年齢が高くなるほど肺がんのリスクが高くなるというのは医学的常識に基づく知見です。また、年齢が高いほど喫煙率が高くなることも過去のデータから確認できます。年齢は中間変数ではなく、実年齢が喫煙によって変動することはありません。こうした点から、年齢は交絡要因として判断され、年齢で層別していない場合の解析結果は正確でないとされます。これに対し、要因Aが飲酒の有無であった場合、飲酒が肺がんリスク要因でないならば、交絡要因とはみなされず、層別した解析結果が正確でない可能性があります。交絡要因を適切に特定しなければ、解析結果が異なり、誤った結論に至る可能性があります。たとえば、出生時体重のパラドックス(birth weight paradox)はその一例です。アメリカでのシングルマザーの研究では、妊娠中の喫煙が乳児の生後1年以内の死亡率に及ぼす影響が解析されました。喫煙ありの場合のリスク比は1.69で、喫煙がリスクを高めているように見えましたが、出生時体重で層別すると、2500g以上の乳児ではリスク比が2.06で依然として喫煙がリスクを高めていました。一方、2500g未満の乳児ではリスク比が0.79となり、喫煙していない方がリスクが高いという結果になりました。これは、出生時体重が交絡要因でなく中間変数であるため、層別解析により誤った結果を生じたのです。出生時体重が低いと死亡リスクは高く、母親の喫煙が出生時体重に影響し、その結果として死亡リスクが変動するためです。中間変数で層別すると解析結果が歪むため、慎重な判断が必要です。交絡の影響を正確に除去することは因果関係の解明に役立ち、その後、直接効果や間接効果を考察する段階に進むこともあります。因果関係に関する統計手法は進化を続け、より正確な推定が可能になっています。
関連記事