交絡の問題|【統計学・統計解析講義応用】
交絡の問題
交絡とは
観察研究では、人為的操作のできないもの(介入できないもの)の影響を主として調べます。
このため、観察研究では、一般に、調べたい要因(原因)以外の条件がグループ間で異なってしまうので、単純には因果関係を調べることができないということでした。
例えば、喫煙と肺がんの間の関係を調べることを考えてみましょう。
喫煙ありグループと喫煙なしグループで、性別や年齢といったいろいろな要因が異なっている可能性が高いですよね。
男性の喫煙割合が高いだろうし、若い世代よりも中高年世代で喫煙割合が高いかもしれません。
そうだとすると、喫煙ありのグループに男性で中高年の人が(相対的に)多くなってしまいますよね。他の要因もグループ間で偏っているかもしれません。
こうなってしまうと、喫煙すると肺がんに罹りやすいのか、男性だから、中高年だから肺がんに罹りやすいのか、あるいは他のことが原因で肺がんになりやすいのか、さっぱりわからなくなってしまいます。
このような状況のことを「交絡が起きている」と言います。
交絡が起きているとは、調べたい要因(曝露)がイベント発生に関係しているのか、比較するグループ間の特徴の違いがイベント発生に関係しているのかが、区別できなくなってしまうことをいいます。
交絡要因とは
そして、交絡を引き起こしている要因のことを交絡要因と言います。
単純に、交絡要因で層別して解析すれば交絡の影響はなくなります。
例えば、喫煙と肺がんの間の関係を調べるときに、男性だけをピックアップして解析すれば、全員男性なので、喫煙と肺がんの間の関係を調べる際、性別の影響は受けなくなります。
このような解析方法をサブグループ解析と言います。
さらに、交絡要因をすべてデータとして観察することができれば、交絡を調整する統計解析をすることができるのです。
交絡を調整する統計解析をすることによって、交絡の影響を除去することができます。
したがって、交絡を調整する統計解析をすることによって、調べたい要因(曝露)と結果との間の因果関係が調べられることになるのです。
ある要因が交絡要因であるための条件
交絡を調整する統計解析の方法として、先ずは交絡要因となる要因を特定しなければなりません。
ある要因Aが交絡要因であるためにはどのような条件が必要か調べましょう。
交絡が起きているとは、調べたい要因(例えば喫煙や飲酒)がイベント発生に関係しているのかが、区別できなくなってしまう状態のことを言います。
要因Aがイベント発生に関係していないと明確にわかっていると仮定してみましょう。
すると、調べたい要因(曝露)がイベント発生に関係しているのか、要因Aがイベント発生に関係しているのかが、区別できないということはありませんよね。
要因Aはイベント発生に関係していないのですから。
よって、要因Aが交絡要因であるためには、
要因Aが交絡要因であるための条件:要因Aは対象としているイベントのリスク要因である
ことが、まず1つ目の条件となります。
次に、要因Aが調べたい要因(曝露)と関連していないと仮定してみましょう。
すると、要因Aという要因のある人ほど曝露ありグループに集まったり、逆に、曝露なしグループに集まったりすることはありませんよね。
結果として、曝露ありグループと曝露なしグループで要因Aが偏らない、つまり、分布が等しくなります。
このようなときに曝露ありグループと曝露なしグループでイベント発生の比較をしてみましょう。
要因Aについては、分布の等しいもの同士でイベント発生の比較をすることになります。
したがって、要因Aが曝露と関連していないときには、調べたい要因(曝露)がイベント発生に関係しているのか、要因Aがイベント発生に関係しているのかが、区別できなくなってしまうということはないのです。
よって、要因Aが交絡要因であるためには:要因Aは曝露と関連がある
ことが2つ目の条件になります。
それから、最後に、
要因Aは中間変数ではない
というのも条件になります。
中間変数
例えば、降圧薬投与の有無と心筋梗塞発生の有無の間の関係を考えてみましょう。
降圧薬の投与によって血圧が下がって、血圧が下がった結果、心筋梗塞が予防できることになります。つまり、降圧薬と心筋梗塞の間には、
降圧薬投与⇒血圧低下⇒心筋梗塞発生の予防
というルートが存在することになります。
このように、原因から結果へ至るルートの途中にあるものを中間変数と言います。
では、なぜ中間変数は交絡要因ではないのでしょうか。
仮に、血圧(中間変数)以外の要因、例えば、飲酒の有無については、降圧薬を投与するグループと投与しないグループで飲酒者の割合が等しいとします。
このとき、もし血圧が交絡要因であるなら、高血圧と高血圧でないサブグループに層別すれば、高血圧の人での降圧薬と心筋梗塞の関係が適切に調べられることになるはずです。
同じように、高血圧ではない人たちにおいても降圧薬と心筋梗塞の関係が適切に調べられることになるはずです。
しかし、降圧薬を投与するグループでは、降圧薬のおかげで飲酒者でも血圧が下がるかもしれません。
そうだとすると、降圧薬を投与したグループでは、高血圧の人の中に(相対的に)飲酒者は少なくなります。
逆に、降圧薬を投与しないグループでは、飲酒者で血圧が下がる人は少ないだろうと考えられます。
降圧薬を投与しないグループでは、高血圧の人の中に(相対的に)飲酒者が多くなってしまうのです。
ということは、血圧(中間変数)で層別して高血圧の人だけをピックアップすると、降圧薬を投与するグループの飲酒者の割合が、降圧薬を投与しないグループよりも少なくなってしまうのです。
もともとは飲酒者の割合が2つのグループ間で等しかったのに、です。
つまり、
中間変数で層別したり、中間変数の影響を除去しようとする解析をしたりすると、解析結果が間違ったものになってしまうのです。
中間変数を交絡要因と同じように扱ってはいけないのです。
交絡要因のまとめ
これまでのところをまとめると、ある要因Aが交絡要因であるためには、
@要因Aは対象としているイベントのリスク要因である
A要因Aは曝露と関連がある
B要因Aは中間変数ではない
をすべて満たすことが必要です。
交絡要因の特定
肺がん発生のリスクが高いと考えられる人で喫煙と肺がんの間の関係を調べた仮想的なコホート研究の結果をみてみましょう。
喫煙あり、肺がんあり:800人
喫煙あり、肺がんなし:9200人
喫煙なし、肺がんあり:400人
喫煙なし、肺がんなし:9600人
リスク比は、
800/10000/400/10000=2.00
になりますね。これをある要因Aで層別すると、次の表のようになりました。
<要因Aあり>
喫煙あり、肺がんあり:768人
喫煙あり、肺がんなし:7232人
喫煙なし、肺がんあり:288人
喫煙なし、肺がんなし:2712人
<要因Aなし>
喫煙あり、肺がんあり:32人
喫煙あり、肺がんなし:1968人
喫煙なし、肺がんあり:112人
喫煙なし、肺がんなし:6888人
リスク比は要因Aありの層では、
768/8000/288/3000=1.00
となって、要因Aなしの層でも、
32/2000/112/7000=1.00
となります。
要因Aで層別しない場合のリスク比は2.00だけど、層別すると、要因Aあり、要因Aなしの両方の層で1.00になっています。
一見矛盾しているようにも見えることが起こっています。
これはシンプソンのパラドックスと呼ばれ、どのようにこの結果を解釈すればよいかについて議論されてきました。
交絡要因を特定するための統計的仮説検定
要因Aが交絡要因であるかどうかを少し丁寧に考えてみましょう。
そのために、要因Aが交絡要因であるための条件を当てはめてみます。
まず、「要因Aは対象としているイベントのリスク要因である」に当てはまるかどうかを検討してみましょう。
同じデータを、要因Aの有無と肺がん発生の有無で集計し直すと、
要因Aあり、肺がんあり:1056人
要因Aあり、肺がんなし:9944人
要因Aなし、肺がんあり:144人
要因Aなし、肺がんなし:8856人
となります。
統計的仮説検定をすると、両側p値はp<0.001となります。
有意差ありです。
したがって、要因Aは対象としているイベントのリスク要因であることに当てはまると考えるかもしれません。
同様に、要因Aは曝露と関連があるかについても見てみましょう。
要因Aの有無と喫煙の関係で集計し直すと、
要因Aあり、喫煙あり:8000人
要因Aあり、喫煙なし:3000人
要因Aなし、喫煙あり:2000人
要因Aなし、喫煙なし:7000人
統計的仮説検定をすると、両側p値はp <0.001となります。
有意差ありなので、要因Aは曝露と関連があることにも当てはまると考えるかもしれません。
しかし、このように、統計的仮説検定を用いて交絡要因であるか否かを判断するのは、正しくないやり方なのです。
統計的仮説検定は一種の背理法です。
わざわざ反対の「差がない」という仮説を立てて、この仮説が否定されるかどうかを考えました。
ここで注意しなければならないことは、仮説が否定できなかったからといって、差がないとは言えないということです。
差があるとは言えなかった、以上のことは何も言えないのです。
要因Aについては、「要因Aと肺がん発生の有無には関係がない」
「要因Aと喫煙の有無には関係がない」
という仮説に対して統計的仮説検定をしていることになります。
有意差がなかったとしても、これらの間に関係がないとは絶対に言えないのです。
つまり、統計的仮説検定の結果から「要因Aが交絡要因ではない」と判断することはできないのです。
また、統計的仮説検定には、まったく意味のないような差であっても、人数が多いだけで、有意差ありとなったり、逆に意味のあるような差であっても人数が少ないだけで有意差なしとなったりする特徴があります。
要因Aについては、単に人数が多いだけで有意差ありとなったのかもしれません。
これらのことからわかるように、
ある要因が交絡要因であるかどうかを検討するために統計的仮説検定をすることにはあまり意味がない。
のです。
それからもう1つ、統計的仮説検定を用いるように、機械的に交絡要因であるか否かを判断するやり方では、「要因Aは中間変数ではない」については調べることができません。
要因Aが何者なのかがわからないと、要因Aが曝露の原因なのか結果なのかが判別できません。
ある要因が交絡要因であるかどうかを機械的に検討することはできないのです。
では、いったいどうやって、ある要因が交絡要因であるかどうかを検討すればよいのでしょうか。
機械的に検討することができないのだから、機械的ではない方法で検討すればよいのです。
つまり、
医学的な常識や過去の研究結果からの知見に基づいて、ある要因が交絡要因であるかどうかを検討するのです。
例えば、要因Aが年齢だとしましょう。
すると、要因Aは対象としているイベントのリスク要因であることにあてはまると考えられます。年齢が高いほど肺がんに罹る可能性が高くなるというのは、医学的な常識でしょう。
要因Aは曝露と関連がある、にもあてはまります。若い世代よりも中高年で喫煙割合が高いのではないでしょうか。
要因Aは中間変数ではない、にも当然あてはまります。喫煙するほど実年齢が高くなったり低くなったりすることはありません。
したがって、年齢は交絡要因と判断されることになり、年齢(要因A)で層別していない結果(リスク比=2.00)は正しくないことになります。
では、要因Aが飲酒の有無だったらどうでしょう。
要因Aは対象としているイベントのリスク要因である、にはきっとあてはまりません。飲酒が肺がんのリスク要因だという話はないと思います。
だとすると、今度は飲酒(要因A)で層別した結果(リスク比=1.00)が正しくないことになります。
交絡要因であるかどうかの判断が異なると、解析結果も異なる可能性があります。
当たり前といえば当たり前なのですが、その道のエキスパートでない人が研究をすると、誤った結論を導き出してしまう可能性があるのです。
出生時体重のパラドックス
先ずは、次の文章を読んでみてください。
次の表は、アメリカでシングルマザーを対象として、母親の妊娠中の喫煙の有無別に、1997年に生まれた乳児の生後1年以内の死亡をまとめたものです。
母親の妊娠中の喫煙 出生児数 生後1年以内の死亡
あり 393718 3921
なし 2590787 15225
合計 2984505 19146
リスク比を計算すると、
3921/393718/15225/2590787=1.69
です。喫煙ありグループでは、喫煙なしグループに比べて、乳児の生後1年以内の死亡が1.69倍多かったということです。
多くの人が思っているだろう通り、妊娠中に喫煙する方が乳児の死亡リスクが高くなっています。
この表を、乳児の出生時体重2500g以上と未満で層別して集計すると、次の表のようになります。
乳児の出生時体重 妊娠中喫煙 出生児数 生後1年以内の死亡
2500g以上 あり 353335 1729
2500g以上 なし 2453633 5838
2500g未満 あり 40383 2192
2500g未満 なし 137154 9387
リスク比を計算すると、出生時体重2500g以上の層では、
1729/353335/5838/2453633=2.06
となります。やはり妊娠中に喫煙する方が乳児の死亡リスクが高くなっています。
しかし、出生時体重2500g未満の層では、
2192/40383/9387/137154=0.79
となります。
リスク比の値が1よりも小さくなっているので、出生時体重が2500g未満の場合においては、逆に、妊娠中に喫煙しない方が乳児の死亡リスクが高くなることになってしまいます。
ほとんどの人があり得ないと思っていることが起こっているので、これはbirth weight paradoxと呼ばれています。
この結果を鵜呑みにすると、子どもの出生時体重が2500g未満になるのだったら、母親はタバコを吸っていた方がいい、ということになってしまいます。
本当にそうなのでしょうか。
出生時体重2500g未満の層では、妊娠中に喫煙しない方が乳児の死亡リスクが高くなるという結果でした。
出生時体重が交絡要因であるかどうかを検討するために、
先ず、出生時体重が対象としているイベントのリスク要因であるかどうかを考えます。
これは当てはまると考えられます。出生時体重が低いと死亡リスクは高くなります。
次に、出生時体重は曝露と関連があるかどうかですが、これも当てはまると考えられます。母親が妊娠中に喫煙すると、乳児の出生時体重が低くなる傾向があります。
最後に、出生時体重は中間変数ではない、についてですが、これは当てはまらないと考えられます。
母親が喫煙することによって乳児の出生時体重が低くなり、その結果として、乳児の死亡リスクが高くなると考えられます。
つまり、出生時体重は中間変数なのです。
また、中間変数で層別したり、中間変数の影響を除去しようとする解析をしたりすると、解析結果が間違ったものになってしまいます。
だから、出生時体重で層別したこの結果は正しくないことになります。
交絡の影響を除去することによって、母親の喫煙の乳児に死亡への効果(因果関係)がわかったとしたら、次の段階として、直接的な効果(母親が喫煙することが出生時体重に影響し、その結果として乳児の死亡リスクがどうなるのか)に興味がうつるかもしれません。
このような直接的な効果と間接的な効果を推定する方法が整備されてきています。
統計学も進歩しているのです。
関連記事