バイアス克服!ケースコントロール研究で稀な疾患解明へ【ChatGPT統計解析】
ケースコントロール研究は、稀な疾患の病因解明に適した手法であるが、多くのバイアスが含まれやすい。データ収集は後ろ向きで、記憶や記録に頼ることが多く、特に疾病過程が危険因子の水準に影響を与える場合、解釈が難しい。選択バイアスや志願者バイアス、思い出しバイアスなどが生じやすく、結果に影響する可能性がある。ケース群とコントロール群で同じ観察法を適用し、測定の妥当性と再現性を確認することが重要である。多因子の影響を一度に調査できるが、発生率や有病率は推定できず、オッズ比やリスク比から間接的な推定が行われる。研究結果の信頼性を高めるため、他のデザインと結果が一致するか検討し、生物学的妥当性も考慮する必要がある。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
ケースコントロール研究のデータ解析
従来の後ろ向きケースコントロール研究では,現在の時点でデータを収集するが,後ろ向きのアプローチであり,記憶や記録に頼るものである,
現在の曝露レベルは,対象疾患にかかる以前の曝露レベルを反映するものだと想定することもあるが.多くの場合,この想定は正しくない.
疾病過程は危険因子の水準に影響を及ぼすことが多いからである.
このことは,ヶ−スコントロール研究の解釈を困難にすることがある.
他の研究デザインでもいえることだが,対象とする要因と観察時の状況は明記し,ケース群とコントロール群の両方で同じ観察法を適用する.
測定技術の妥当性と再現性を研究実施中に確認,評価しなければならない.
ケースコントロール研究を始めとし.様々な疫学研究デザインで生じがちなバイアスについて, Sackettが詳述している.
対象者を選抜し募集する段階で生じやすいバイアスがいくつかある.
志願者バイアス(volunteer bias)については前述したが,参加を志願する者は志願しない者に比べて重要な点で異なる,というものである.これは「健康志願者」効果と呼ばれている.
有病/罹患バイアス(prevalence or incidence bias)とは,遠い過去に曝露や影響を受けた集団を対象とする場合,短期間のあるいは致死的なエピソードを見逃すことによるバイアスである.
例えば,研究参加よりも何年も前に心筋梗塞を起こした患者をヶ−スとした研究には,非常に重篤な患者あるいはうっ血性心不全や不整脈で早期に死亡した患者は含まれていないだろう.
一過性のエピソード,軽症・無症候性の症例や,曝露のエビデンスが疾患発症とともに消失してしまう症例(うっ血性心不全発症時の高血圧など)は,すべてケースコントロール研究におけるバイアスの一因となり得る.
このような場合,発症時の年齢,罹病期間.重症度を推定しておくことが役立つであろう.
メンバーシップ・バイアス(membership bias)は,あるグループの会員であること自体が一般集団の健康状態と系統的に異なる可能性をいう.
特に雇用者・移住者の集団において問題となり,「健康労働者効果(healthy worker effect)」,「健康移住者効果(healthy migrant effect)」と呼ばれる.
同一労働者の集団内,同一移住者の集団内からコントロールを選ぶことで対処できるが,その研究から得られた結果の一般集団全体への一般化は.制限される可能性があることには留意すべきである.
データ収集段階に発生しがちな重要なバイアスは他に,診断疑いバイアス(diagnostic suspicion bias),曝露疑いバイアス(exposure suspicion bias),思い出しバイアス(recall bias).家族情報バイアス(family information bias)がある.
診断疑いバイアスは,疾患原因と想定される要因の曝露歴(例:ホルモン補充療法など)がわかっていることが,診断プロセスの徹底
度と診断結果を左右してしまう場合に生じる(例:子宮内膜がんのスクリーニング).
曝露疑いバイアスは.被験者の疾病の有無(中皮腫など)がわかっていることが,想定される病因(アスベストなど)の曝露の探索の徹底度と探索結果を左右してしまう場合に生じる.これに深く関連するのが思い出しバイアスである.
ケースの人は,疾患を引き起こした可能性のあるどんな曝露についても,熱心に思い出そうとする一方で,コントロールの人はそれらの曝露について全く考えない,とすればバイアスが生じる.
家族情報バイアスは,家族の誰かがある疾患にかかった時,そのことによって曝露とアウトカムに関する家族内の認識が影響される場合に起こる.
例えば,家族の誰かが自分と同じ症状を呈し始めるまでは一度も話題に上がらなかった稀な家族性疾患のように.
ケースコントロール研究の結果は,曝露情報を行にとり,対象疾患の有無を列にとった「2×2」分割表で示されることが多い.セルは曝露したケースの人数,曝露したコントロールの人数,行の合計は曝露した総人数を示す.
列の合計はそれぞれケースとコントロールの人数を示す.
ケース群内の曝露の割合とコントロール群内の曝露の割合を自由度1のカイ2乗検定で比較する.
ケースとコントロールの間で連続変数の平均値や分布を比較する場合,正規分布に従う変数にはt検定を.正規分布に従わない変数にはノンパラメトリック検定を用いる.
曝露と疾患の有無の関連性の他の指標については,「オッズ比,リスク比,相対リスク,寄与リスク」を用いる.
メリット/デメリット
ケースコントロール研究は,稀な疾患の病因の研究には,おそらく唯一の現実的な方法であろう.
稀な疾患の場合,人ロペース(population basis)で調査することが難しいからである.
母親の妊娠中のスチルペストロールへの曝露と,長い年月を経て女性の子どもに稀な腫瘍が発生することとの関連性を調べるためにケースコントロール研究を用いた, Herbstらの研究が有名な例である.
新たな発生はみられるが,若い女性では非常に稀な腺がんであったことが,この研究につながった.
多くのバイアスの影響を受けやすい研究であるとはいえ,新たな発生がみられる非常に稀な疾患において,予防可能な危険因子を特定するという点で.ケースコントロール研究がもつ極めて大きな価値は否定することはできない.
このデザインを選択した場合に,ケースの人数が論点となり得る.
Schlesselmanの推定では.発生率が1,000人中8人の疾患をコホート研究でみる場合,2倍高いリスクを検出するのには,曝露ありの集団3,889人,曝露なしの集団3,889人が必要となる。
一方.ケースコントロール研究では,ケース群188人.コントロール群188人で足りてしまう.
さらに有病率が低い, 1,000人中2人の疾忠だと,2倍高いリスクを検出するのに曝露ありの集団約15,700人,曝露なしの集団約15,700人を要するところを,ケースコントロール研究では,ケース群,コントロール群,それぞれたった188人ずつで足りてしまう.
ケースコントロール研究の特徴として,複数の病的因子の影響を一度に調査できる点がある.
ケースコントロール研究の重要な前提条件が満たされる限り(ケースはすべてのケースを代表する.
コントロールは対象疾患なしの集団を代表する.
データ収集はケースとコントロールにかかわらず同じ方法で行われる),
結果として得られる関連性とリスク推定値は他の研究デザインから得られるものと一致する.
他の研究デザインの結果と矛盾するのは,大抵,前出の条件が守られなかったことによる.
ケースコントロール研究のデメリットとして,発生率や有病率が推定できない点がある.
分子またはケースの抽出源である,分母または母集団は,不可知なことが多いために,発生率や有病率を推定できない.
「オッズ比,リスク比,相対リスク.寄与リスク」の項で説明されるように,相対リスクはオッズ比から間接的にしか推定できないが,その推定値さえも疾患が稀でない場合にはバイアスの入った値となり得る.
選択バイアス,思い出しバイアスなどにより,見かけ上の関連性が生じてしまう可能性がある.
ケースコントロール研究で関連性が示唆されたら,因果関係を推定する前に,ラボラトリで生物学的妥当性(biologic plausibility)について,また,他の研究デザインから得られた結果との一貫性について,考察する必要がある.
サンプルサイズが相当に大きい場合や,ケース群で曝露が多くみられることがわかった場合(例:上述の母親のスチルベストロールへの曝露)を除いては,ケースコントロール研究で稀な曝露要因を調査するのは難しい.
最後に,曝露と疾患の前後関係の確認の難しさがある.
しかし,稀な事象について原因究明を目的とする場合には.ケースコントロール研究は適切なデザインであり,事実上,潜在的な危険因子を調べる唯一の方法であろう.
関連記事