臨床研究における欠測データの影響と対策【ChatGPT統計解析】
臨床研究における欠測データ(missing data)は、試験途中の被験者の脱落や検査の失敗、プロトコール逸脱などの理由で発生し、検出力の低下や群間比較の妨げ、最悪の場合には誤った結論に繋がる問題がある。欠測データには「完全にランダムな欠測(MCAR)」「ランダムな欠測(MAR)」「無視できない欠測(MNAR)」があり、Rubinは解析手法に応じてこれらを分類している。MCARは観測値と無関係なメカニズムで生じるため、無視しても系統的バイアスを招かないが、MARは観測データに基づき欠測が生じるため、被験者を除くとバイアスが生じる可能性がある。MNARは観測されない応答に依存して欠測が生じ、理由が不明の場合、統計モデルで調整することが難しいため、感度解析が必要となる。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
欠測データ
臨床研究における欠測データ(missing data)に生じる重要な問題を示す.
我々は,異なる種類の欠測データと,解析においてそれらを扱うための方法の概略を議論する.
欠測データは臨床探索の場で多くの理由から生じる.
被験者は,試験への関心を失う,臨床の現場から引っ越す,あるいは試験の完了を妨げる健康上のイベントが発生する,といった理由で試験の途中で脱落する.
欠測データはまた,難しい検査法における検査の失敗,臨床検体の汚染,そして評価の欠落を生むことになるプロトコールの逸脱などの技術操作上の理由からも発生し得る.
観察データでは無応答が懸念される.
調査サンプリングでは.返却されなかった調査票もしくはスキップされた設問項目がデータ欠落の一般的な理由である.
欠測データには問題が多い.計画よりも少ない観測数になるため,少なくともこれらは試験で有意な結果を得るための検出力を低下させる.
さらにたちの悪い問題は,特に欠測データの生じる理由あるいは割合が群によって異なる場合,欠測データはランダム化を崩し群間の比較可能性を損なう可能性があることである.
最悪の場合,大量の欠測データが誤った結論を導くことがある.
欠測データを扱うための解析手法がいくらか存在するが,欠測したデータを消去するほど効果的な統計モデルはなく,それらの成果はどれだけモデルに対する仮定が妥当であるかにかかっている.
欠測データの種類
Rubinは,異なる解析アプローチの要求に応じた欠測データのための用語を提示している.欠測データは以下の種類に分類することができる.
・完全にランダムな欠測(Missing completely at random, MCAR):この種類の欠測が生じるメカニズムは,観測されるだろう応答の値と無関係である.
MCARデータは,事例をあげれば冷凍庫の故障,臨床検査室での検体の破損,被験者がその地域から引っ越した後に試験から脱落した,といったことから生じる.
MCARは非系統的であるということを意味しないことに注意して欲しい.
例えば,壊れた冷凍庫は試験のある週のすべてのデータを抹消してしまう可能性がある.
しかし,この種類の欠測は無視しても系統的バイアスを混入させることはない.
・ランダムな欠測(Missing at random, MAR):欠測応答と無関係であると示しているように見えるこの不運な用語は,実際には我々が観測したデータを考慮すれば欠測は結果とは無関係であるということを意味する.
主要な応答変数である体重の変化が,ランダム化の後に30日間測定される試験を考えてみよう.
30日目においてある被験者が不在となるといった事態が,彼が体重が増加していることを恥じたことによって起こるかもしれない.
その欠測は30日目の結果に関連するが,もし我々が29日目まで日々観察された彼の体重の軌跡から推測できるのであれば,それはMARである.
MARに関するもう1つの考え方は,同じベースライン値と中間値を持つ2人の被験者について考慮することである.
もし2人のうち1人の応答が欠測した場合でも,彼の欠測値はもう1人で観測されている応答と似ているはずであるということをMARの仮定は暗に示す.
MARデータを持つ被験者を除くことは,深刻なバイアスを引き起こす可能性がある.
体重減量試験の例では,それは悪化している被験者を除くことになる.
・無視できないまたはランダムでない欠測(Non-ignorable or missing not at random, MNAR):もし我々が観測したすべてのデータを考慮したとしても,データが欠測であることの確率が観測されない応答に依存するのであれば,それは無視できない欠測データである.
先ほど引用した体重減量試験を,体重の測定は例えば2週毎のようにずっと少ない頻度で行われるものとして考えてみよう.
もし被験者の成績が最後の10日間のみにおいて悪くなり始めるのであれば,第2週の測定値は体重減少の低下を反映することはなく,そして我々は応答が欠測するかどうかの予測をすることはできなくなる.
脱落の理由が未知の場合,それを統計モデルで明確に調整することは不可能になる.
プラセボ群と治験治療群とで脱落の理由が異なることは,両者の比較可能性を壊してしまう.
欠測データの理由がわからないことは頻繁にあるので,異なる可能性を持つ欠測データに対して試験結果の感度を調べるための解析は考慮されなければならない.
臨床研究において欠測データ(missing data)の発生は非常に重要な問題であり、正確で信頼性のある結論を得るためには欠測データが試験結果に与える影響を十分に理解し、適切な対処が求められます。欠測データは、被験者が試験に対する関心を失う、臨床現場から引っ越す、あるいは試験の完了を妨げる健康上の問題が発生するなどの理由で発生します。例えば、長期間にわたる試験において、被験者が中途脱落することは欠測データの大きな要因のひとつです。さらに、欠測データは検査方法が難しいことによる検査の失敗、検体の汚染、プロトコールの逸脱といった技術的な操作の問題でも発生します。観察データでは無応答が懸念され、また調査サンプリングにおいては、調査票が返却されなかったり、特定の設問項目が回答されなかったりすることがデータ欠落の一般的な理由として挙げられます。このような欠測データの発生は、計画された観測数よりも少ないデータしか得られなくなるため、試験で統計的に有意な結果を得るための検出力を低下させる可能性があります。欠測データの存在は、特に欠測の発生する原因や割合が群によって異なる場合に問題となり、ランダム化の原則を崩し、群間の比較可能性を損なう可能性があります。最悪の場合、大量の欠測データが存在すると試験結果が誤った結論を導くこともあり得ます。欠測データを扱うためにはいくつかの解析手法が存在しますが、欠測データを無視したり単純に除外したりするだけでは統計的に効果的なモデルを構築することは難しく、欠測データが発生した理由やそのデータが欠測したこと自体が試験結果にどのように影響するかを慎重に検討する必要があります。欠測データの解析手法の適用結果は、統計モデルに対する仮定がどれだけ妥当であるかに依存しているため、欠測データの存在による試験結果の偏りを最小限に抑えるようなアプローチが求められます。欠測データはRubinによって「完全にランダムな欠測(Missing completely at random, MCAR)」「ランダムな欠測(Missing at random, MAR)」「無視できない欠測またはランダムでない欠測(Non-ignorable or missing not at random, MNAR)」の3つに分類されています。これらの分類は、欠測データの発生メカニズムを解析し、適切なアプローチを選択するための基礎となります。まず、MCARは欠測データが観測値と無関係なメカニズムで発生する場合を指し、冷凍庫の故障や検体の破損、被験者の引っ越しなどが例に挙げられます。この欠測データは無視しても系統的なバイアスをもたらさないため、試験結果に対する影響は比較的軽微であると考えられますが、注意が必要なのは、MCARが非系統的であるというわけではない点です。たとえば、冷凍庫の故障が特定の週に全てのデータを欠測させることもあり得ますが、この場合も、欠測が無作為であるため試験結果に有意なバイアスを引き起こすことはありません。次に、MARは観測されたデータをもとにして欠測が発生する場合を指します。たとえば、体重減量試験において、被験者が体重が増加していることを恥じて最後の測定日に参加しなかった場合、その欠測データは最終的な結果に関連しますが、被験者のこれまでの体重推移から最終日の体重を推測することが可能であれば、MARとして扱うことができます。このような場合、MARデータを持つ被験者を除外するとバイアスが発生しやすく、結果に偏りが生じる可能性があるため注意が必要です。特に、同じベースライン値と中間値を持つ2人の被験者のうち1人の応答が欠測した場合でも、他方の被験者の応答と似た結果が得られると仮定されることがMARの基本的な前提とされます。最後に、MNARは観測されたデータを考慮しても欠測が発生する可能性が観測されていない応答に依存する場合を指します。例えば、体重減量試験で最後の10日間のみ体重が増加し始めた被験者のデータが欠測した場合、これはMNARに分類されます。この場合、欠測が発生する原因や時期が未知であるため、欠測データの予測や補完が難しく、結果に対する影響が大きいことが特徴です。MNARデータが発生すると統計モデルで調整することが困難となり、特にプラセボ群と治療群で欠測データの発生理由や割合が異なる場合、両群の比較可能性が崩れてしまうリスクがあります。欠測データがMNARであると仮定される場合、欠測データの理由が不明確であることが多いため、複数の欠測データシナリオを想定して感度解析を行うことが重要です。感度解析とは、異なる仮定のもとで欠測データが試験結果にどのような影響を及ぼすかを検討し、欠測データの影響が試験結果の信頼性にどの程度影響を与えるかを評価する方法です。これにより、欠測データが結果に与える影響を定量化し、結果の妥当性を判断することができます。また、欠測データを補完するための方法として、リストワイズデリションやペアワイズデリション、平均補完法、回帰補完法、多重代入法(multiple imputation)などが知られています。リストワイズデリションは、欠測データを含む観測単位を除去する方法ですが、データ数が減少し、統計的検出力が低下する欠点があります。ペアワイズデリションは、分析ごとに利用可能なデータを使用するため、欠測データのある変数を除外せずに計算を行う方法です。平均補完法は、欠測データの代わりに平均値を使用しますが、データの分散が低くなり、結果が過剰に平滑化されることがあります。回帰補完法は、観測されたデータから回帰モデルを構築し、その予測値を欠測データに代入する方法ですが、補完後のデータが実際の変動を反映していない可能性があります。多重代入法は、欠測データを複数回補完してそれぞれで解析を行い、その結果を統合する方法であり、欠測データの不確実性を反映しやすい特徴があります。多重代入法は特にMARの欠測データに対して有効とされ、欠測データの影響を最小限に抑えることが可能です。しかし、いずれの補完方法も仮定が誤っている場合にはバイアスが生じる可能性があるため、欠測データがどのメカニズムで発生しているかを考慮し、適切な方法を選択することが重要です。したがって、欠測データを処理する際には、まず欠測データの種類を適切に識別し、そのメカニズムに基づいた最適な解析手法を選択することが求められます。
関連記事