臨床試験における欠測データ解析の最適解【ChatGPT統計解析】
臨床試験や観察研究における欠測データの扱いには多くの手法が存在し、米国学術研究会議の報告書はその代表的な情報源です。欠測データがMCARである場合には、完全データのみを使用する解析法(CC解析)がバイアスを避ける方法としてありますが、通常は全データを用いた洗練された手法が推奨されます。補完法では、欠測値を他の観測値で補う単一値代入法や、不確実性を考慮した多重代入法があり、MARデータの解析にはさらに高度な統計モデルを利用する傾向解析や層別解析も提案されています。最尤法や混合モデルでは、観察データから治療効果を推定し、感度分析では仮定を変えた再解析で結果の頑健性を確認します。最悪データによる解析は新規治療が標準治療と比べられる際に用いられ、欠測データに最悪または最良の値を代入することで保守的な結果を得られる方法です。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
欠測データを扱うための手法
臨床試験と観察研究の双方の分野における欠測データの統計的方法に関して,たくさんの有用な参考書が出版されている.
米国学術研究会議(National Research Council)の報告書「The Prevention and Treatment of Missing Data in Clinical Trials」は,欠測データを減らすための試験デザインから欠測データの解析方法までを包括的に扱った議題を示した,1つの優れたオンライン情報ソース(無償で利用可)である.
欠測データがMCARである時,完全なデータのみを持つ観察例を解析に用いる完全データによる解析(complete case analysis. CC)は,適用が容易でバイアスを混入させることがない.
ただ通常は,もっと洗練された統計的方法がすべての被験者(完全データのみを持つ者だけではない)の利用可能なデータに効果的に適用することができるので,CC解析はこれが正当化できる場合でも一般には勧められない.
完全データによる解析はそのデータがMCARである場合にのみ適切な手法である.
補完(imputation)法は,欠測した値をデータ中の他の観察に基づく1つと入れ替える方法で, MCARとMARの下で適用することができる.
単一値代入法(single imputation)は,観測されているデータの平均値のような1つの値を欠測値に代入する方法である.
もしデータがMARであるならば,その補完方法は適切な統計モデルから得なければならない.
例として,ある者は,毎日体重を測定する体重減量試験で観測されなかった30日目の体重を0-29日目の体重から回帰を使って推定するかもしれない.
その他の単一値代入法の例ではlast observation carried forward,(LOCF), baseline observation carried forward.(BOCF),そしてlast rank carried forward, (LRCF)と呼ばれる手法がある.
LOCFは.欠測値に観測されている最直前の値を代入する使い古された手法だが限定的な状況においては非常に有用である.
1つの例は血圧に対する食事療法の効果を見る短期試験で,ある被験者の血圧が.彼が何らかの降圧剤治療を受けるに十分なほど上がった場合である.
薬物治療を受ける直前の血圧は,彼が治療を受けなかったとしたら試験の終わりに示すだろう血圧の妥当な推測値となる.
単一値代入法に対する1つの批判は,この種の解析から得られる推定値の標準誤差は,補完された値の不確実性を考慮していないので,過小に評価されているというものである.
対して多重代入法(multiple imputation)は,補完のためにモデルを何回か使用し.1つの補完から次の補完の問の変動を標準誤差の計算に用いている.
補完を行う以外の多様な手法が. MARデータを扱うために提案されている.
それらの手法は,観察されたデータから適切な統計モデルを使用して情報を取り入れる.
傾向解析は,データに欠測が発生するかどうかに関するベースライン予測因子を探すことを試みる方法で,欠測が生じる尤度の解析を屑別あるいは調整して行う.
層別解析においては.それぞれの層での治療効果を推定し,そして層内の推定値を併合して全体の治療効果を推定する.
この方法は,ベースラインの特性が正確に欠測値を予測するものであればうまく機能するが,そういったことはそう頻繁には起こらない.
その他の方法では,治療効果の推定を補助するためにランダム化後のデータを用いることがある.
例えば,繰り返し測定のある体重減量試験での1つの方策として,個々の被験者それぞれの体重と時間の間の関係の傾きを解析したりする.
混合モデルは,似たような解析をする少しばかり洗練された方法である.
30日目が欠測であるという実際については,0-29日目で観測されている体重を用いて傾きを確実に推定できるので,そのことに大きな影響はない.
最尤法もまた,治療効果のようなパラメータの最良推定値を決定するために,そのような観察データと想定されるモデルを使用する.
欠測データが無視できない,あるいはその可能性が懸念される時,欠測データは観察データを用いたモデル解析では説明することはできない.
この場合の妥当なアプローチとしては感度分析を行うことである.
すなわち,データを様々な欠測データに対する仮定の下に再解析して,結果がどのように変わるかを調べることを行う.
データがなぜ欠測するかという理由について,我々は決して確信を持つことはできないので,常に感度分析を行うようにすることは良い考えである.
第1相と第H相試験において.新規の治療が標準的な治療と比較される時,非常に保守的となる解析アプローチが「最悪データによる解析(worst case analysis)」である.
この解析では,可能性のある最悪の値を新規治療群の被験者のすべての欠測値に,最良の値を対照群の被験者の欠測値に代入する.
例えば,生存率を評価項目としたランダム化プラセボ対照試験では.最も短い生存期間が治験治療群の被験者に,最長の生存期間がプラセボ群の被験者に代入される.
このことによって明らかに治療の有益性を主張することは困難になる.
二値データのためのいくらか緩やかだがなお保守的なアプローチについてはProschanらによって研究されている.
欠測データを扱う手法について、臨床試験と観察研究の双方の分野において広範な研究と実践的な手法が発展してきました。欠測データは、特に臨床試験などの研究において統計解析における重要な課題とされており、その扱い方によって結果の妥当性や信頼性が大きく左右されます。欠測データを適切に扱うための手法にはさまざまなものがあり、その選択はデータの欠測の性質や研究の目的によって異なります。まず、欠測データの発生には主に三つの種類があります。第一に、完全にランダムに欠測している場合(MCAR)は、データの欠測が他の変数とは関係なくランダムに発生していると仮定されるケースです。この場合、欠測データは統計解析にバイアスをもたらさないと考えられます。第二に、条件付きランダム欠測(MAR)では、欠測の有無が他の観測可能なデータの値によって説明できるとされるため、これも適切な統計手法で扱うことでバイアスを減少させることが可能です。第三に、非ランダム欠測(MNAR)は、欠測が欠測値そのものに依存している場合で、一般的には最も扱いが難しいとされています。こうした欠測データの性質を理解することは、適切な解析手法を選択する上で極めて重要です。
MCARの場合、解析に完全なデータのみを使用する「完全データ解析(complete case analysis, CC)」が簡便かつ有効な方法となります。この手法では、欠測データがない観察例のみを使用することで、データの偏りを排除することができます。しかし、データ全体に対する統計的パワーが減少するため、すべての状況で適用可能とは限りません。実際には、欠測データが発生している場合でも、CC解析を適用することは、全ての被験者のデータを使用することが難しい場合やデータがMCARであることが確信されている場合に限られます。一般的に、CC解析は実務上あまり推奨されないことが多いですが、非常にシンプルな方法であるため、欠測データの性質が明確に分かっている場合には選択肢となり得ます。
一方、欠測データに対するもう一つの基本的なアプローチとして、補完(imputation)法が挙げられます。この手法は、欠測データをデータ中の他の観測値に基づく推定値で補うことでデータセットを完全なものとして扱う方法です。補完法には、代表的な方法として単一値代入法(single imputation)と多重代入法(multiple imputation)があります。単一値代入法は、欠測値に1つの値、たとえば平均値や他の統計量を代入するもので、シンプルですが欠測値に対する不確実性が考慮されないため、推定結果のばらつきが過小評価されるリスクがあります。たとえば、体重減量試験において、観測されなかった30日目の体重を0日目から29日目までの体重データからの平均値で補完する、といった方法が考えられます。しかし、こうした補完方法は、欠測データの性質がMCARやMARである場合にのみ適切とされます。単一値代入法の他にも、ラストオブザベーションキャリー・フォワード法(LOCF)やベースラインオブザベーションキャリー・フォワード法(BOCF)などの方法も存在し、LOCFは特に限定的な状況で有用とされ、欠測データに直前の観測値を代入する方法で、多くの研究で古典的な手法として利用されています。たとえば、血圧に対する食事療法の短期試験で、被験者が降圧剤治療を受けることになると、薬物治療前の血圧を欠測データに代入することで、治療の効果を測定する上で有用な指標を得ることができます。
しかし、単一値代入法には上述のような欠点があるため、多重代入法が用いられることが増えてきています。多重代入法は、欠測データに複数の値を代入し、そのばらつきから標準誤差を計算する手法で、欠測値の不確実性を考慮できるため、より妥当な推定が可能です。多重代入法では、複数のデータセットを生成し、これらを統合して解析することで、欠測データの影響を減少させることができます。たとえば、体重減量試験において30日目の欠測データに対して複数の推定値を用いて補完し、各々の推定値のばらつきを解析に反映させることができます。このように、多重代入法は欠測データがMARである場合に特に有効です。
欠測データがMARの場合、補完法以外にもいくつかの方法が提案されています。傾向解析は、欠測データが生じる可能性のある予測因子を特定し、それに基づいて欠測データの発生確率を調整する方法で、欠測が発生する可能性を層別したり調整したりして、欠測によるバイアスを軽減します。たとえば、体重減量試験において、体重と時間の間の傾向を解析し、各被験者の体重変化を考慮に入れて分析する方法です。この方法では、欠測が生じるベースライン予測因子があれば、それらの因子を層別することによって、欠測データが解析に及ぼす影響を最小限に抑えることが可能です。また、層別解析では、層内での治療効果を推定し、層ごとの推定値を併合して全体の治療効果を推定する方法が用いられます。
さらに、観測されたデータから欠測データに関する情報を取り入れる方法も存在し、混合モデルや最尤法もその一例です。混合モデルは、観測データのばらつきや傾向を解析に組み込むことで、欠測データの影響を軽減しつつ推定を行う手法です。最尤法は、欠測データの影響を考慮し、観測データと統計モデルを組み合わせて治療効果や他のパラメータを推定します。特に体重減量試験においては、30日目のデータが欠測であっても、0日目から29日目までのデータから傾きを推定することで、欠測が大きな影響を及ぼすことなく推定が行える点が優れています。
感度分析も欠測データの取り扱いにおいて重要なアプローチです。感度分析は、欠測データに関する仮定が結果にどのような影響を及ぼすかを評価する方法で、異なる仮定のもとでデータを再解析し、結果の一貫性や頑健性を検証します。データが欠測する理由については常に確信が持てないため、複数の仮定を用いた感度分析は欠測データ解析において不可欠とされています。欠測データが無視できない、またはその可能性が懸念される場合、観測データを用いたモデル解析のみでは説明が困難なため、感度分析を実施することによって解析結果の信頼性が向上します。
臨床試験や観察研究の分野では、欠測データの取り扱いは統計解析において重要な課題となっており、そのため多くの有用な参考書や資料が出版されています。特に、米国学術研究会議(National Research Council)が発行した報告書「The Prevention and Treatment of Missing Data in Clinical Trials」は、欠測データを減らすための試験デザインから欠測データの解析方法までを包括的に扱った優れた情報源であり、オンラインで無償で利用可能です。この報告書は、欠測データの問題に取り組む研究者や統計学者にとって重要な指針となっています。欠測データの解析において、欠測のメカニズムを理解することは極めて重要です。データが完全にランダムに欠測する(MCAR)の場合、完全なデータのみを持つ観察例を解析に用いる「完全データによる解析」(Complete Case Analysis、CC解析)は、適用が容易でバイアスを導入しない方法として知られています。しかし、通常はより洗練された統計的方法が存在し、これらの方法は完全データのみを持つ被験者だけでなく、すべての被験者の利用可能なデータを効果的に活用することができます。そのため、CC解析はMCARが正当化できる場合にのみ適切であり、一般的には推奨されません。補完法(Imputation)は、欠測した値をデータ中の他の観測に基づいて補う方法であり、MCARやランダムに欠測する(MAR)の条件下で適用することができます。単一値代入法(Single Imputation)は、観測されているデータの平均値などの一つの値を欠測値に代入する方法です。しかし、データがMARである場合、その補完方法は適切な統計モデルから得る必要があります。例えば、体重減量試験で30日目の体重が観測されなかった場合、0日目から29日目までの体重データを用いて回帰分析により30日目の体重を推定することが考えられます。その他の単一値代入法の例として、直前の観測値を欠測値に代入する「直前値補完法」(Last Observation Carried Forward、LOCF)、ベースラインの値を代入する「ベースライン値補完法」(Baseline Observation Carried Forward、BOCF)、順位情報を用いる「最後の順位補完法」(Last Rank Carried Forward、LRCF)などがあります。LOCFは古くから使われている手法で、限定的な状況下では非常に有用です。例えば、血圧に対する食事療法の効果を調べる短期試験で、被験者の血圧が降圧剤治療を受ける必要があるほど上昇した場合、薬物治療を受ける直前の血圧値は、もし治療を受けなかったとしたら試験終了時に示すであろう血圧の妥当な推測値となります。しかし、単一値代入法に対する批判として、この種の解析から得られる推定値の標準誤差は、補完された値の不確実性を考慮していないため、過小評価されることが挙げられます。これに対して、多重代入法(Multiple Imputation)は、補完のために統計モデルを複数回使用し、一つの補完から次の補完までの間の変動を標準誤差の計算に取り入れることで、不確実性を適切に反映します。補完を行う以外にも、多様な手法がMARデータを扱うために提案されています。これらの手法は、観測されたデータから適切な統計モデルを使用して情報を取り入れます。傾向解析(Trend Analysis)は、データに欠測が発生するかどうかに関するベースラインの予測因子を探すことを試みる方法であり、欠測が生じる確率の解析を層別化や調整して行います。層別解析では、それぞれの層での治療効果を推定し、層内の推定値を統合して全体の治療効果を推定します。この方法は、ベースラインの特性が欠測値を正確に予測できる場合にはうまく機能しますが、そのようなケースは頻繁には起こりません。その他の方法として、治療効果の推定を補助するためにランダム化後のデータを用いることがあります。例えば、繰り返し測定を行う体重減量試験において、個々の被験者それぞれの体重と時間の関係の傾きを解析することが一つの方策です。混合モデル(Mixed Models)は、これと似た解析を行うより洗練された方法であり、欠測データがあっても他の観測データを用いて効果的に推定を行うことができます。30日目が欠測であるという実際については、0日目から29日目までの観測されている体重データを用いて傾きを確実に推定できるため、そのことに大きな影響はありません。最尤法(Maximum Likelihood Estimation)もまた、治療効果のようなパラメータの最適な推定値を決定するために、観測データと想定されるモデルを使用します。これらの方法では、欠測データが分析に与える影響を最小限に抑えることが可能です。欠測データが無視できない、あるいはその可能性が懸念される場合、観測データを用いたモデル解析では欠測データを十分に説明することができません。このような場合の妥当なアプローチとして、感度分析(Sensitivity Analysis)を行うことがあります。つまり、データをさまざまな欠測データに対する仮定の下で再解析し、結果がどのように変わるかを調べます。データがなぜ欠測するのかという理由について、我々は完全に確信を持つことは難しいため、常に感度分析を行うことは良い考えです。第I相および第II相試験において、新規の治療が標準的な治療と比較される際、非常に保守的な解析アプローチが「最悪データによる解析」(Worst Case Analysis)です。この解析では、新規治療群の被験者のすべての欠測値に可能な限り最悪の値を代入し、対照群の被験者の欠測値には可能な限り最良の値を代入します。例えば、生存率を評価項目としたランダム化プラセボ対照試験では、最も短い生存期間を治験治療群の被験者に、最も長い生存期間をプラセボ群の被験者に代入します。これによって、治療の有益性を主張することは非常に困難になり、結果として保守的な結論を得ることができます。二値データのためのやや緩やかだがなお保守的なアプローチについては、Proschanらによって研究されています。これらの方法は、欠測データの影響を考慮しつつ、統計的なバイアスを最小限に抑えることを目指しています。欠測データの取り扱いは統計解析において複雑な問題であり、データがどのように欠測しているか(MCAR、MAR、MNAR)に応じて適切な手法を選択する必要があります。適切な手法を選択し、欠測データの影響を適切に評価することで、より信頼性の高い研究結果を得ることが可能となります。欠測データを減らすための試験デザインの工夫や、データ収集プロセスの改善も欠かせません。例えば、被験者のフォローアップを強化したり、データ収集のプロトコルを明確に定義することで、欠測データの発生を抑制することができます。さらに、研究報告においては、欠測データの取り扱い方法や、欠測データの影響に関する情報を明確に記述することが求められます。これにより、他の研究者や読者が結果の信頼性を適切に評価することが可能となります。最後に、欠測データの問題は完全に避けることは難しいため、研究者は欠測データに対する理解を深め、適切な手法を用いて解析を行う必要があります。これにより、研究の質を向上させ、エビデンスに基づく医療や科学的な知見の発展に貢献することができます。
関連記事