欠測データを扱うための手法【統計解析講義応用】

欠測データを扱うための手法【統計解析講義応用】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

欠測データを扱うための手法|【統計学・統計解析講義応用】

欠測データを扱うための手法【統計解析講義応用】


目次  欠測データを扱うための手法【統計解析講義応用】

 

 

欠測データを扱うための手法

 

臨床試験と観察研究の双方の分野における欠測データの統計的方法に関して,たくさんの有用な参考書が出版されている.

 

米国学術研究会議(National Research Council)の報告書「The Prevention and Treatment of Missing Data in Clinical Trials」は,欠測データを減らすための試験デザインから欠測データの解析方法までを包括的に扱った議題を示した,1つの優れたオンライン情報ソース(無償で利用可)である.

 

欠測データがMCARである時,完全なデータのみを持つ観察例を解析に用いる完全データによる解析(complete case analysis. CC)は,適用が容易でバイアスを混入させることがない.

 

ただ通常は,もっと洗練された統計的方法がすべての被験者(完全データのみを持つ者だけではない)の利用可能なデータに効果的に適用することができるので,CC解析はこれが正当化できる場合でも一般には勧められない.

 

完全データによる解析はそのデータがMCARである場合にのみ適切な手法である.

 

補完(imputation)法は,欠測した値をデータ中の他の観察に基づく1つと入れ替える方法で, MCARとMARの下で適用することができる.

 

単一値代入法(single imputation)は,観測されているデータの平均値のような1つの値を欠測値に代入する方法である.

 

もしデータがMARであるならば,その補完方法は適切な統計モデルから得なければならない.

 

例として,ある者は,毎日体重を測定する体重減量試験で観測されなかった30日目の体重を0-29日目の体重から回帰を使って推定するかもしれない.

 

その他の単一値代入法の例ではlast observation carried forward,(LOCF), baseline observation carried forward.(BOCF),そしてlast rank carried forward, (LRCF)と呼ばれる手法がある.

 

LOCFは.欠測値に観測されている最直前の値を代入する使い古された手法だが限定的な状況においては非常に有用である.

 

1つの例は血圧に対する食事療法の効果を見る短期試験で,ある被験者の血圧が.彼が何らかの降圧剤治療を受けるに十分なほど上がった場合である.

 

薬物治療を受ける直前の血圧は,彼が治療を受けなかったとしたら試験の終わりに示すだろう血圧の妥当な推測値となる.

 

単一値代入法に対する1つの批判は,この種の解析から得られる推定値の標準誤差は,補完された値の不確実性を考慮していないので,過小に評価されているというものである.

 

対して多重代入法(multiple imputation)は,補完のためにモデルを何回か使用し.1つの補完から次の補完の問の変動を標準誤差の計算に用いている.

 

補完を行う以外の多様な手法が. MARデータを扱うために提案されている.

 

それらの手法は,観察されたデータから適切な統計モデルを使用して情報を取り入れる.

 

傾向解析は,データに欠測が発生するかどうかに関するベースライン予測因子を探すことを試みる方法で,欠測が生じる尤度の解析を屑別あるいは調整して行う.

 

層別解析においては.それぞれの層での治療効果を推定し,そして層内の推定値を併合して全体の治療効果を推定する.

 

この方法は,ベースラインの特性が正確に欠測値を予測するものであればうまく機能するが,そういったことはそう頻繁には起こらない.

 

その他の方法では,治療効果の推定を補助するためにランダム化後のデータを用いることがある.

 

 

例えば,繰り返し測定のある体重減量試験での1つの方策として,個々の被験者それぞれの体重と時間の間の関係の傾きを解析したりする.

 

混合モデルは,似たような解析をする少しばかり洗練された方法である.

 

30日目が欠測であるという実際については,0-29日目で観測されている体重を用いて傾きを確実に推定できるので,そのことに大きな影響はない.

 

最尤法もまた,治療効果のようなパラメータの最良推定値を決定するために,そのような観察データと想定されるモデルを使用する.

 

欠測データが無視できない,あるいはその可能性が懸念される時,欠測データは観察データを用いたモデル解析では説明することはできない.

 

この場合の妥当なアプローチとしては感度分析を行うことである.

 

すなわち,データを様々な欠測データに対する仮定の下に再解析して,結果がどのように変わるかを調べることを行う.

 

データがなぜ欠測するかという理由について,我々は決して確信を持つことはできないので,常に感度分析を行うようにすることは良い考えである.

 

第1相と第H相試験において.新規の治療が標準的な治療と比較される時,非常に保守的となる解析アプローチが「最悪データによる解析(worst case analysis)」である.

 

この解析では,可能性のある最悪の値を新規治療群の被験者のすべての欠測値に,最良の値を対照群の被験者の欠測値に代入する.

 

例えば,生存率を評価項目としたランダム化プラセボ対照試験では.最も短い生存期間が治験治療群の被験者に,最長の生存期間がプラセボ群の被験者に代入される.

 

このことによって明らかに治療の有益性を主張することは困難になる.

 

二値データのためのいくらか緩やかだがなお保守的なアプローチについてはProschanらによって研究されている.

 

 

欠測データを扱うための手法【統計解析講義応用】


セミナー詳細                    解析ご相談                    LINEでお友達

 

欠測データを扱うための手法【統計解析講義応用】

欠測データを扱うための手法【統計解析講義応用】