観察データに基づく適応的手法の効果と課題【ChatGPT統計解析】
観察された治療効果に基づいた適応的手法は、治療間の差に基づいて行われるもので、BauerとKohneの手順がその一例であるが、他にも様々な手法が存在する。これらの手法は、治療効果に関するデータが乏しい場合にのみ用いられるべきで、批判を受けることが多い。一部の研究者は、臨床効果は臨床的に妥当な最小の効果であるべきで、再評価は不要とするが、その基準は曖昧で、サンプルサイズの増大を招く恐れがある。また、大規模試験では試験を中止するためのモニタリング境界を活用する意見もあるが、初期に小規模で始め、期待が持てる場合にサンプルサイズを増やす方法もある。盲検データは予想外の治療効果に基づくリスクがあり、統計的操作に慣れた者が観察された効果を再現可能である点も課題とされる。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
変更は観察された治療効果に基づいて行われたものか
変更は観察された治療効果に基づいて行われたものかについては,適応の手法が観察される治療間の差に基づくものかどうかに関したものである.
BauerとKohneの手順はその1つの例だが,他にも多くの手法が存在する.そのような手法は最大級に厳格な審査と批判を受けるので,期待できる治療効果を決定するのに非常に少ない試験前データしか利用できない希な状況下でのみ利用されるべきものである.
何人かの研究者は,我々が臨床試験で定義する臨床効果は臨床的に妥当な最小の効果であるべきであって,したがって再評価の対象にするべきではないと主張している.
とはいえ,臨床的妥当性のある最小の効果が何であるかは明確でない可能性がある.
定義することができたとしても,それは我々が見たいと考えている効果よりはずっと小さいもので,必要よりもっと大きなサンプルサイズを選択するようになることを意味するものであるかもしれない.
他の研究者はそのような(大規模な試験の)ケースでも,試験を中止するためのモニタリングの境界をいつでも使うことができると主張しているが,事前に非常に大きなサンプルサイズの見積もりを提示すれば,治験依頼者に試験を行うことを見送らせることになるかもしれない.
逆に,初めに小さいサンプルサイズで試験を開始したが期待の持てそうな傾向が見られた場合には,治験依頼者は進んでサンプルサイズを増やそうとするだろう.
要約すれば,観察された治療効果の差に基づいた適応的手法(早期終了のための通常の群逐次モニタリング以外の)は,頻繁に必要とされることはほとんどなく,そして最も大きな批判を受ける手法である.
これらは期待できそうな治療効果に関する情報が非常に限られている場合にのみ使われるべきものである.
盲検化された割付けをオープンにする前に行われる適応と,そして観測された治療効果を判断のために公然と使用する適応の間には黄泉の世界が横たわっている.
時に我々はイベント率(治療効果の差でない)や分散のような,攪乱パラメータに関するより良い情報を必要とする.
我々は,盲検化されたデータを使ってこれらのパラメータを推定することができることを見てきたが,盲検化データはすべての治療効果を包括していることに危険性がある.
これは,実際の治療効果が期待していたものと異なった時に,我々を誤った結論に導く可能性がある.
例えば,二値変数を観測する試験で,イベントを生じた患者全体の比率は期待したよりも低くなり,我々にサンプルサイズを増やそうと考えさせるかもしれない.
だが,期待よりも低かった全体のイベント率に関して可能性のありそうな理由の1つには.治験治療が期待よりもとてもよく効いていたという場合がないとは言い切れない.
同様に.連続変数による試験では,治療効果が期待より大きかったので全体の分散が大きくなったのかもしれない.
そのようなことはそうめったには起こらないものとはいえ,我々が攪乱パラメータを群毎のデータを用いて推定することで,これを避けたいと思う場合はあるだろう.
全般的に見て,そのことによって生じるのは非常に小さな問題である.
1つの微妙な問題は,全体と群毎の要約をするために,データへのアクセスを持つ統計的操作に慣れた者が,観察された治療効果を実際に再現できるということである.
観察された治療効果に基づいて変更が行われる適応的手法については、その方法が治療間の観察された差に基づくものであるかどうかに焦点が当てられます。特に、BauerとKohneによって提案された手順が一例として挙げられますが、他にもさまざまな適応的手法が存在しています。これらの手法は、通常非常に厳格な審査と批判にさらされるため、治療効果に関する期待値を決定するための事前データが限られている稀な状況でのみ用いられるべきだとされています。具体的には、治療効果を早期に評価して試験を中断するかどうかを決定することが可能な適応的手法であっても、確実な治療効果の証拠が不十分な場合には、その利用は慎重であるべきです。さらに、多くの研究者は臨床試験における臨床効果の基準について議論を重ねており、臨床的に妥当とされる最小の効果を定義するべきだと主張する人もいます。このような基準が設定されると、臨床試験において評価されるべき効果はそれ以上の効果であるべきであり、再評価や追加の評価は不要であるとの立場が示されています。しかし、臨床的に妥当な最小の効果が何であるかについては、現実的には明確な定義が難しい場合が多く、その効果の基準を定義できたとしても、それは我々が実際に見たいと考えている治療効果よりもはるかに小さいものになる可能性があります。このような基準が設定された場合、治験デザインにおいて十分な統計的検出力を確保するためには、必要以上に大きなサンプルサイズを選択しなければならない事態を招くかもしれません。さらに、他の研究者たちは、非常に大規模な試験においては試験を中断するためのモニタリング境界を設定することで、治療効果の有無に応じて途中で試験を終了することが可能であると主張しています。これは、適応的手法における試験デザインの柔軟性を示していますが、逆に大規模な試験の実施を前提にした場合、試験開始前に非常に大きなサンプルサイズを見積もり、予測を提示することが試験依頼者に対して試験実施の躊躇を引き起こすリスクも伴います。つまり、初期に小規模なサンプルサイズで試験を開始した結果、期待される効果が観察された場合には、治験依頼者は試験の進行に積極的な姿勢を示し、サンプルサイズの追加を検討する可能性が高くなります。このように、適応的手法は観察された治療効果に基づくものであり、早期終了のための通常の群逐次モニタリング以外の場面で頻繁に必要とされることはあまりありません。また、この手法は治療効果に対する限られた情報しか得られない状況下でのみ使用が推奨され、最も大きな批判を受ける方法の一つでもあります。さらに、試験の適応方法に関しては、盲検化された割付けの解除前に行われる適応と、観察された治療効果に基づいて明確に判断される適応との間に大きな違いが存在します。これらの異なるアプローチにおいては、しばしばイベント率や治療効果の差以外の攪乱パラメータ(例えば分散)に関する情報が試験の進行に重要な影響を与えることがあります。実際に、攪乱パラメータに関する情報が不十分な場合には、試験結果の解釈において誤った結論が導かれるリスクが伴います。このようなリスクを回避するために、盲検化されたデータを用いて攪乱パラメータを推定する方法が利用されることもありますが、盲検データは治療効果の包括的な情報を提供するため、予測された治療効果と実際の治療効果が一致しない場合には、誤解を招く可能性もあります。例えば、ある試験において二値変数の観測が行われている場合、期待されたよりも低いイベント率が観察された際に、その要因が治療効果の乏しさによるものか、それとも治療効果が予想以上に高かったためにイベントの発生頻度が低下したのかを判断することが難しい状況が生じるかもしれません。同様に、連続変数に基づく試験において、観察された治療効果が期待以上に大きく、その結果として全体の分散が大きくなった場合にも、試験の解釈において予期しない混乱が生じる可能性があります。このようなシナリオは頻繁に発生するわけではありませんが、攪乱パラメータの推定を群ごとのデータを用いて行うことで、そのリスクを最小限に抑えることができるかもしれません。全体として、これらの問題は適応的手法の利用において避けられない小さな問題であると言えますが、その影響を軽減するためには慎重なデザインとデータ解析が求められます。また、適応的手法の利用においてはデータの取り扱いに精通した統計的操作が可能な人材が必要であり、彼らが観察された治療効果を実際に再現できることが求められます。
関連記事