変更は非常に大きなものであったか|【統計学・統計解析講義応用】
変更は非常に大きなものであったか
変更は非常に大きなものであったかに関して,試験が開始された後の変更は,実際普通に行われるが,その変更は通常比較的程度の小さいものであることを述べておく.
例としては.被験者登録の遅れに対して,組み入れ基準をわずかに緩めたり,組み入れ期間を延長したりする.
主要な評価項目の測定に問題を発見した場合には,関係者への追加のトレーニングを導入するか,測定値の変動を抑えるために平均をとる測定日数を増やしたりする.
一方で,ある治療群を減らしたり,試験を終了したり.あるいは主要評価項目を変えることはさらにずっと大きな変更である.
いくつかの適応的手法では,そのように大きな変更を独立したp値の結合に基づいて許容するが,その妥当性は帰無仮説(null hypothesis)の下でX値が独立でかつ一様に分布するという仮定だけに依っている.
BauerとKohne(1994)は,第一段階でそれまでのデータを当初の仮説が妥当であるかどうかの検討と場合によりデザインを変更するために用い,第二段階のp値を新しいデザインに基づいて求める二段階法に,Fisherの方法が適用可能であることを認めている.
例えば,ある者は当初予定した100例のうち50例の患者のデータを見た後に,サンプルサイズを150例に増やすと決める場合があるかもしれない.
そして次の第二段階でのサンプルサイズを50例ではなく100例とし,p値をその100例について計算するだろう.
当初に計画した試験デザインが変更されたとしても,帰無仮説の下では依然自由度4のカイニ乗分布に従う値である.
実際のところ,そのことは第一段階の後に主要評価項目を変えると決めても,変わらないのは事実で,そしてそこには難しさがある.
その手順は正しい第一種の過誤の確率を持つが.科学コミュニティに説明可能であるか,もしくは許容されるかどうかの保証はどこにもない.
元々の評価項目におけるp値も新しい評価項目において求めたp値も,それぞれが統計的に有意でなくてもそれらのp値の奇妙な組合せが統計的な有意性に達することがあるかもしれない.
そのような結果を我々はどのように解釈できるだろうか.
その治療が予後を改善していると言うだろうか.
適応的手法において考えられるもう1つの問題は,自分たちがデザインを変える原因となるデータの傾向に気がつく時,我々は自分自身を欺こうとしているだけかもしれないということである.
結局のところ,我々が行うデザインの変更は,一部のデータのみに依るところ基づいて行われている.
BauerとKohneの画期的な研究は,デザインの柔軟性と科学的根拠に対して受けるだろう批判との間のトレードオフを浮き彫りにするパンドラの箱を開けるものとなった.
それでもなお,この方法は,研究者が合理的な適応に制限して留意する時には,極めて有用なものとなり得る.
関連記事