優越性,非劣性,および同等性|【統計学・統計解析講義応用】
優越性,非劣性,および同等性
多くのランダム化並行群間比較試験の目的は,新しい治療がプラセボあるいは既存の治療に比較して優れていることを示すことにある.
このような臨床試験を優越性試験(superiority trial)と呼ぶ.
それとは異なり,分担研究者が新しい治療が既存の治療に比べてほぼ同じといえるかに関心がある場合がある.
この目的で行われる臨床試験は,同等性試験(equivalence trial)と呼ばれる.
さらに,新治療が既存のものと同じくらい良いものであることが示せれば十分な状況がある.
例えば,既存の薬剤が非常に高価なものであるとか.関連のある毒性症状の発現が見られる,あるいは服薬の頻度や静脈投与であることなどに起因する何らかの不便性を持つものであるような場合があるだろう.
もし新薬が,より少ないコスト,より少ない毒性やより簡便な投与方法などの付加的な利便性を持つのであれば,その薬剤は,有効性において比較治療となるものより少しばかり劣るものであっても好んで選択され得る.
そういった状況設定において行われる臨床試験の目的は,新治療が有効性に関して劣るところは標準的な治療の効果に対して容認し得るある領域(△)の中にあることを示すものとなるだろう.
このタイプの臨床試験は非劣性試験(noninferiority trial)と呼ばれる.
有効性に関して容認できる差(△)は同等性もしくは非劣性マージン(noninferiority margin)として知られている.
優越性,同等性.非劣性試験は.扱う問題の観点から3つの全く異なった目的を持つ.
我々は試験で検討しようとする問題が仮説検定に関連していること,そしてその検定手法は,第一種の過誤および第二種の過誤として規定した精度とともに,サンプルサイズの計算に情報を与えることを学んだ.
検定法とサンプルサイズを求める方法は.優越性試験を前提にした設定であるが,同等性と非劣性試験にも同様の方法論が適用できる.
同等性試験および非劣性試験では,優越性試験に比べると帰無仮説と対立仮説が本質的に入れ替わっている.
同等性試験における帰無仮説は,試験下にある治療は異なった有効性を持つ,すなわち治療間の効果の差の大きさが容認可能な大きさのマージン(△)より大きいとするもので,そして対立仮説はその差が△より小さいとするものである.
非劣性試験は,上述の「片側(one-sided)」のバージョンとして見ることができる.
つまり帰無仮説では.対照治療の効果(μo)は新しい治療の効果を容認できる大きさを上回って越えていると仮定し.対立仮説では新治療の効果の弱さは容認できるくらい小さいものであるとする.
対立仮説は,新治療が既存の治療よりも優れた効果を持つ可能性を含んでいることに注意して欲しいが,一方で上記の非劣性対立仮説において新薬が優れていることの可能性と新治療の効果が対照治療よりわずかに劣ることとの区別はできない.
もしある治療が非劣性であると宣言された場合には,続いて事前に定義した別の検定を用いて優越性を検討することができるだろう。
非劣性を示すためには,一度試験が完了したならぱ,通常は結果について2つの治療間の推定した差の信頼区閥を計算する.
その区間全体が,求められる惻の非劣性マージン上にあれば新治療が非劣性であることを宣言できる.
同様の手順を同等性試験についても述べることができる.
もし新治療の既存治療に対するその同等性あるいは非劣性が宣言できるとしたら,それを決定するために用いたマージンの上下限については特別な考察がなされなければならない.
どのようにして人は非劣性を定義するか.非劣性試験は.研究中の治療が比較対照となる治療に比べて容認可能なマージン,通常は小さい大きさのそれを上回るほど悪いものではないことを示そうとするものである.
そのマージンの大きさは,対照治療がもたらす副作用の頻度と重症度に依存するのだろうか.時にはそうだろう.
このマージンは,事前に明記の上にそれぞれの試験毎に適用され,かつ臨床的・統計的観点から正当化されていなければならない.
以前の試験で見られた,プラセボより優れているとして確立された対照治療が持つその有効性上の便益の大きさについて留意することは重要なことである.
実対照治療の有効性がプラセボより上回っている部分と比較して非劣性マージンが非常に大きい場合.その対照と比較して非劣性であると宣言される治療の効果はプラセボと同等であるかもしくは悪い可能性がある.
このことは,実対照治療の効果が非劣性試験で証明されたものである場合,さらに重大なリスクを招き得る.
同等性試験においては,その目的は最新の治療の効果が,確立している治療のある容認可能な小さなマージンの中にあることを示すことである.
このタイプの試験は優越性試験を行う場合より規模が大きく,またそのためによりコストがかかる傾向がある.
非劣性試験と同等性試験は,優越性試験と比較してそのデザインや解析,そしてその解釈を複雑にする多くの問題を有している.
例えば,対照となる薬剤の効果が後に疑問視されることになれば.非劣性もしくは同等であるとされた治験治療の有効性に関するエビデンスは問題のあるものになる.
ある治療が標準治療に比べて十分に良いか,または優れたものであるかを確立するという科学的に合理的かつ一般的な目的にもかかわらず,非劣性試験と同等性試験はほとんどの場合滅多に行われることはない。
このことはおそらくこれらの試験デザインに関連した困難さに起因している.
同等性試験や非劣性試験の結果を報告するための特別なガイダンスも,ランダム化比較対照試験の結果を公表する際の標準であるCONSORTを拡張して開発されている.
また本原稿執筆時点で, FDAは合衆国内で行われる非劣性臨床試験を実施するためのガイダンスを発行している。
手法に対する容認性が急速に変化しているため,分担研究者はその詳細についてぜひ最近の規制当局によるガイダンス文書を参考にするべきである.
関連記事