優越性・非劣性・同等性試験の違いと活用法【ChatGPT統計解析】
多くのランダム化並行群間比較試験は、新しい治療がプラセボまたは既存の治療より優れていることを示すことを目的とし、この試験を優越性試験と呼びます。一方、新しい治療が既存の治療と同等か、若干劣るが容認可能であることを示す場合、同等性試験または非劣性試験を行います。非劣性試験では、新治療が標準治療と比べ容認できる程度の劣位にあることを示すため、非劣性マージンを設定し、それに基づいて有効性を評価します。これらの試験は、優越性試験とは異なり、帰無仮説と対立仮説が逆転しており、より大きな規模と費用がかかることが多いです。非劣性試験と同等性試験は、治験治療の有効性が対照治療と同等か少し劣る場合に適用され、FDAなどがガイダンスを発行していますが、試験デザインの困難さから実施頻度は低いです。さらに、結果報告にはCONSORTの拡張が推奨されており、最新の規制ガイダンスに基づいた手法が必要です。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
優越性,非劣性,および同等性
多くのランダム化並行群間比較試験の目的は,新しい治療がプラセボあるいは既存の治療に比較して優れていることを示すことにある.
このような臨床試験を優越性試験(superiority trial)と呼ぶ.
それとは異なり,分担研究者が新しい治療が既存の治療に比べてほぼ同じといえるかに関心がある場合がある.
この目的で行われる臨床試験は,同等性試験(equivalence trial)と呼ばれる.
さらに,新治療が既存のものと同じくらい良いものであることが示せれば十分な状況がある.
例えば,既存の薬剤が非常に高価なものであるとか.関連のある毒性症状の発現が見られる,あるいは服薬の頻度や静脈投与であることなどに起因する何らかの不便性を持つものであるような場合があるだろう.
もし新薬が,より少ないコスト,より少ない毒性やより簡便な投与方法などの付加的な利便性を持つのであれば,その薬剤は,有効性において比較治療となるものより少しばかり劣るものであっても好んで選択され得る.
そういった状況設定において行われる臨床試験の目的は,新治療が有効性に関して劣るところは標準的な治療の効果に対して容認し得るある領域(△)の中にあることを示すものとなるだろう.
このタイプの臨床試験は非劣性試験(noninferiority trial)と呼ばれる.
有効性に関して容認できる差(△)は同等性もしくは非劣性マージン(noninferiority margin)として知られている.
優越性,同等性.非劣性試験は.扱う問題の観点から3つの全く異なった目的を持つ.
我々は試験で検討しようとする問題が仮説検定に関連していること,そしてその検定手法は,第一種の過誤および第二種の過誤として規定した精度とともに,サンプルサイズの計算に情報を与えることを学んだ.
検定法とサンプルサイズを求める方法は.優越性試験を前提にした設定であるが,同等性と非劣性試験にも同様の方法論が適用できる.
同等性試験および非劣性試験では,優越性試験に比べると帰無仮説と対立仮説が本質的に入れ替わっている.
同等性試験における帰無仮説は,試験下にある治療は異なった有効性を持つ,すなわち治療間の効果の差の大きさが容認可能な大きさのマージン(△)より大きいとするもので,そして対立仮説はその差が△より小さいとするものである.
非劣性試験は,上述の「片側(one-sided)」のバージョンとして見ることができる.
つまり帰無仮説では.対照治療の効果(μo)は新しい治療の効果を容認できる大きさを上回って越えていると仮定し.対立仮説では新治療の効果の弱さは容認できるくらい小さいものであるとする.
対立仮説は,新治療が既存の治療よりも優れた効果を持つ可能性を含んでいることに注意して欲しいが,一方で上記の非劣性対立仮説において新薬が優れていることの可能性と新治療の効果が対照治療よりわずかに劣ることとの区別はできない.
もしある治療が非劣性であると宣言された場合には,続いて事前に定義した別の検定を用いて優越性を検討することができるだろう。
非劣性を示すためには,一度試験が完了したならぱ,通常は結果について2つの治療間の推定した差の信頼区閥を計算する.
その区間全体が,求められる惻の非劣性マージン上にあれば新治療が非劣性であることを宣言できる.
同様の手順を同等性試験についても述べることができる.
もし新治療の既存治療に対するその同等性あるいは非劣性が宣言できるとしたら,それを決定するために用いたマージンの上下限については特別な考察がなされなければならない.
どのようにして人は非劣性を定義するか.非劣性試験は.研究中の治療が比較対照となる治療に比べて容認可能なマージン,通常は小さい大きさのそれを上回るほど悪いものではないことを示そうとするものである.
そのマージンの大きさは,対照治療がもたらす副作用の頻度と重症度に依存するのだろうか.時にはそうだろう.
このマージンは,事前に明記の上にそれぞれの試験毎に適用され,かつ臨床的・統計的観点から正当化されていなければならない.
以前の試験で見られた,プラセボより優れているとして確立された対照治療が持つその有効性上の便益の大きさについて留意することは重要なことである.
実対照治療の有効性がプラセボより上回っている部分と比較して非劣性マージンが非常に大きい場合.その対照と比較して非劣性であると宣言される治療の効果はプラセボと同等であるかもしくは悪い可能性がある.
このことは,実対照治療の効果が非劣性試験で証明されたものである場合,さらに重大なリスクを招き得る.
同等性試験においては,その目的は最新の治療の効果が,確立している治療のある容認可能な小さなマージンの中にあることを示すことである.
このタイプの試験は優越性試験を行う場合より規模が大きく,またそのためによりコストがかかる傾向がある.
非劣性試験と同等性試験は,優越性試験と比較してそのデザインや解析,そしてその解釈を複雑にする多くの問題を有している.
例えば,対照となる薬剤の効果が後に疑問視されることになれば.非劣性もしくは同等であるとされた治験治療の有効性に関するエビデンスは問題のあるものになる.
ある治療が標準治療に比べて十分に良いか,または優れたものであるかを確立するという科学的に合理的かつ一般的な目的にもかかわらず,非劣性試験と同等性試験はほとんどの場合滅多に行われることはない。
このことはおそらくこれらの試験デザインに関連した困難さに起因している.
同等性試験や非劣性試験の結果を報告するための特別なガイダンスも,ランダム化比較対照試験の結果を公表する際の標準であるCONSORTを拡張して開発されている.
また本原稿執筆時点で, FDAは合衆国内で行われる非劣性臨床試験を実施するためのガイダンスを発行している。
手法に対する容認性が急速に変化しているため,分担研究者はその詳細についてぜひ最近の規制当局によるガイダンス文書を参考にするべきである.
ランダム化比較試験(RCT)は、臨床研究において新しい治療法や薬剤の有効性を評価するための重要な手法であり、特に優越性、非劣性、同等性という異なる目的に基づいて設計されることが多いです。これらの試験デザインは、それぞれ異なる目的と仮説を持っており、設定や解析方法にも違いがあるため、適切に理解して活用することが求められます。優越性試験(superiority trial)は、新しい治療が既存の治療やプラセボと比較して優れていることを示すことを目的としています。これは一般的に行われる試験形式であり、治療法の有効性を証明し、臨床の現場での採用を目指す際に有用です。対照治療よりも明確に優れた効果を持つことが示された場合、結果は直感的で理解しやすいため、特に新しい薬剤や技術の導入に際して効果的です。
一方、同等性試験(equivalence trial)は、新しい治療法が既存の治療法とほぼ同じ有効性を持つことを示すことを目的としています。この試験が用いられる背景には、新しい治療法がコストや副作用、治療の利便性において既存治療よりも優れている場合や、治療効果がほぼ同等であることが臨床上の価値を持つと見なされる場合があります。たとえば、既存の治療法が高価である、または毒性が高い場合、新しい治療法が多少効果が同等であると判断されれば、患者にとっての選択肢が広がり、医療コストの削減や患者の生活の質の向上につながる可能性があります。同等性試験の帰無仮説は、治療間の効果の差が設定されたマージンを超えていることを前提としており、そのために仮説検定の手法が優越性試験とは逆になります。
非劣性試験(noninferiority trial)は、非劣性マージンを設定し、新治療法が既存の治療法と比較して、少なくとも許容範囲内で劣っていないことを示すための試験です。このタイプの試験は、同等性試験の片側バージョンと見なされることがあります。非劣性試験が求められる背景には、既存治療が高価である、毒性が高い、または使用上の利便性に欠けるなどの理由がある場合が多く、新しい治療法が多少劣っていても、そのコスト面や安全性、利便性の観点から臨床現場で有用と判断される可能性があることが挙げられます。非劣性試験の帰無仮説は、対照治療が新しい治療法よりも効果的であることを仮定し、対立仮説では新治療が対照治療と許容範囲内で同等である、もしくはそれ以上の効果を持つことを示します。これは対照治療が長期間にわたりプラセボを上回る有効性を示したものであれば、新治療の導入が進められる根拠となるでしょう。
非劣性試験と同等性試験には、特有の設定や仮説があり、そのためサンプルサイズの設計も優越性試験とは異なります。非劣性試験では、非劣性マージンの範囲内で信頼区間が設定される必要があり、その範囲内で新治療が対照治療に比べて劣らないことを証明します。これにより、信頼区間の全体が非劣性マージン内に収まる場合、非劣性が証明されることになります。同等性試験においても、同様に信頼区間が設定されたマージン内に収まることが求められますが、両側での評価が必要となり、サンプルサイズは優越性試験と比較して大規模で高コストになることが多いです。この試験デザインが求められる場面では、研究対象がある程度の有効性を持ち、さらにはその有効性が信頼区間の中で明確に示される必要があります。
優越性試験、同等性試験、非劣性試験は、それぞれの目的に応じて試験デザインや解析方法が異なるため、研究者がどのような結果を求めているかを明確にする必要があります。また、帰無仮説や対立仮説の設定に応じて、サンプルサイズの計算や検定法の選定が異なり、精度の高い試験結果を得るために慎重な設計が必要とされます。同等性試験や非劣性試験では、効果の評価に際して設定されたマージンが重要な役割を果たし、その設定は臨床的・統計的な正当性が求められるため、事前の計画と議論が不可欠です。
非劣性試験や同等性試験に関する規制当局のガイダンスも重要で、特にFDA(アメリカ食品医薬品局)は、非劣性試験の実施に関するガイドラインを発行しており、試験の信頼性を確保するための指針として機能しています。ガイドラインには、非劣性マージンの設定方法や試験結果の解釈方法、報告の際のポイントなどが含まれており、これらの基準に従うことで信頼性の高い試験結果が得られます。近年の医療研究では、非劣性試験や同等性試験のニーズが高まっており、その手法も発展しています。CONSORT(Consolidated Standards of Reporting Trials)も、非劣性試験や同等性試験の結果を報告するための特別なガイダンスを提供しており、ランダム化比較試験の結果公表時にこれらを拡張して使用することが推奨されています。
一方、非劣性試験や同等性試験の結果が示すエビデンスには慎重な評価が必要で、対照治療の有効性が疑問視される場合、非劣性または同等性が示された治療の効果にも問題が生じる可能性があります。特に対照治療がプラセボよりわずかに上回っている程度の効果しか示さない場合、非劣性や同等性が示されても、結果的にはプラセボと同等かそれ以下の効果である可能性もあり、臨床応用に際して十分な注意が必要です。
非劣性や同等性を証明するための試験デザインは、優越性試験に比べて設計や解釈が複雑であり、サンプルサイズも大規模になることが多く、そのため研究費用が増加する傾向があります。また、解析方法に関しても、対照治療が有効であることを前提とする優越性試験とは異なり、同等性および非劣性試験では対照治療の効果が十分に有効であることが前提とされるため、これに疑問が生じると試験結果の信頼性にも影響を及ぼします。
研究者が非劣性試験や同等性試験を行う際には、試験デザインにおける非劣性マージンの設定や、対照治療の有効性を慎重に検討する必要があり、これにより試験結果の信頼性と妥当性が左右されます。したがって、これらの試験を設計する際には、非劣性マージンの大きさや設定方法、対照治療の選定基準、さらに対照治療の効果が長期的に安定しているかどうかなど、多くの要素を考慮する必要があります。
関連記事