臨床試験を守るDSMB:安全性と効果を見極める力【ChatGPT統計解析】
効果安全性評価委員会(DSMB)は約40年前にNIHが設立し、現在は多くの臨床試験で普及している。FDAも委員会の設置を推奨しており、試験のモニタリングやデータ解析を担当する。DSMBは試験を続行、プロトコールの変更、中止、または期間延長を勧告できる。例として、肺気腫治療試験やHIV治療試験でのDSMBの役割が挙げられ、試験の安全性や有効性を判断し、早期中止や対象者の除外などの対応を取った。また、他の臨床試験の結果が試験中止に影響を与えることもあり、安全性を最優先にしてデータの共有が行われる場合もある。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
効果安全性評価委員会の活動
NIHが後援する研究のための最初のDSMBは,約40年前に設立された.
NIHにおけるDSMBのような委員会の活動は,拡大してきており.現在多くの臨床試験にとって普遍的なものとなっている。
FDAは,特定の種類の臨床試験における委員会の設世を強く推奨している,
DSMBの概念は.外部のモニタリングの必要性かDSMBを必要とすることなく実施されうる.
おそらく,外部情報を解釈し,中間解析結果を検討することがあり得るが.これはDSMB以外ではできないことである.
効果安全性評価委員会の意思決定
DSMBに限らず,外部モニターがデータを審査するとき,4種類の決定を下しうる.
第一に,試験をそのまま続行するよう推奨する.
試験はあらかじめ計画された通りに適切に続いていき,何の変更も行われない.
第二に,いくつかの方法で試験プロトコールを変更するよう推奨できる.
例えば,予想されていない不当な数の有害事象が生じた特定の集団を被験者としないようにする,という変更がありうる.
DSMBは,被験者の安全を確保するために適確基準を変更するように推奨するかも知れない.
これは試験の形ややり方の変更につながることがありうる.
同意書の書式を変更するよう推奨するかも知れない.
試験が2つ以上の群で行われていた場合.その内の1群を中止し,残りを継続するよう推奨するかもしれない.
第三に. DSMBは試験を早期に終了させることがある.
介入群が明らかに有益と認められるか,明らかに有害と認められるか,もしくはこれ以上研究を最後まで続けても両群間に有意な差が得られないことが明らかになった場合に,早期中止は勧告されうる.
早期中止というのは不可逆的なので,その決定は慎重に考慮され,議論され尽くさなければならない.
結果が事前に設定しておいた境界値を超えた.もしくはそれに近い状態になった結果以外に. DSMBは次のような他の要因を考慮する必要がある.
試験開始時の特性の不均衡が結果の差に影響していないか.主要評価項目に関して確認バイアスはないか.得られた結果は被験者の個々の小集団においても一致しているか.主要な評価項目に関する結果は,介入に対して同じように反応すると予想されている他の評価項目の結果と一致するか.介入に関する総合的なリスクと便益はどうか.
結果は,介入に対するコンプライアンスの悪さや同時に併用している他の治療法により得られていないか.
現時点で得られている結論が(試験を最後まで続けることで)変わってしまう可能性はどのくらいか.
試験を続行することで追加して得られる情報や.結論の精密さの向上はどの程度か.
試験の結論は医学や科学の各領域に対して説得力があるものか.といったことである.
第四に. DSMBは初めに計画されたものより登録期間,追跡期間,もしくはその両方を延長させることがある.
例
以下の例では, DSMBが議論する問題の種類のサンプルをあげる.より多くを学びたい読者はDeMetsらが記した書籍を参照のこと.
あるサブグルーブにおいて観察された有害事象のため,そのサブグループの参加者を除外した例を,全米肺気腫治療試験(National Emphysema Treatment Trial. NETT)から紹介する.
NETTは. 1,218人の進行した肺気腫患者において,最適治療に対して,最適治療に加えて肺容量減少手術を行うことを比較した.
1,033人の患者が登録されたあと.この研究におけるDSMBは,ある患者群において,外科治療群が薬剤治療単独群より治療成績が不良であったことに言及した.
具体的には,特にハイリスクであった140人の患者(各グループ70人)において.肺容量減少手術を受けている患者において,30日以内死亡率が優位に不良であった(16%対0%).
この結果を受けて,1秒跫が低い患者のさらなる登録および,低い一酸化炭素拡散能を有する,もしくは肺気腫が均一に分布している患者の登録は中止された.
研究者と医学界にこの発見は素早く通知された.
このサブグループはプロトコールにおいて事前に特定されておらず,DSMBの議論を難しくした.
しかし,この発見が多くのサブグループで起こりうる偶然によるものであったかもしれないが. DSMBは参加者の安全のために中止することを選択した.
参加者に予想外の有害事象を知らせる必要性の例をHERS (Heart and Estrogene/Progestin Replacement Study)から紹介する.
既知の冠状動脈性心疾患を有する女性2,763人がこの試験に登録された.
患者は,プラセボ群もしくは抱合型ウマエストロゲンおよびプロゲスチンの併用群にランダム割付された.
試験の中間に, DSMBはプラセボに比べてエストロゲン,プロゲスチンを受けている患者において静脈血栓塞栓症イベントが増加していることに気づいた.
このことは,起こりうる有害事象として同意書にははっきり述べられていなかった.
たとえイベントの頻度が試験を中止することを必要とするほどでなかったとしても,試験に参加したすべての女性が知っている必要があるとDSMBは考えた.
参加者に知らせることに加えて,エデイターヘのレターは試験が終了する前に公開された.
利益のために試験が早期中止となった1例としてはAIDS臨床試験グループ(AIDS Clinical Trials Group,ACTG)076がある.
HIVに感染した妊婦とその新生児に,母から子どもへのHIV感染の伝播を防ぐために,ジドブジン(ZDV)の投与を評価することを目的として. 1991年4月から米国とフランスで多施設共同ランダム化試験の登録が始まった.
その時点で,ZDVが一部の成人で感染の進行を減速したというはっきりしたエビデンスがあった,
しかし,周産期の伝播に対する有用性は不確かだった.
その時点での米国の18ヵ月の推定累積感染率は30%であった.
試験は80%の検出力で1/3の減少を検出するよう設定された.試験の計画では748人の母親および幼児の登録に5年を必要とすると予想された.
NIHはAIDS臨床試験グループを通してACTG 076試験を後援し, DSMBに安全性と有効性のための中間モニタリングの責務を課した.
その計画は,累積的な安全性のデータを6ヵ月おきに評価して,有効性の最終解析よりも前に中間解析を2回実行することであった.
最初の中間解析は,小児感染症の最初の1/3が報告された後,できるだけ早く行うことが計画された.
その予定していた状況が1993年12月に発生し,DSMBの評価は1994年2月になされた.
DSMBに提示され,のちに公開された主要な結果は,試験のZDV群の幼児において推定累積感染率は,プラセボ群の25%と比較して8%であり.その劇的かつ高度に有意な減少により試験は中止となったことを示した.
早期中止は,より速い公表を許可しなかったが,まだ出産していないプラセボ群における母親にZDVを提供することは可能であった.
その後まもなく,妊娠したHIV感染女性の管理のための米国国家ガイドラインはZDVの使用を推奨するように変更された.
現在. ZDVおよび他の抗レトロウイルス療法に広くアクセスできる場所においては,周産期のHIVの伝播は重大な公衆術生問題とならなくなった.
試験が毒性のために中止になった例としてはCAST試験(Cardiac Arrhythmia Suppression Trial)が挙げられる.
この試験の目的は過去に心筋梗塞を発症しその後頻繁に心室性期外収縮を生じている患者に抗不整脈薬を投与することで不整脈に由来する死亡を減らせるかどうか検討するというものである.
予定されたサンプルサイズは4,400人である.適格患者は当初3種の抗不整脈薬(encainide, flecainide, moricizine)の内から1つかそれ以上の薬剤を使用する群にランダムに割付けられた.
もし心室性不整脈が抑制されたとホルダー心電図で判定されたら,被験者は最も有効とされる薬とその用量か,プラセボに割り振られた.試験の早期,約1,100人の患者がランダム割付された頃に. DSMBは2群間(実薬群対プラセボ群)に大きな差の傾向があることに気づいた.
あるグループでは不整脈死が19例生じ,残る一方では3例しか生じていなかった.総死亡数も印象に残る差を示した.
DSMBは,実際の治療によってではなくXとYとしてグループを認知していたが.グループの盲検化を維持することを決定した.
たとえ傾向が強かったとしても,サンプル数がまだ非常に少なく,必要なイベント数のごくわずかに相当するだけであったためである.
数カ月後.死亡率(総死亡率および不整脈死亡率の両方)の差は持続していたため, DSMBのメンバーは盲検化を解除し,会議を開いて議論を行うよう求められた.
実薬群のうちの1つでより成績が不良であった,
早期の傾向に気づいた6ヵ月後のDSMBの会議の頃には,毒性に関して事前に設定された勧告的な境界線を越える結果となった.
すべての有害事象が3つの実薬群の内2つ(encainide. flecainide)に集中していた.
それゆえ被験者へこれらの薬を投与することが中止された.
試験は第三の薬(moricizine)対プラセボで続行された.しかしながら,2年後その薬も中止された.
不整脈を抑制できるかどうか決定するためにその薬剤を評価する短い試験期間中に, moricizine群では15人の不整脈死が観察され.一方プラセボ群では3人のみであった.
不整脈が抑制され長期間の実薬群とプラセボ群にランダム割付された患者のあいだでは,moricizine群に対して有意な傾向はなかった.
不整脈抑制が評価されたこの試験のある段階からの調査結果により,さらに, encainideとflecainideの初期の経験および試験を続行した際に最終的にmoricizineが不整脈死を抑制するという結論が得られる低い確率(条件付確率)からDSMBはCASTの中止を勧告した。
少なくとも部分的には無効による中止の例としては, Physicians Health Study (PHS)の内のアスピリン成分が挙げられる.
これは22,000人以上の米国の健康な男性医師を対象とした,アスピリンとβカロチンの2×2デザインの試験である.
βカロチン介入の主要評価項目はプラセボに対してがんの発症率を減少させるかどうか,アスピリン介入の主要評価項目はプラセボに対して心血管障害による死亡を減少させるかとうかを検証することであった.
数年後,アスピリンの効果で非致死性心筋梗塞の発症率はプラセボに比べて低下の傾向が見られたが,総死亡率と心血管障害による死亡率は予想されたよりも大幅に低かった.
次の数年間,心筋梗塞での差は上昇し,統計的に極めて有意な域に達した.
しかしながら,心血管障害による死亡率は極めて低いままで,両群間の差はほとんど見られなかった.
同時に,発症数は少ないが,出血性脳梗塞の発症率がアスピリン群で高くなる傾向が見られた.
最終的には,モニタリング委員会は試験のアスピリン部分を中止するよう勧告した主要な理由は,将来におけるイベントについて様々な推定を行ってもなお,心臓血管障害による死亡率に差が見られるという条件付確率が非常に低くなったことである.
試験を結論づけるのに十分なイベント数を得るためには,試験はさらに何年も続行する必要があった.
さらなる理由としては,心筋梗塞の転帰について明快な結論,つまりほとんどは非致死的である,が得られたことがある.
出血性脳梗塞が多いという傾向が見られたことも,勧告が行われた理由の1つである.
PHSのβカロチン部分は継続され,それどころか当初の研究予定期間を越えて延長された.
最終的に,がんの発症率について両群間に差は見られなかった
DSMBが試験の延長を勧告した主要な理由の1つは,予想されたよりも試験の検出力が低下したことにある.
これはおそらく症例集積が予定よりもゆっくりとしか進まなかったことや.発症率が予想されたよりも低かったことに原因がある.
試験延長の不適切な理由としては,試験の特に後半の有意ではないが望みとなるような傾向が観察されたことがある.
そのような理由で試験を延長することは,検定の有意性に影響するため,極力行わない.
外部からの情報も, DSMBによる意思決定の際利用されることもある.
米国でPHSが行われていたのと同じ時期に,同様のアスピリンに関する試験が英国で行われていた.
その結果は心血管死と心筋梗塞に関してアスピリンは増加も減少もさせず,しかし脳卒中に関しては米国の試験と同じく. PHSのモニタリング委員会に示されたような有害な傾向が認められた.
この情報はPHSのアスピリン部分の中止において決定的な因子となってはいないが,委員会の決定に一部寄与している.
いくつかの臨床試験は同じ時期に行われている,
それらはすべて慢性心房細勣のある脳梗塞の患者にワルファリンの効果を見るものであった。
他の3つのものよりも最新のものとして, Canadian Atrial Fibrillation Anticoagulation (CAFA) studyが挙げられる.
想定されたサンプルサイズは660人であった.
383人が登録された時点で,ワルファリンが有効であるとする他の試験の結果が明らかになった.
CAFA試験は,DSMBにてデータを討議されることもなく研究事務局会議にて中止された.
なぜならばデータを見るまでもなく研究を続行する必要がないからであった.
以前に報告された研究を少なくとも一部の理由として,米国退役軍人省によって行われていたもう1つの類似した試験も早期終了となった.
1994年,フィンランドのAlpha-Tocopherol, Beta-Carotene Cancer Prevention study (ATBC)の結果が発表され,βカロチンを投与された集団で肺がんのリスクが増加することを示唆する証拠が得られた.
進行中の2つの試験, PHSのβカロチン部分, Beta Carotene and Retinol Efficacy Trial (CARET)は被験者を追跡中であるが,フィンランドの試験の結果を受けて一部変更されている.
しかしながら, 1996年にはCARETが予定よりも早く中止された.
CARETの試験データのそのものだけでは試験中止には至らなかった.
モニタリング委員会ともう1つの独立した審査グループがデータを解析して,肺がんに関するCARETのデータがフィンランドの試験のものと十分似ており,試験の早期中止が望ましいと決定した.
これらの例は,研究者と外部のモニタリンググループが他の試験の最新の情報にも注意していることが重要であることを示している.
安全性の懸念により有害事象データをモニタリング委員会間で共有することが必要とされることもあるが,通常は非公開の中問結果のやり取りは試験の独立性を危うくすることになるだろう.
しかし,疑問が臨床試験によって対処され,既に答えが出たことを示したデータが明らかとなるならば,試験を続行するのには非常に強い理由が必要である.
効果安全性評価委員会(DSMB)は、臨床試験における外部モニタリングを行う組織であり、試験の安全性と有効性を評価するために重要な役割を果たしています。この委員会は約40年前にNIH(米国国立衛生研究所)が最初に設立し、以降その役割は拡大してきました。現在では、多くの臨床試験で普遍的に導入されており、臨床試験における欠かせない要素となっています。FDA(米国食品医薬品局)も特定の種類の臨床試験に対してDSMBの設置を強く推奨しており、試験の独立性や信頼性を高めるために、外部からのモニタリングが求められています。DSMBの基本的な役割は、試験データの中間解析を行い、その結果に基づいて試験を継続すべきか、プロトコールの変更が必要か、あるいは試験を中止すべきかを判断することです。このような外部モニタリングが行われることで、試験において予期せぬリスクが発生した場合に迅速に対応でき、被験者の安全性を確保することが可能となります。DSMBの設置が必ずしも全ての臨床試験で必要とされるわけではありませんが、外部からの情報や試験データの解析が試験の中立性を保つためには非常に重要です。特に、中間解析において得られるデータをどのように解釈し、試験全体の進行にどのように反映させるかが重要な課題となります。DSMBは試験の進行に関して4つの主要な決定を下すことができます。第一に、試験をそのまま継続することを推奨する場合です。この場合、試験は計画通りに適切に進行しており、変更が必要ないと判断されます。第二に、試験プロトコールを変更するよう推奨することです。例えば、特定の被験者グループに予期せぬ有害事象が多発した場合、そのグループの参加を除外するなどの変更が行われます。これは、被験者の安全性を確保するためのものであり、場合によっては試験全体の構造に影響を与えることもあります。また、同意書の内容を変更するように推奨されることもあります。試験が複数のグループに分かれて行われている場合、1つのグループを中止して他のグループで試験を継続することも提案されるかもしれません。第三に、試験を早期に終了させることがあります。これは、介入群が明らかに有益であるか、逆に有害であると判断された場合、あるいは試験を最後まで継続しても有意な差が得られないと判断された場合に行われます。早期中止の決定は非常に重要であり、慎重に議論されなければなりません。なぜなら、早期中止は不可逆的であり、一度決定されると試験は終了し、追加のデータを得ることができなくなるからです。早期中止を行う際には、事前に設定された境界値を超えたかどうかだけでなく、試験の開始時のバランスや結果に対するバイアス、主要評価項目の一貫性、介入の総合的なリスクと便益、そして今後の結果が試験を続行することによってどの程度変わる可能性があるかなど、多くの要素が考慮されます。第四に、DSMBは試験の登録期間や追跡期間を延長することを推奨する場合もあります。これは、当初計画された期間内では十分なデータが得られないと判断された場合に行われます。例えば、予想よりも症例数の増加が遅い場合や、発症率が低いために統計的に有意な結果が得られない場合などです。試験の延長は、追加データを得るための重要な手段であり、結論の精度を高めるために行われることがあります。しかし、試験を延長することには慎重な判断が求められ、後半に有意ではないが望ましい結果が得られたという理由だけで延長することは、検定の有意性に影響を与える可能性があるため避けるべきです。これまでに多くの臨床試験でDSMBの重要な役割が見られました。例えば、全米肺気腫治療試験(NETT)では、1,033人の患者が登録された後、特定の患者群で外科治療群の成績が不良であることがDSMBにより指摘されました。これにより、リスクの高い患者の登録が中止され、研究者や医学界に迅速に情報が共有されました。HIVに関するAIDS臨床試験グループ(ACTG)076では、妊婦とその新生児に対するHIV感染の予防において、ジドブジン(ZDV)の効果が明らかになり、試験が早期に中止されました。この早期中止により、ZDVを投与することで母子感染が劇的に減少することが示され、妊娠中のHIV感染女性の治療ガイドラインが変更されました。また、CAST試験では、不整脈治療薬の試験が進行中に不整脈死の増加が確認され、DSMBは試験を中止するよう勧告しました。このように、DSMBは臨床試験において被験者の安全を確保し、治療の有効性を評価する上で重要な役割を果たしています。さらに、Physicians Health Study(PHS)のように、アスピリンによる心血管疾患予防の効果を調査する試験では、心筋梗塞の予防効果が明確に示されたものの、心血管障害による死亡率には有意な差が見られなかったため、試験のアスピリン部分が早期に終了しました。このような決定は、試験の有効性や安全性を総合的に評価した結果として下されます。また、外部の臨床試験から得られた情報もDSMBの意思決定に影響を与えることがあります。例えば、フィンランドのAlpha-Tocopherol, Beta-Carotene Cancer Prevention Studyの結果が、他の試験に影響を与え、試験が中止されることがありました。こうした外部の情報は、試験の進行や中止に大きな影響を与えることがあり、DSMBは他の試験の最新の情報に対しても常に注意を払う必要があります。また、DSMBは有害事象のデータを他の試験と共有することもあり、安全性の懸念が高まった場合には、迅速に対応することが求められます。DSMBの役割は、臨床試験の安全性と有効性を評価するだけでなく、試験の独立性や信頼性を確保するためにも重要です。試験が適切に設計され、進行しているかどうかを外部の視点からモニタリングすることで、試験の中立性を保つことができます。また、DSMBは中間解析の結果を慎重に解釈し、試験の進行にどのように影響を与えるかを評価します。このようなプロセスを通じて、DSMBは臨床試験において極めて重要な役割を果たしており、試験の結果が医学的に意味のあるものとなるように貢献しています。臨床試験におけるDSMBの役割は今後も重要であり、新しい治療法や薬剤の開発においても、その活動が欠かせないものとなっています。
関連記事