効果安全性評価委員会の活動【統計解析講義応用】

効果安全性評価委員会の活動【統計解析講義応用】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

効果安全性評価委員会の活動|【統計学・統計解析講義応用】

効果安全性評価委員会の活動【統計解析講義応用】


目次  効果安全性評価委員会の活動【統計解析講義応用】

 

 

効果安全性評価委員会の活動

 

NIHが後援する研究のための最初のDSMBは,約40年前に設立された.

 

NIHにおけるDSMBのような委員会の活動は,拡大してきており.現在多くの臨床試験にとって普遍的なものとなっている。

 

FDAは,特定の種類の臨床試験における委員会の設世を強く推奨している,

 

DSMBの概念は.外部のモニタリングの必要性かDSMBを必要とすることなく実施されうる.

 

おそらく,外部情報を解釈し,中間解析結果を検討することがあり得るが.これはDSMB以外ではできないことである.

 

効果安全性評価委員会の意思決定

 

DSMBに限らず,外部モニターがデータを審査するとき,4種類の決定を下しうる.

 

第一に,試験をそのまま続行するよう推奨する.

 

試験はあらかじめ計画された通りに適切に続いていき,何の変更も行われない.

 

第二に,いくつかの方法で試験プロトコールを変更するよう推奨できる.

 

例えば,予想されていない不当な数の有害事象が生じた特定の集団を被験者としないようにする,という変更がありうる.

 

DSMBは,被験者の安全を確保するために適確基準を変更するように推奨するかも知れない.

 

これは試験の形ややり方の変更につながることがありうる.

 

同意書の書式を変更するよう推奨するかも知れない.

 

試験が2つ以上の群で行われていた場合.その内の1群を中止し,残りを継続するよう推奨するかもしれない.

 

第三に. DSMBは試験を早期に終了させることがある.

 

介入群が明らかに有益と認められるか,明らかに有害と認められるか,もしくはこれ以上研究を最後まで続けても両群間に有意な差が得られないことが明らかになった場合に,早期中止は勧告されうる.

 

早期中止というのは不可逆的なので,その決定は慎重に考慮され,議論され尽くさなければならない.

 

結果が事前に設定しておいた境界値を超えた.もしくはそれに近い状態になった結果以外に. DSMBは次のような他の要因を考慮する必要がある.

 

試験開始時の特性の不均衡が結果の差に影響していないか.主要評価項目に関して確認バイアスはないか.得られた結果は被験者の個々の小集団においても一致しているか.主要な評価項目に関する結果は,介入に対して同じように反応すると予想されている他の評価項目の結果と一致するか.介入に関する総合的なリスクと便益はどうか.

 

結果は,介入に対するコンプライアンスの悪さや同時に併用している他の治療法により得られていないか.

 

現時点で得られている結論が(試験を最後まで続けることで)変わってしまう可能性はどのくらいか.

 

試験を続行することで追加して得られる情報や.結論の精密さの向上はどの程度か.

 

試験の結論は医学や科学の各領域に対して説得力があるものか.といったことである.

 

第四に. DSMBは初めに計画されたものより登録期間,追跡期間,もしくはその両方を延長させることがある.

 

 

 

以下の例では, DSMBが議論する問題の種類のサンプルをあげる.より多くを学びたい読者はDeMetsらが記した書籍を参照のこと.

 

あるサブグルーブにおいて観察された有害事象のため,そのサブグループの参加者を除外した例を,全米肺気腫治療試験(National Emphysema Treatment Trial. NETT)から紹介する.

 

NETTは. 1,218人の進行した肺気腫患者において,最適治療に対して,最適治療に加えて肺容量減少手術を行うことを比較した.

 

1,033人の患者が登録されたあと.この研究におけるDSMBは,ある患者群において,外科治療群が薬剤治療単独群より治療成績が不良であったことに言及した.

 

具体的には,特にハイリスクであった140人の患者(各グループ70人)において.肺容量減少手術を受けている患者において,30日以内死亡率が優位に不良であった(16%対0%).

 

この結果を受けて,1秒跫が低い患者のさらなる登録および,低い一酸化炭素拡散能を有する,もしくは肺気腫が均一に分布している患者の登録は中止された.

 

研究者と医学界にこの発見は素早く通知された.

 

このサブグループはプロトコールにおいて事前に特定されておらず,DSMBの議論を難しくした.

 

しかし,この発見が多くのサブグループで起こりうる偶然によるものであったかもしれないが. DSMBは参加者の安全のために中止することを選択した.

 

参加者に予想外の有害事象を知らせる必要性の例をHERS (Heart and Estrogene/Progestin Replacement Study)から紹介する.

 

既知の冠状動脈性心疾患を有する女性2,763人がこの試験に登録された.

 

患者は,プラセボ群もしくは抱合型ウマエストロゲンおよびプロゲスチンの併用群にランダム割付された.

 

試験の中間に, DSMBはプラセボに比べてエストロゲン,プロゲスチンを受けている患者において静脈血栓塞栓症イベントが増加していることに気づいた.

 

このことは,起こりうる有害事象として同意書にははっきり述べられていなかった.

 

たとえイベントの頻度が試験を中止することを必要とするほどでなかったとしても,試験に参加したすべての女性が知っている必要があるとDSMBは考えた.

 

参加者に知らせることに加えて,エデイターヘのレターは試験が終了する前に公開された.

 

利益のために試験が早期中止となった1例としてはAIDS臨床試験グループ(AIDS Clinical Trials Group,ACTG)076がある.

 

HIVに感染した妊婦とその新生児に,母から子どもへのHIV感染の伝播を防ぐために,ジドブジン(ZDV)の投与を評価することを目的として. 1991年4月から米国とフランスで多施設共同ランダム化試験の登録が始まった.

 

その時点で,ZDVが一部の成人で感染の進行を減速したというはっきりしたエビデンスがあった,

 

しかし,周産期の伝播に対する有用性は不確かだった.

 

その時点での米国の18ヵ月の推定累積感染率は30%であった.

 

試験は80%の検出力で1/3の減少を検出するよう設定された.試験の計画では748人の母親および幼児の登録に5年を必要とすると予想された.

 

NIHはAIDS臨床試験グループを通してACTG 076試験を後援し, DSMBに安全性と有効性のための中間モニタリングの責務を課した.

 

その計画は,累積的な安全性のデータを6ヵ月おきに評価して,有効性の最終解析よりも前に中間解析を2回実行することであった.

 

最初の中間解析は,小児感染症の最初の1/3が報告された後,できるだけ早く行うことが計画された.

 

その予定していた状況が1993年12月に発生し,DSMBの評価は1994年2月になされた.

 

DSMBに提示され,のちに公開された主要な結果は,試験のZDV群の幼児において推定累積感染率は,プラセボ群の25%と比較して8%であり.その劇的かつ高度に有意な減少により試験は中止となったことを示した.

 

早期中止は,より速い公表を許可しなかったが,まだ出産していないプラセボ群における母親にZDVを提供することは可能であった.

 

その後まもなく,妊娠したHIV感染女性の管理のための米国国家ガイドラインはZDVの使用を推奨するように変更された.

 

現在. ZDVおよび他の抗レトロウイルス療法に広くアクセスできる場所においては,周産期のHIVの伝播は重大な公衆術生問題とならなくなった.

 

試験が毒性のために中止になった例としてはCAST試験(Cardiac Arrhythmia Suppression Trial)が挙げられる.

 

この試験の目的は過去に心筋梗塞を発症しその後頻繁に心室性期外収縮を生じている患者に抗不整脈薬を投与することで不整脈に由来する死亡を減らせるかどうか検討するというものである.

 

予定されたサンプルサイズは4,400人である.適格患者は当初3種の抗不整脈薬(encainide, flecainide, moricizine)の内から1つかそれ以上の薬剤を使用する群にランダムに割付けられた.

 

もし心室性不整脈が抑制されたとホルダー心電図で判定されたら,被験者は最も有効とされる薬とその用量か,プラセボに割り振られた.試験の早期,約1,100人の患者がランダム割付された頃に. DSMBは2群間(実薬群対プラセボ群)に大きな差の傾向があることに気づいた.

 

 

あるグループでは不整脈死が19例生じ,残る一方では3例しか生じていなかった.総死亡数も印象に残る差を示した.

 

DSMBは,実際の治療によってではなくXとYとしてグループを認知していたが.グループの盲検化を維持することを決定した.

 

たとえ傾向が強かったとしても,サンプル数がまだ非常に少なく,必要なイベント数のごくわずかに相当するだけであったためである.

 

数カ月後.死亡率(総死亡率および不整脈死亡率の両方)の差は持続していたため, DSMBのメンバーは盲検化を解除し,会議を開いて議論を行うよう求められた.

 

実薬群のうちの1つでより成績が不良であった,

 

早期の傾向に気づいた6ヵ月後のDSMBの会議の頃には,毒性に関して事前に設定された勧告的な境界線を越える結果となった.

 

すべての有害事象が3つの実薬群の内2つ(encainide. flecainide)に集中していた.

 

それゆえ被験者へこれらの薬を投与することが中止された.

 

試験は第三の薬(moricizine)対プラセボで続行された.しかしながら,2年後その薬も中止された.

 

不整脈を抑制できるかどうか決定するためにその薬剤を評価する短い試験期間中に, moricizine群では15人の不整脈死が観察され.一方プラセボ群では3人のみであった.

 

不整脈が抑制され長期間の実薬群とプラセボ群にランダム割付された患者のあいだでは,moricizine群に対して有意な傾向はなかった.

 

不整脈抑制が評価されたこの試験のある段階からの調査結果により,さらに, encainideとflecainideの初期の経験および試験を続行した際に最終的にmoricizineが不整脈死を抑制するという結論が得られる低い確率(条件付確率)からDSMBはCASTの中止を勧告した。

 

少なくとも部分的には無効による中止の例としては, Physicians Health Study (PHS)の内のアスピリン成分が挙げられる.

 

これは22,000人以上の米国の健康な男性医師を対象とした,アスピリンとβカロチンの2×2デザインの試験である.

 

βカロチン介入の主要評価項目はプラセボに対してがんの発症率を減少させるかどうか,アスピリン介入の主要評価項目はプラセボに対して心血管障害による死亡を減少させるかとうかを検証することであった.

 

数年後,アスピリンの効果で非致死性心筋梗塞の発症率はプラセボに比べて低下の傾向が見られたが,総死亡率と心血管障害による死亡率は予想されたよりも大幅に低かった.

 

次の数年間,心筋梗塞での差は上昇し,統計的に極めて有意な域に達した.

 

しかしながら,心血管障害による死亡率は極めて低いままで,両群間の差はほとんど見られなかった.

 

同時に,発症数は少ないが,出血性脳梗塞の発症率がアスピリン群で高くなる傾向が見られた.

 

最終的には,モニタリング委員会は試験のアスピリン部分を中止するよう勧告した主要な理由は,将来におけるイベントについて様々な推定を行ってもなお,心臓血管障害による死亡率に差が見られるという条件付確率が非常に低くなったことである.

 

試験を結論づけるのに十分なイベント数を得るためには,試験はさらに何年も続行する必要があった.

 

さらなる理由としては,心筋梗塞の転帰について明快な結論,つまりほとんどは非致死的である,が得られたことがある.

 

出血性脳梗塞が多いという傾向が見られたことも,勧告が行われた理由の1つである.

 

PHSのβカロチン部分は継続され,それどころか当初の研究予定期間を越えて延長された.

 

最終的に,がんの発症率について両群間に差は見られなかった

 

DSMBが試験の延長を勧告した主要な理由の1つは,予想されたよりも試験の検出力が低下したことにある.

 

これはおそらく症例集積が予定よりもゆっくりとしか進まなかったことや.発症率が予想されたよりも低かったことに原因がある.

 

試験延長の不適切な理由としては,試験の特に後半の有意ではないが望みとなるような傾向が観察されたことがある.

 

そのような理由で試験を延長することは,検定の有意性に影響するため,極力行わない.

 

外部からの情報も, DSMBによる意思決定の際利用されることもある.

 

米国でPHSが行われていたのと同じ時期に,同様のアスピリンに関する試験が英国で行われていた.

 

その結果は心血管死と心筋梗塞に関してアスピリンは増加も減少もさせず,しかし脳卒中に関しては米国の試験と同じく. PHSのモニタリング委員会に示されたような有害な傾向が認められた.

 

この情報はPHSのアスピリン部分の中止において決定的な因子となってはいないが,委員会の決定に一部寄与している.

 

いくつかの臨床試験は同じ時期に行われている,

 

それらはすべて慢性心房細勣のある脳梗塞の患者にワルファリンの効果を見るものであった。

 

他の3つのものよりも最新のものとして, Canadian Atrial Fibrillation Anticoagulation (CAFA) studyが挙げられる.

 

想定されたサンプルサイズは660人であった.

 

383人が登録された時点で,ワルファリンが有効であるとする他の試験の結果が明らかになった.

 

CAFA試験は,DSMBにてデータを討議されることもなく研究事務局会議にて中止された.

 

なぜならばデータを見るまでもなく研究を続行する必要がないからであった.

 

以前に報告された研究を少なくとも一部の理由として,米国退役軍人省によって行われていたもう1つの類似した試験も早期終了となった.

 

1994年,フィンランドのAlpha-Tocopherol, Beta-Carotene Cancer Prevention study (ATBC)の結果が発表され,βカロチンを投与された集団で肺がんのリスクが増加することを示唆する証拠が得られた.

 

進行中の2つの試験, PHSのβカロチン部分, Beta Carotene and Retinol Efficacy Trial (CARET)は被験者を追跡中であるが,フィンランドの試験の結果を受けて一部変更されている.

 

しかしながら, 1996年にはCARETが予定よりも早く中止された.

 

CARETの試験データのそのものだけでは試験中止には至らなかった.

 

モニタリング委員会ともう1つの独立した審査グループがデータを解析して,肺がんに関するCARETのデータがフィンランドの試験のものと十分似ており,試験の早期中止が望ましいと決定した.

 

これらの例は,研究者と外部のモニタリンググループが他の試験の最新の情報にも注意していることが重要であることを示している.

 

安全性の懸念により有害事象データをモニタリング委員会間で共有することが必要とされることもあるが,通常は非公開の中問結果のやり取りは試験の独立性を危うくすることになるだろう.

 

しかし,疑問が臨床試験によって対処され,既に答えが出たことを示したデータが明らかとなるならば,試験を続行するのには非常に強い理由が必要である.

 

 

効果安全性評価委員会の活動【統計解析講義応用】


セミナー詳細                    解析ご相談                    LINEでお友達

効果安全性評価委員会の活動【統計解析講義応用】

効果安全性評価委員会の活動【統計解析講義応用】