第1相試験のデザイン|【統計学・統計解析講義応用】
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
第1相試験のデザイン
第1相試験は.用量の範囲決めと安全性の研究を含むが,伝統的に非ランダム化試験である.
これらの試験の基本的な目標は,適切な用量を見出すことと試験による介入または治療法に起因する可能性のある毒性を検出することである.
治療法が薬理学的なときは.用量規制毒性(dose limiting toxicity, DLT)の閾値または身体的な事象を定義し,中止基準を作り出しておく必要がある.
通常. DLTの定義は,国立がん研究所の有害事象のための共通毒性基準(National Cancer Institute Common Toxicity Criteria for Adverse Events,NCI-CTCAE)によって定義されるような毒性等級の基準に基づく.
非薬理学的な介入は,伝統的には毒性以外のもので定義されることがよくあるが,その手の介入では用量範囲試験は重要ではないということではない.
例えば,大うつ病(major depressive disorder, MDD)の治療法に対する特定の心理療法の適切な用量を決めるのは重要であり,そのような用量試験は安全性と中止基準を規定しておく必要がある.
特にある治療法ではすべての用量群において毒性を示さないことから,介入や研究デザイン,患者集団が異なれば,中止基準も異なる.
しかしながら,いずれにしても川量範囲試験の開始に先立ってDLTを入念に定義しておくことは必須である.
薬理学的な治療法試験に対しては,数個の用量群またはカテゴリーが選ばれ,各用量群に少人数の被験者が治療されるが,通常次のような方法で用量群を段階的に上げてゆく.
2〜3人の被験者がプロトコールにある最も低い用最群に登録され,もしその中の誰もDLTを進展させなければ,試験は次の用量に上げられる.もし被験者のうちの1人に観察されたら,追加で2〜3人の被験者を登録し,登録された被験者すべてがその時点で進行中の用量を受ける.
もし追加された被験者のうち誰もDLTを進展させなければ,研究は次の用量に上げられる.
前の用量のすべての被験者が指定の期間内に毒性を呈しない限りは,新たな用量群で被験者を登録しない.
さらに.通常,最大耐量(maximum tolerated dose. MTD)は,ある割合,通常33% (研究被験者2人分に相当する低さ)がDLTを経験する用量のすぐ下の用量群として定義される.
通常,研究はMTDとして定義される安全な用量を見つけることを目標とするか,プロトコールで予め決めておいた妓大用量になれば終わる.
この型の試験には様々な変形がある.
非薬理学的な治療法研究に対しては.用量範囲の調査はあまり一般的ではなく,実現可能性や費用,標準的な診療であること(それらの介入は積極的に臨床で使われているけれども有効であるとは経験的に立証していない).および患者への負担(軽減)に基づいて選択されることが多い.
それにもかかわらず,用量範囲は安全性を確立させるために,また特に最適な治療法の強度を同定するために極めて重要である.
非薬理学的な試験の中に用量範囲試験を含め損ねると,治療法は有効ではない(用量が低すぎる場合)か,治療法は利用できない(費用や負担などのため)かのどちらかの早まった結論を導き得る.
安全性に関しては,薬理学的な治療法試験からもっと広い文脈まで,この方法論を使うことは, MTDおよび無毒性であるが望ましくない事象を含めるように拡張されたMTDを明確にすることに帰着する.
時々,薬理学的および非薬理学的な介入に対してランダム化第1相試験が行われている.
これらの試験は,各用量階級に対照介入を受ける少人数の被験者を含めることがある.
早期第II相試験のデザイン
新しい治療のスクリーニングは,単一の治療群または非ランダム化試験で行われることが多い.
例えば,心臓血管疾患に対する治療においては,第n相試験は患者が治療され反応(必ずしも臨床的な反応ではなくバイオマーカーまたは代替指標についての応答が多い)が観察されることが多い.
これらの試験の目的は,新しい治療法が興味ある究極の臨床的エンドポイント(例えば生存率)について有効であることを示すことではなく,これからランダム化比較試験で試験されるのに十分な活性をもつこと(例えば臨床に関連したバイオマーカーが減少すること)のみを証明することである.
これらは概念実証試験(proof of concept studies,POC試験)と呼ばれることが多く,より大規模で費用のかかる試験を正当化するために,ある活性が起こっているという必要不可欠なシグナルを提供するのである.
早期第II相デザインが必要とするのは.大抵は少人数の患者である;新しい治療法の便益が小さいか全くないというエビデンスが示されるときには,そのデザインは無益なあるいは有害な可能性ですらある治療に大多数の患者がさらされるのを防ぐ.
けれども.この戦略の欠点は,実験対照が最適であるように課されることは少ないということである.
このように,内的妥当性を犠牲にすることで,顕著なプラセボ効果や,マスキングを欠くことによる研究者たちのバイアス,平均への回帰,その他内的妥当性を脅かす結果をもたらし得る.
例えば.多発性硬化症(multiple sclerosis, MS)患者の早期第n相治療法試験は,適度のMRI活性に対して候補者をスクリーニングし,長期的に追跡するかも知れない.
自然経過は再発寛解型であるため,患者が再発中であって時間と共に自然に寛解状態に移行しているときにスクリーニングされる可能性がある.
その結果,実験の治療法に効果がなくても.時間経過と共に疾患活動性の減少があるように見えてしまう.
このデザインは,強い対照群とできれば多数の測定を組み込んだより厳密なデザインにより改善されるだろう.
けれども,それにはより大きくて費用のかかる試験をデザインしなければならないが,それで試験治療法が有効であるというエビデンスが必ずしも得られるわけではない.
このように,早期第II相試験は,調査研究プログラムにおいて次のステップに向かうための助けとなる重要な役割を果たすが,後続のもっと厳密な試験を追加でたくさん行わない限り,臨床診療,ガイドラインまたは健康管理政策に変化を引き起こすことはない.
もう一つの早期第n相デザインはヒストリカル対照試験(historical control study)である.
そのような試験は,がん研究でよく用いられている.
そこでは,ランダム化された比較群を設ける代わりに,単一群の患者が治療され,その反応を以前の試験の対照と比較する.
これらの試験では半分の患者数しか使わず.そのうちの誰もプラセボ投与を受けないという利点がある.
重大な不利益もある.
非ランダム化試験にあるような問題に加えて,それら対照は新治療法の患者に対する良い比較対象にならないことが多い.
例えば.対照は,急速に変化する患者プロフィールや治療職略に対して,数年前に実施された試験からとられることが多い.
これは,診断,治療,技術,患者管理が比較的短期間で変化するために,特に問題である.
加えて,患者集団の特性も変化しているかも知れない.
これらの変化はあまり認知されたり報告されることはなく,治療法の有効性を評価する上で重大なバイアスを生じ得る.
関連記事