降圧試験に潜むプラセボ反応と平均への回帰の謎【ChatGPT統計解析】
イルベサルタンの降圧試験において、プラセボ群は平均4 mmHg、薬剤群は5〜10 mmHgの降圧を示したが、この4 mmHgの降下は「プラセボ反応」とは限らず、むしろ「平均への回帰」による可能性がある。慢性疾患では症状が悪化しているときに試験参加を志願しやすいため、登録後は自然に改善することが多い。このため、プラセボ反応と平均への回帰を区別するには、長期間の観察や非治療群の設定が有効とされ、HrobjartssonとGotzcheはこれに基づき、プラセボ反応は多くが平均への回帰であると結論した。また、要因デザインの利点として標本サイズの節約があるが、交互作用がある場合は標本サイズを増やす必要があり、部分要因デザインやMOSTなど新たな方法論が有効となる場合もある。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
紛らわしいプラセボ反応と平均への回帰
平均への回帰現象によって,高い反応の変化からプラセボ反応をどの程度まで区別させることができるのであろうか.
降圧剤であるイルベサルタンの2つの大規模なプラセボ対照用量反応試験において,プラセボのカプセルで治療されていた患者においては最初,平均4 mmHgだけ拡張期血圧が下がり,イルベサルタンで治療されていた患者においては,5〜10 mm下がった.
4 mmの降下は「プラセボ反応」だったのであろうか.
代わりのもっともらしい説明は,この改善は「平均への回帰」現象を反映しているというものである.
症状や兆候が変動する慢性疾患においては,患者は病状が悪いときほど,試験への参加を志願し登録の適格条件を通過しがちである.
逆に,試験へ登録された後では,偶然の変動のみで改善する傾向にある.
プラセボ反応と平均への回帰を区別する一つの方法は,もっと長い期間にわたって,および治療(プラセボを含む)が終わった後でアウトカム(血圧)を観察することである.
後でアウトカム(血圧)が増加していれば,その反応は治療期問における薬剤効果についての患者の期待値であったことを示唆していると言えよう.
完全ではないが,プラセボ反応と平均への回帰を区別する別の方法は,プラセボ群と同様,非治療群または順番待ちリスト対照群を含めることである.
非治療群の改善は平均への回帰であり,プラセボ群における追加の改善はプラセボ効果である.
HrobjartssonとGotzche は,この方を用いて,プラセボ群と非治療群の両方を含んだ156の公表された臨床試験のプラセボ反応を測定した.
彼らは,おそらく痛み,不安など,主観によって報告されるアウトカムの試験を除いて,一般にプラセボ反応と考えられているもののほとんどあるいはすべては,平均への回帰であると結論した.
けれども,その知見はプラセボで発生する生理学的あるいは神経学的な変化を説明することはできていない.
並行群デザインの代わりに要因または部分要因デザインを用いる
要因デザインを用いる1つの利点は標本サイズの節約である.
要因または部分要因デザインが並行群デザインに比べて標本サイズを小さくしないような状況がある.
要因デザインによる標本サイズ節約には付随するいくつかの仮定がある.
1つは,複数の試験治療群は試験で測定されるアウトカムに独立に影響を及ぼすというものであり,それは必ずしも正しいわけではない.
事実,試験目標の1つが試験下にある治療法の交互作用を調査することかも知れない.
治療法の潜在的な交互作用を調べたいと望んでいる試験は,それをするための検出力を持つ必要があり,それには標本サイズを増やすことであるが,時折(いつもではない),並行群デザインのサイズにまで至ってしまうことがあるだろう.
別の状況として.治療法の起こり得る組み合わせの各々を.並行群デザインにおける別個の群とみなすことである.
もっとも,他にも多相の最適化戦略(multiphase optimization strategy.MOST)のようによく使われるようになってきた新しい方法論とか,部分要因デザインに対して交互作用効果の存在を仮定して比較するときでさえも標本サイズをより小さくできるものもある。
平均への回帰現象は、特に臨床試験において、プラセボ反応としばしば混同されがちな重要な概念である。平均への回帰とは、観測されたデータが自然に元の平均値に戻ろうとする現象であり、特に極端な値が観測された場合においてその傾向が顕著に現れる。これは統計学的な現象であり、特に症状の変動が大きい慢性疾患における治験や臨床試験では、平均への回帰がプラセボ反応と区別がつきにくいケースが多い。たとえば、降圧剤イルベサルタンの大規模なプラセボ対照試験において、プラセボカプセルで治療された患者では初期に平均4 mmHgの拡張期血圧低下がみられ、イルベサルタン治療群では5〜10 mmHgの降下が記録された。この4 mmHgの降圧がプラセボ反応によるものか、あるいは平均への回帰の影響によるものかを見極めることは容易ではない。プラセボ反応が真にあるかどうかを判断するには、平均への回帰がどの程度までこの降圧に影響しているかを区別する必要がある。実際、この試験においても4 mmHgの降圧効果がプラセボ反応なのか、あるいは単に患者の病状がもともと悪い時期に試験に参加したことによる平均への回帰によるものなのかを見極めることが大切である。慢性疾患の患者は、症状が悪化しているときに治験への参加を志願することが多く、そのため試験開始後に偶然にも病状が改善することがあり、これが「平均への回帰」として現れる。こうした場合、治療効果ではなく平均への回帰によって症状の改善が見られた場合でも、治療の効果があったように見えてしまう可能性がある。プラセボ反応と平均への回帰を厳密に区別する方法のひとつとして、長期間の観察が有効とされており、治療の持続効果を評価するためには、治療が終了した後でも患者の状態を追跡する必要がある。例えば、治療終了後のフォローアップ期間で血圧が再度増加するようであれば、それは治療期間中の患者の期待感によるものであったと考えられる。このように、治療期を超えた後でもアウトカムを評価することは、プラセボ効果と平均への回帰を区別するうえで重要な方法である。さらに、並行群デザインでは、プラセボ群と同様に、非治療群や順番待ちリスト対照群を設定することも有効である。非治療群の改善は平均への回帰である一方、プラセボ群における追加の改善があればそれはプラセボ効果によるものと解釈できる。この点において、HrobjartssonとGotzcheは156の公表された臨床試験を調査し、プラセボ群と非治療群の両方を含むデザインに基づき、プラセボ反応の実態を検証した結果、痛みや不安といった主観的な報告によるアウトカムの試験を除けば、ほとんどのプラセボ反応は平均への回帰によるものと結論付けた。ただし、この知見ではプラセボによって引き起こされる生理学的や神経学的変化までは説明することができていない。したがって、プラセボ反応のメカニズムをより詳細に理解するためには、さらに多様な視点からの研究が必要とされている。加えて、要因デザインや部分要因デザインは、プラセボ反応と平均への回帰を区別するための有効な手法とされている。要因デザインは標本サイズの節約が可能であり、複数の試験治療群を用いることでアウトカムに独立に影響を与える仮定が成り立つと考えられている。しかしながら、この仮定は必ずしも正しいわけではなく、場合によっては治療法間に交互作用が存在することもありうる。交互作用を調査することが試験の目的である場合には、検出力を確保するために標本サイズを増やす必要があり、時には並行群デザインと同等のサイズに達することもある。また、部分要因デザインを採用する場合、治療法の組み合わせを各群とみなすことで、治療の効果と交互作用をより精密に評価することが可能である。さらに、最近では多相の最適化戦略(MOST)と呼ばれる新しい手法が普及しつつあり、これは部分要因デザインに対しても標本サイズをより小さく保ちながら効果を検証できるとして注目されている。MOSTは、治療群の組み合わせを最適化することで、標本数を抑えつつも十分な検出力を確保できるため、プラセボ効果と平均への回帰を区別しやすくする方法のひとつとして有望である。
関連記事