平均への回帰が生む治療効果の錯覚と真実【ChatGPT統計解析】
平均への回帰(RTM)の影響が試験結果に与える影響を示す例として、ある臨床試験が挙げられます。進行性HIV感染症の治療で、eGFRが60未満の腎機能障害患者が3ヵ月後に劇的なeGFRの増加を示しました。分担研究者は治療効果と考えましたが、統計学者がRTMの影響を指摘し、ベースラインの代わりに2ヵ月後のデータを基に再検討した結果、実際の改善ではなくRTMが関与していると判明しました。同様に、骨密度試験では治療の有効性がRTMにより誤って判断され、ビタミンD補給が効果的と解釈されましたが、これはRTMによるものでした。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
平均への回帰の例
ここでは. RTMが試験の結果を混乱させる,もしくは悪影響を与える少しばかりの古典的な例を示す.
例1:閾値を越えた後の変化
進行性のHIV感染症の増悪に対して,複数の薬剤を使用する高活性抗レトロウイルス療法(antiretroviral therapy, ART)の効果を比較した最近の臨床試験は,どれだけ極端なRTMが存在するかという例を示している.
ここで試験Aと呼ぶこの試験では,ベースラインで推算糸球体濾過扁:(estimated glomerular filtration rate. eGFR)が60を下回ることにより腎機能障害と判断された被験者は,その後3ヵ月の観察で劇的なeGFRの増加を示した.
分担研究者は,治療介入を行ったので,この患者は症状が改善したと結論しようと考えた.
幸運なことに,この不完全な結論が下されるのを食い止めた統計学者たちが近くにいた.
分担研究者はRTMのことを知っていたが,ベースラインで腎機能障害と診断された患者に観察された変化の大きさは,統計的なアーチファクトであり患者の真の状態変化ではないと考えるには臨床的にあまりにも有意なものだった.
分担研究者にeGFRの増加は治療介入によるものではなくRTMが大きな役割を果たしていることを納得させるために,試験統計学者たちは時間を後ろにずらす試みをしてみせた.
ベースライン値を使う代わりに,彼らは2ヵ月後の値を被験者が腎機能不全かどうかを分類するのに用い.ベースラインから2ヵ月後の値が60より低い被験者を分類して,これら同じ被験者の1ヵ月後に戻ってその値を検討した.
RTMの影響がなく治療に効果があるのならば,1ヵ月後の平均は,2ヵ月でなくたった1ヵ月間の治療の結果なので,いくらか小さい値であることが期待される.
しかし,真実はその反対であり2ヵ月後の平均値は46.2.1ヵ月後の平均は61.6であった.
これは観察されたeGFRの増加が,平均への回帰によって生じたものであるという明らかな証拠である.
さらには,1ヵ月後でeGFR<60であった人々は必ずしも2ヵ月後でeGFR<60ではなく,そして両方の時点での被験者の数は概ね同じであった.
eGFRの平均値のレベルと比較して大きな分散のために,この例では特に劇的なRTMの効果が見られたものであった.
他の試験では,分担研究者は彼が誤った結論を導き出すことから救われるほど幸運ではなかった.
ある異常な値が治療を変更させる引き金となり,その後に緩和した数値が観察されたことで新しい治療が効果を現わしていると解釈されることは数多くある.
MortanとTorgerson (2005)は, Heckmanら(2002)によって発表された骨粗鬆症の女性の骨減少を予防する再吸収阻害薬の効果を検討する試験で,この例について言及している.
その試験では,12ヵ月間の治療の後でなお骨密度の低下が認められる患者は.ビタミンDの補給を受けており,24ヵ月後の時点で骨密度が増加した女性はその補給が成功であったと診断された.
第1期の治療期間で骨量の増加が観察された群では.第2期での骨密度の測定において値が減少(まるでRTMがそうさせていたかのように)していたことは興味深いことである.
骨密度(bone mineral density.BMD)は実に変化しやすい.
MortonとTorgersonは,同様な試験で,初めの治療期間で骨量が減った被験者の80%を越える人が,治療法の変更もなく,また同じ期間で骨量が増加している被験者が次の期問で平均的な減少をみたにもかかわらず,次の治療期間で骨量を増加していることを示すことができた.
ベースラインからの減少が見られる時に治療法の変更を行うという設定をすることによって,分担研究者はある罠,ビタミンDが何らかの効果を示したかどうかにかかわらず,続く次の追跡観察時にRTMによる増加によって結果を誤った方向に導いてしまうという罠を仕掛けてしまっていた.
平均への回帰(Regression to the Mean, RTM)は、極端な値を示すデータが自然と平均に戻る傾向を指し、多くの臨床試験や観察研究において無視できない影響をもたらします。この現象を理解することは、特に医学的なデータを扱う際に非常に重要であり、治療効果の過大評価や誤解を避けるために不可欠です。RTMの影響が試験結果を混乱させる例として、進行性HIV感染症の増悪に対する治療法の評価を行ったある臨床試験が挙げられます。この試験、ここでは「試験A」としますが、では複数の薬剤を使用した高活性抗レトロウイルス療法(Antiretroviral Therapy, ART)の効果を検証するもので、特に腎機能障害を有する患者が対象となっていました。具体的には、ベースラインで推算糸球体濾過量(estimated glomerular filtration rate, eGFR)が60を下回る患者が腎機能障害と判断され、これらの患者が3ヵ月後の観察期間においてどのような変化を示すかが検討されました。この試験での結果は、観察対象の患者が3ヵ月後に劇的なeGFRの増加を示したことから、治療の効果として捉えられそうなものでしたが、実際にはRTMの影響が大きく関わっていたと考えられます。分担研究者は、ARTという治療介入を行った結果、腎機能が回復したと結論付けようとしましたが、幸運にもこの不完全な解釈に対して警鐘を鳴らす統計学者が近くにいました。この統計学者は、RTMという統計的なアーチファクトが治療効果の解釈に影響を及ぼしている可能性を指摘しました。実際、分担研究者もRTMの概念については知っていましたが、ベースラインで腎機能障害と診断された患者に見られた変化の大きさは、統計的な要因だけで説明するには大きすぎると感じていたのです。しかし、RTMは特に極端な値が多く出るケースにおいて非常に顕著に表れる傾向があるため、この試験でもRTMの影響が強く出ていたと考えられました。そこで、試験統計学者たちはベースライン値を使用せず、2ヵ月後のデータを基準にして腎機能障害の分類を行うという再検討のアプローチを取ることにしました。この方法は、治療介入が実際に効果を発揮している場合であれば、2ヵ月の治療後に再評価した際にも改善が続いていることを確認するためです。分担研究者たちは、RTMが影響していない状態で腎機能の改善が見られるかどうかを検証するために、時間を遡ってデータを見直すというアプローチを取りました。具体的には、2ヵ月後の時点でeGFRが60を下回った患者について、さらに1ヵ月前のデータに戻って変化の度合いを確認しました。もし本当に治療の効果があったのならば、2ヵ月後の平均値に比べて1ヵ月後の平均値はわずかに小さくなる、つまり治療効果が実際にあれば数値は改善しているはずだと考えられました。しかし実際にはその反対の結果が得られ、2ヵ月後の平均eGFRは46.2、1ヵ月後の平均は61.6という数値でした。この結果は、観察されたeGFRの増加がRTMによって生じたものであり、治療の真の効果とは言えないことを示す明確な証拠でした。このような結果から、RTMの影響は無視できず、データの解釈においてRTMの影響を排除しないと、誤った結論に至る可能性があることが明らかになりました。このRTMによる誤解の影響は他の試験でも見られ、時に研究者が間違った結論を導き出す原因となっています。RTMの影響が強い例として、骨密度(Bone Mineral Density, BMD)の試験も挙げられます。MortonとTorgerson(2005)は、Heckmanら(2002)が発表した骨粗鬆症患者を対象とした試験において、RTMの影響を取り上げました。この試験は、骨密度の低下を防ぐためにビタミンDの補給がどの程度効果を示すかを検証するものでしたが、治療が行われた12ヵ月後の時点で、なお骨密度の低下が観察される患者が存在しました。これらの患者はビタミンDの補給を受け、その後24ヵ月後の時点で骨密度が増加した場合、その効果がビタミンDによるものと判断されました。しかし、この判断もRTMの影響による誤解の可能性がありました。初期の治療期間で骨量が減少していた患者が次の治療期間で増加していたのは、治療法の効果ではなくRTMの影響が関わっていたと考えられます。また、第1期の治療期間で骨密度が増加した群が次の治療期間で減少していたのもRTMが影響を及ぼしていた証拠と考えられました。このように、RTMは治療効果の解釈を誤らせる原因となる可能性があるため、データの変動を理解する上で重要な要素となります。さらにMortonとTorgersonは、初めの治療期間で骨量が減少した被験者の80%以上が、その後の期間で治療の変更が行われていないにもかかわらず、次の治療期間で骨量の増加を示していることを指摘しました。このことから、RTMの影響を考慮せずに治療の有効性を判断することは危険であり、特にベースラインからの変動を基準にして介入を判断すると、治療の変更の有無にかかわらず、続く追跡観察時にRTMによる増加が観察され、結果を誤って解釈してしまう可能性があることが分かります。
関連記事