ランダム化試験の進化:臨床試験の基盤と信頼性【ChatGPT統計解析】
ランダム化試験の歴史はエジプトや中国文明まで遡るが、現代的な臨床試験は20世紀にSir Ronald Fisherが収穫量を調べる農業実験でランダム化を導入したことから始まる。1948年、MRCによるストレプトマイシンを用いた結核治療の試験が最初のランダム化臨床試験とされ、Sir Austin Hillが関わったこの試験は、割り付けを隠蔽することでバイアスを排除する設計が注目された。1930年代には、疑似ランダム化が試験に使われ、例えばJoseph Bellは姓の文字を用いた分け方で試験を行い、1941年にはBellがランダム化を使用した最初の対照試験を報告した。ブロックランダム化は、群間の均衡を保つために特定の数の被験者を事前に割り付ける手法で、単純ランダム化の不均衡を補完する。ブロックサイズを変えることで治療割付の推測を防ぎ、ランダム化割付の信頼性を高める工夫がされており、これが現代の臨床試験の基盤となっている。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
ランダム化試験の歴史
医学研究の歴史は初期エジプトと中国文明へと遡る.
しかし,近代の臨床試験は,1926年のSir Ronald Alymer Fisher による収穫量を調べる農場実験に取り組むランダム化試験の開発に続く20世紀までみられなかった.
最初の真のランダム化臨床試験は,一般的に結核治療のためにストレプトマイシンの有益性を調べたBritish Medical Research Council (英国MRC)による1948年の研究であると考えられている.
百日咳ワクチンの有効性を調べる他のMRC試験では,数カ月前に被験者をランダム化し始めていた.
MRCの統計家であるSir Austin Bradord Hillはこれらの2つの試験に関与していたが,ランダム化デザインを確保した.
発表されたうちの1つのストレレブトマイシン試験は,臨床試験の歴史の中で「分岐点(watershed)」として引用された.
これらの試験のどちらも,ランダム化の要素を初めて用いたものではないが.後に述べるように.どちらの試験においても重要なイノベーションは,バイアス群の選択と臨床観察に影響しないように治療の割付けを隠したランダム化の実施である.
1937年に連載された彼の影響力のある論文において,Hillは治療割付を隠す(concealment)こと含めた近代的なランダム化比較臨床試験を特徴づける多くの原則を概説した。
実際に,おそらく分岐点となるストレプトマイシンの試験より前にランダム化の要素を用いたであろう多少の試験が文献にみられる.
1931年Doullらはかぜ(感冒)の予防に対する放射線治療(irradition)の効果を評価する試験結果を報告している.
この試験では,異なる色のサイコロは,異なる治療群を示した.
被験者の名前をアルファベット順に並べ,サイコロを「ランダム」につぽから取り出し,その色によって遂次的方法(sequential manner)で被験者の割付けを決めた.
同様の方法は,妊娠子癇前症(pregnancy preeclampsia)の予防のためのビタミン補給を評価する試験で被験者の女性を2つのグループ分けるのに用いられたと1937年に記録されているJoseph Bell (1930年代後半から1940年代に入念にデザインされた百日咳ワクチン(pertussis vaccine)の一連の試験を実施したもう1人の革新的な臨床家)は,治療を割り当てるために,偽ランダム化,続いてランダム化の方法を用いた.
彼の初期の試験は,「ランダムな」方法で被験者を群に分けるために,彼らの姓(last name)の文字を用いた.
そして. 1941年,おそらくBellは,ランダム化の使用を文書化した最初の対照試験について報告した.この試験では,乱数表(random numbers)が被験者を2つ「同質の群」に分けるのに用いられた.
1930年代および1940年代にランダム化試験の発展に先だって,偽ランダム化試験の多くの初期の例があった.
Hill自身は,彼の初期の論文の中で,交互治療群割付をランダム割付と同等とみなしていたが,後に彼は,真のランダムプロセスには盲検化の維持が必要であると認めた。
交互割付方法には最初の治療割付だけが本当にランダムであり,だれか1人の被験者が非盲検ならば,全群の治療割付は明らかになるといった欠点がある.
Ambersonら(1931)は,臨床試験の実施においてランダム化の何らかの方式を用いた最初の人物として名を残している.
結核治療のためのサノクリシン(sanocrysin)の有効性を調べる試験において,24名の被験者が,2つの同数の比較群に分けられた.
そして,1回コインを投げて.一方を治療群に.もう一方を比較群に割付けた.コイントスの前に群をつくることによって,研究者も被験者も,どの群が最終的に治療を受けるについてわからない.
おそらく,このアプローチ.研究者または被験者の選択によって異なった治療に割り付けられることを防ぐ効果があった.
にもかかわらず,2群はランダムに構成されていないし.被験者の主要な背景において2群問で意図しない,または系統的な違いが起こる.
ランダム化試験の導入に続いて,多くの個人や施設は.時として非常に熱心に討論し,数十年間における医学研究への適応に役立った.
読者には,20世紀広範囲起こった医学だけでなく,この時代の多くの分野で,実験的なプロセスの魅力的な進化を探求するよう勧める.
この間統計学は,科学的なプロセスの進展において,重要な役割を持っていた.
「The Progress of Experiment! とD.SalsburgのThe Lady Tasting Tea』(邦訳:統計学を拓いた異才たち)は,このテーマに関する多くの興味深い文献のうちのまさしく2つである.
今日,ランダム化比較試験は新たな介入の評価のためのゴールドスタンダードである.
初期のいくつかの試験で見られるように,ランダム化割付の成功は,用いたランダム化の方法によって決まる.
偽ランダム化の方法は,割付の際の意図的でないパターンと被験者選択の際の後付け的なバイアスの影響を受けやすい.
次の2つのセクションでは,ランダム化割付をうまく実施する,または適応する方法を示す.
ランダム化の方法
我々は,ギャンブルや宝くじは言うまでもなく,日常生活の中で,例えば,フットボールの試合前のコイントス,ボードゲームで投じるサイコロ,いくつかのコンテストにおける帽子の中から引く名前など,ランダム化をよく知っている.
これらの場合のランダム化の目的は,公平ではあるが予測不可能な方法で,結果を求めることである.
単純ランダム化
単純ランダム化(simple randomization)では.それぞれの被験者は他の被験者の治療割付にかかわらず,事前に決定した確率に基づいて,治療にランダムに割付けられる.
一般的なデザインはそれぞれの治療群に同じ確率を持って割付ける.
Theodoreらのてんかんに対するプラセボコントロールフェルバマート(felbamate)単独投与試験のような2群間比較試験においては,ランダム化の結果は,試験でそれぞれの被験者にコインが表(H)を示した時,被験者を治療群に割付け,裏(T)を示した時,被験者をプラセボに割付け,公平なコイントスと一致する.
このような8の治療に対する割付のランダム化の順序はHH THTTH 7のようになる.
平均的に単純ランダム化はそれぞれの群におおよそ同数の被験者を割付とするにもかかわらず,同数の群ができる保証はない.少数被験者の試験において,大きな不均衡ができる可能性がある.
例えば,18回のトスの順序はTHTTHTTTTH 7 7 TTHTTTで,4回の表と14回の裏といった大きな不均衡となる.
極端または非常に極端なこの不均衡となる確率は0.03以上である.
すなわち,このような不均衡を観察する可能性が3%ある.
例数が18のような小さな試験で.単純ランダム化を用いた場合,このような大きな不均衡が起こる確率は小さいが,無視できない.
他のランダム化手順は,このタイプの不均衡を起こす確率を小さくしたり,排除して,表裏の順で発現する傾向を防ぐために開発された.
ブロックランダム化
ブロックランダム化(block randomization)法は,被験者の一定数が登録された後に,被験者の事前に決められた割合をそれぞれの群に割付けることを確実にする.
この方法はまた,置換ブロックランダム化(permuted block randomization)とも呼ばれ,被験者がランダムに置換された治療割付のブロックを構成していると考えることができる.
ブロックランダム化は各群の被験者の割合を常に期待する割合に可能な限り近づける.
我々はいくつかの時点で蓄積されたデータをしばしば解析するため,このことは重要である.
それぞれの解析の際,なるべく近い均衡を確保することが有効である.
以下にブロックランダム化の例を示す.
2つの同サイズに設定された治療群と4のブロックサイズの場合を考える.順序HHTT THTH THTH HTTH HHTT THHTは,このブロックサイズによってランダム化される
24の治療割当ての1つのランダム化順序である.
4つの治療割付を完全に実施すれば,2群に割付けられた被験者は全く同数になる.
加えて試験が予定より早く終わったとしても各群における例数の不均衡は2の違いである.
このランダム化の手順は表裏の順で発現する傾向の確率をなくす.
この特徴は特に有用である.
なぜなら,もし経時的な傾向があるならば,すなわちランダム化した群の被験者の特性の1つにおいて,不運にも一方の群に連続して割り付けられると,その特性のために群間で不均衡が起こる可能性がある.
この一方の群に割り付けられる不均衡は,群間での違いの結果に影響を及ぼす可能性がある.
より明白に,もし結果が季節に関与するなら,例えば,インフルエンザの予防を調べる試験では,そして発生の少ない春や夏に新しい治療群へ被験者を多く割り付けられると,新しい治療群に有利なバイアスの含んだ結果となる.
これはまさに季節に依存している.
上記の例からわかるように,2群間は,治療割付のブロックが完全である場合にのみ,均衡がとられている.
このようにブロックサイズを選択するときに考慮する良い基準は,被験者数である.
すなわち不完全なブロックによる不均衡は,それぞれの治療群の大きさに比べて小さい.
また,一般に.ブロックサイズを治療群の数より大きくしておくことが望ましい.
例えば,もし.現在の被験者の割付群が何かの理由で知ることとなった場合,次の被験者の治療割付が推測できるので,2群の試験でブロックサイズを2とするのは避けるべきである.
置換ブロックランダム化は,しばしばランダムに選ばれたブロックサイズ(例えば,ブロックサイズ4と6が同じ確率で出現する)を用いる.
様々なブロックサイズを用いると,もう1つの隠蔽を与える.
なぜなら,それは治療割付の規則を推測することをより困難にするからである.
この隠蔽をうまく行うための付加的な方法として,ブロックサイズを何度も繰り返すべきでない.
また,ブロックサイズをプロトコールまたは治験手順書に記述すべきではないと言われる.
限られた関係者のみにアクセスできる内部資料の一部にすべきとの考えもある.
ランダム化試験の歴史は、エジプトや中国の古代文明までさかのぼり、医療や農業における研究の重要性を示す一方、現代的な臨床試験としてのランダム化試験の発展は20世紀に入ってから本格的に進展しました。20世紀初頭、統計学者のSir Ronald Alymer Fisherが収穫量を調べる農業実験でランダム化の手法を導入したことが、現代のランダム化試験の基礎となる重要な転換点となりました。この農業分野でのランダム化試験は、従来の単なる経験則に依存した観察から脱却し、統計学的な正確性を持って因果関係を特定する方法の始まりを示していました。この技術は、当初農業実験に適用されていたものの、医療の分野でも応用され、疾患や治療法の有効性を厳密に評価するための方法として発展していきました。ランダム化を行うことで、被験者がどの治療群に割り当てられるかをあらかじめ決定するバイアスを最小限に抑え、治療の真の効果を評価することができるようになりました。1948年、結核治療におけるストレプトマイシンの効果を調べるために、British Medical Research Council(英国MRC)が最初の真のランダム化臨床試験を実施しました。この試験は、臨床試験の歴史において画期的なものであり、特にMRCの統計家であったSir Austin Bradford Hillが中心となり、バイアスを最小限に抑えるためのランダム化と割り付けの隠蔽を採用した点が重要な特徴です。この研究の結果、ストレプトマイシンの有効性が確認され、結核治療の新たな展望が開かれることとなりました。また、Hillは他の百日咳ワクチンの試験でも同様のランダム化設計を導入し、ランダム化試験の標準化に貢献しました。しかし、ランダム化試験の概念自体は1948年の試験以前から試行されており、たとえば1931年にDoullらが放射線治療の効果をランダム化により評価した試験を行ったり、Joseph Bellが1930年代から1940年代にかけて、百日咳ワクチン試験で疑似ランダム化を使用し治療割り当ての公平性を高める工夫をしていました。ランダム化試験におけるバイアスを防ぐためには、単純なランダム化だけでなく、割り当ての隠蔽が重要であることがわかり、後のHillの試験では被験者および研究者に対する盲検化が試験の信頼性向上のために用いられました。こうした背景からランダム化比較試験は、臨床試験の「ゴールドスタンダード」として位置づけられるに至りました。ランダム化は被験者の偏りを除き、特定の治療法がどのように効果を発揮するかを公平に判断するための手法であり、現代における臨床試験の信頼性と科学的正確性の確保に不可欠なものです。また、ランダム化の方法も進化し、単純ランダム化だけでなく、ブロックランダム化や層別ランダム化など、試験のデザインや規模に応じて最適な方法が選択されるようになりました。単純ランダム化とは、例えばコイン投げのように各被験者が治療群か対照群に振り分けられる確率が事前に設定されたもので、少数の被験者で行う試験では群間に大きな不均衡が生じるリスクがありました。これを解決するために、ブロックランダム化という手法が導入され、被験者数が少なくても両群に均等に割り当てることが可能になりました。たとえばブロックサイズ4を設定した場合、順番に4人ずつの被験者をランダムに治療群と対照群に割り当てることで、群間の大きな不均衡を防ぐことができ、試験の信頼性が向上しました。さらに、ブロックサイズを変動させることにより、治療群が特定の順序で発現することを防ぐ効果があり、治療割付の規則性を第三者が予測することを困難にしました。Hillは、このブロックランダム化を臨床試験に導入することで、試験の信頼性をさらに高めることに成功し、医学研究においてこの手法が標準化されていきました。次第にブロックランダム化だけでなく、被験者の特性によって層別ランダム化も利用されるようになり、特に対象群の年齢や性別、健康状態などの異なる要因によって被験者を層に分けてからランダム化を行うことで、治療の効果がより正確に比較できるようになりました。例えば、年齢別に層を作り、各層ごとにランダム化することで、年齢による治療効果の違いが正確に評価でき、結果の解釈がより信頼性の高いものになりました。また、試験の途中で収集されたデータを分析するための中間解析もブロックランダム化の手法で重要となり、事前に設定された均衡のもとでのデータ解析が可能となりました。さらに、研究者たちは、被験者の特性の偏りや治療効果に関する不確実性を低減するために、異なるブロックサイズを使用したり、ブロックサイズをランダムに選定するなどの工夫を凝らすようになりました。例えば、ブロックサイズ4と6をランダムに選定することで、試験実施者が次にどの割り当てが来るかを予測することを防ぎ、より信頼性の高い割り当てが可能となりました。また、割り当ての隠蔽についても多様な方法が考案され、たとえば治験手順書に割り当て情報を記載しない、またはプロトコールにブロックサイズを明記しないなどの方法が推奨されるようになりました。このようにランダム化試験の手法は進化を続け、被験者と試験者の両方に対して公平性と隠蔽性を確保する方向へと発展してきました。現在、ランダム化比較試験は、さまざまな新しい介入や治療の効果を厳密に評価するための基準として広く認識されています。医療の分野で用いられると、治療法の効果や安全性が客観的に評価されるため、医療提供者と患者の双方が信頼できる情報を得られるようになります。また、ランダム化の方法も多岐にわたり、今後も技術の進展や新たな試験デザインの導入に伴い、さらに精度が向上すると期待されています。
関連記事