ランダム割り付けの統計学|【医療統計学・統計解析】
ランダム割り付けの統計学
因果関係を調べるために
薬の効果のように、薬を飲むか飲まないかという「原因」と風邪が治るかどうかという「結果」の間の関係のことを因果関係といいます。
治療効果(因果関係)を調べるためには、
@コントロールグループがある
A調べたい要因(原因)以外のすべての条件がグループ間で等しい
が必要です。
2番目の条件は、ランダム割り付けをすることにより成し遂げられます。
逆に言うと、ランダム割り付けをしない限り、この条件はなかなか成立しません。
したがって、因果関係を調べるための条件として、
B調べたい要因(原因)が人為的に操作可能である。
を加えることもできます。
人為的に操作可能ということは、コイントスをして、表が出たら薬を飲んでください、裏が出たら薬を飲まないでください、という操作ができるということなので、つまりはランダム割り付けができる、ということです。
麦飯は糖尿病に効果的か?
ある新聞記事に、次の記載がありました。
〇〇刑務所で受刑者の健康管理にかかわった〇〇医師が服役している糖尿病患者のデータを分析し、刑務所の食事が糖尿病の改善に向いていることを確認した。
麦飯などに食物繊維がたっぷり含まれているためとみられる。
〇〇刑務所医務課に勤務していた〇〇医師は、1998年から2004年にかけて服役した男性の糖尿病患者109人について、過去のカルテを元に病状の経過を分析した。
平均年齢は51歳で、全員が生活習慣などでインスリンの効きが悪くなる2型の糖尿病だった。
分析の結果、109人のうち92人(84.4%)に糖代謝の改善効果がみられた。
入所時と出所直前の比較では、平均体重は65キロ、62キロと大きな差がなかったが、空腹時血糖の平均値は184ミリグラムから113ミリグラムへ、糖尿病の指標となるグリコヘモグロビンの平均値も8.4%から5.9%へと劇的に低下したという。
また、インスリン治療をしていた18人のうちの5人、血糖降下剤を飲んでいた34人のうちの17人が、それぞれ投薬をやめるまでに改善した。
さて、この新聞記事に記載されている、麦飯食が糖尿病に効果があるかどうか、つまり因果関係が調べられる条件に照らし合わせてみましょう。
まず、@「コントロールグループがある」について・・・でいきなりつまずいてしまいます。
刑務所の中では全員が麦飯食なので、麦飯食をしなかったコントロールグループがありません。
さらに言うと、刑務所に入ると規則正しい生活をしなければならないし、酒やタバコはできません。これでは、はたして麦飯が効果的だったのか、規則正しい生活といった他の要因が効果的だったのかもよくわかりません。
要するに、この記事を読んだだけで「麦飯食べれば糖尿病が良くなる!」という結論は残念ながら導き出せないのです。
実は、この新聞記事の後半部分に、「〇〇医師は喫煙や飲酒の禁止、規則正しい生活とともに刑務所の主食の麦飯に多く含まれている食物繊維が糖の吸収を緩和し、症状改善につながった可能性がある」と指摘すると書かれています。
麦飯だけで糖尿病に効果がある、という因果関係は証明できていないわけですが、規則正しい生活習慣と全体的にバランスのとれた食事の組み合わせは、確かに可能性はあるように思います。
糖尿病に限らず、いろいろと健康によさそうです。
では今度は次の新聞記事を読んでみましょう。
食物アレルギーは食べて治す
アレルギーの原因となる食物をあえて食べながら、子どもの食物アレルギーを克服しようとする試みが本格化している。
これまで食物アレルギーに対しては「原因食物を除き、食べさせないのが常識であった」。だが臨床医の間では、少しずつ食べ続けていると、いつのまにか症状が起こらなくなるなどの現象は知られていた。
数年前からは国内外で食べて治す治療が有効であるという実績が報告され始めた。
ただ、経口免疫療法はまだ研究段階の治療、なぜ食べると治るのかというメカニズムはわかっていない、実施している医療機関ごとに治療法もばらばらだ。
厚生労働省の研究班は2010年度に治療法の確立や有効性の判定などを目指した臨床研究をスタートさせた。
13か所の医療機関などが参加し、約3年間で卵、牛乳、ピーナツに対してアレルギー反応を起こす5〜15歳の約100人を対象に、同じ手法で治療を実施する。
経口免疫療法をした場合と、原因物質を除いた食事を続けた場合とを比較して効果の違いや、効果がどれほど続くかなどをみる。
最後の段落に書かれている臨床研究について注目してみましょう。
まず、臨床研究というのは、病気の予防や診断、治療方法の改善や、病気の原因を明らかにする等のために、ヒトを対象として行われる研究のことをいいます。
この記事に書かれている臨床研究は、きっと、経口免疫療法をするグループと原因物質を除いた食事を続けるグループを比較するランダム化研究です。
しかし、ランダム化さえすればそれですべてが解決するのでしょうか。
単純でないランダム化
人数が少ないと〜
ランダム化により、薬を飲むか飲まないか、などの割り付けられるグループ以外の全ての要因は、人数が増えれば増えるほど2つのグループ間で(平均的に)揃っていきます。
ということは、逆に言うと、人数が少なければ少ないほど、2つのグループ間で何かしらの要因が偏るってことではないでしょうか。
であればランダム化してもダメではないでしょうか。
当然の疑問です。では実際はどうなのか、コンピュータを使ったシミュレーションで試してみましょう。
風邪をひいている人100人を、薬を飲むグループと飲まないグループにランダムに割り付けすることを考えてみましょう。
ただし、この100人のうち20%にあたる20人は風邪の症状が重い、という要因があるとします。ランダム化するので、薬を飲むグループに割り付けられた人のうち症状の重い人は20%、薬を飲まないグループにも20%いることが期待されます。
では、症状の重い人が薬を飲むグループに本当に20%いるかどうかをコンピューターシミュレーションで確かめてみます。
手順は以下の通りです。
@100人の人それぞれがコイントスをする要領で、確率1/2で薬を飲むグループに割り付けられるように乱数を発生させる。
A薬を飲むグループに割り付けられた人のうち症状の重い人が何%いるかを計算する。
Bこれらの@とAの作業を1000回繰り返す。
要するに、まったく同じ100人でランダム化研究を1000回やったとしたらどうなるか、をシミュレーションするわけです。
すると、薬を飲むグループでの重症の人の割合は、100人の場合には20%を中心に広くばらつきますが、人数を増やして1000人にすると、重症の人の割合は20%のあたりに集中することがわかりました。
このように、ランダム割り付けされる人数が少ないと、2つのグループ間で症状の重い人の割合にたまたま偏りが生じてしまうことがあるのです。
これは困った問題です。
重症かどうか、という要因は風邪が治るかどうかに強く影響するので、こんなことが起こってしまうと、たとえたまたまであってもとても困るのです。
もしも症状の重い人ばかりが薬を飲むグループに集中してしまったら、結果、薬を飲むグループには症状の軽い人が多くなり、薬の効果が過大評価されてしまいます。
結果に強く影響するとわかっている要因が偏ることだけは絶対に避けなければなりません。
解決策は単純なことです。
人数を増やせばいいのです。
100人のときよりも1000人のときの方が偏り可能性が低いことがわかったなら、もっと多くの人を集めれば、もっと偏る可能性が低くなることは明らかです。
ところが、実際の臨床研究では、そんなに多くの人を集めるのは現実的に簡単なことではありません。
金、人手、時間がかかります。
また、人数を増やすことにより、偏りの問題は回避できても、偏り以外のところについては問題が起こり得るのです。
では、どうすればよいのでしょうか。
人数が多くないときの対処法
結果に強く影響するとわかっている要因が偏ることだけは絶対に避けなければなりません。
したがって、
結果に強く影響するとわかっている要因が絶対に偏らないように割り付けることを考えます。
症状が重いか軽いか、という要因が問題なのであれば、まずあらかじめ全体を症状の重い人たちと症状の軽い人たちに分けて、それぞれで薬を飲むグループと飲まないグループに割り付けることを考えます。
症状の重い人は症状の重い人だけで、薬を飲むグループと飲まないグループに均等に割り付けられるようにして、同じように、症状の軽い人は症状の軽い人だけで、薬を飲むグループと飲まないグループに均等に割り付けられるようにしようというわけです。
「症状の重い人たち」「症状の軽い人たち」のように、ある特徴をもつ集団のことをサブグループあるいは層と呼ぶことがあります。
ただ単純にサブグループごとに薬を飲むグループと飲まないグループにランダム割り付けするのであれば、普通にランダム割り付けするのと同じことになります。わざわざ症状の重い人と軽い人のサブグループに分ける必要はありません。
そこで、サブグループごとに、研究に参加してくれる人に順番をつけて、奇数番目の人と偶数番目の人に割り付けるブロックを2つ作っておきます。
この2つのブロックを、症状の重い人、症状の軽い人、つまりサブグループごとにランダムに割り付けます。
個人ごとにランダム割り付けするのではなくて、2人の人を1セットにして、セットごとにブロックをランダム割り付けするわけです。
症状の重い1番目の人と2番目の人をセットにしてコイントスをして、表が出たら1番目の人には薬を飲むグループに、2番目の人には薬を飲む飲まないグループに入ってもらい、裏が出たら1番目の人には薬を飲まないグループに、2番目の人には薬を飲むグループに入ってもらい、といった要領です。
このような割り付けの方法を層別ランダム化と言います。
こうすると、セットした2人のうち、1人は薬を飲むグループ、もう1人は薬を飲まないグループに割り付けられることになります。
結果、症状の重い人のうち、薬を飲むグループに割り付けられる人数と薬を飲まないグループに割り付けられる人数が等しくなるわけです。
ずれたとしても、症状の重い人全員の人数が奇数のときの1人だけです。症状の軽い人も同様です。
ただし、この方法には、層(サブグループ)の数が多くなるとうまく機能しないという弱点があります。
ここでは、症状が重いか軽いか、だけに注目しましたが、これに年齢や性別といった様々な要因も考慮に入れると層(サブグループ)の数が爆発的に増えていきます。
症状が重くて、30歳代で、男性で、・・・といくつもの要因を考慮に入れようとすると、極端な話、各層(サブグループ)の人数が1人とか0人になってしまいます。
結局、各個人を、薬を飲むグループと薬を飲まないグループに1/2の確率でランダムに割り付けるのと変わらなくなってしまい、層別する意味がなくなってしまうのです。
ここでは2人をセットにする層別ランダム化を紹介しましたが、4人を1セットにすることもできるし、人数が多くないときの対処法は他にもあります。
しかし、人数が多くないときの対処法は、共通して、層の数が多くなると何かしらうまく機能しないという弱点があります。
人数が多くないときの対処法に対して、各個人を、単純に薬を飲むグループと飲まないグループに1/2の確率でランダムに割り付ける方法を単純ランダム化と呼ぶことがあります。
ここで、層別ランダム化のように面倒なことなんかしなくてもいいんじゃないかと思う人がいるかもしれません。
症状が重いか軽いか、という要因が問題なのであれば、例えば、症状の重い人の中で1番目の人は薬を飲むグループ、2番目の人は薬を飲まないグループ・・・のように、単純に奇数番目の人は薬を飲むグループ、偶数番目の人は薬を飲まないグループ、と割り付ければそれで済みそうなものです。
単純ランダム化の場合も同じです。
奇数番目の人は薬を飲むグループ、偶数番目の人は薬を飲まないグループ、と割り付ければよさそうなものです。
しかし、このような割り付け方法には問題があるのです。
研究者は、少なくとも心の中では薬に効果があることを示したいわけです。
とすると、次に来る患者さんが薬を飲むグループに割り付けられることを研究者が知っていたらどうなるでしょうか?
もし次に来た患者さんが高齢者だったら、その患者さんが研究に参加しないように仕向けることができてしまうのです。
こんなことをしてしまったら、高齢者ばかりが薬を飲まないグループに割り付けられることになってしまいますよね。
薬の効果をきちんと調べられなくなってしまいます。
研究者が事前に割り付けられるグループを知っていてはいけないのです。
患者さんが研究に参加することを同意した後でランダム割り付けをしなければなりません。
関連記事