無作為割り付けで偏りを排除!研究精度を高める方法【ChatGPT統計解析】
無作為割り付けとは、対象者をランダムにグループに割り付ける方法で、研究において従属変数に影響する偏りを除去することを目的とする。例として、出産した女性に受胎調節相談の効果を調べる場合、年齢や経済状況の違いが影響する可能性があるため、無作為に相談群と非相談群に分ける。無作為化によりグループ間で特性の均等化が図られるが、必ずしも完全な均等が得られるわけではない。より正確な割り付けのためにマッチングも利用されるが、特性を正確に測定できない場合や特性が多い場合には難しい。研究における無作為化は乱数表やクラスター無作為化法を用いることが多く、これによりコンタミネーションのリスクを低減できる。しかし、クラスター無作為化法では統計解析が複雑になり、大きな標本が必要となる。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
無作為割り付け
無作為化(randomization)〔無作為割り付けまたは無作為割り当て(random assignment)ともいう〕とは,研究対象をいくつかのグループ(群)に無作為に割り付けることである.
無作為(random)とは,本質的に,すべての研究対象がどのグループにも平等のチャンスで割り付けられることを意味する.
対象が無作為にグループに割り付けられたなら,従属変数に影響する可能性のある属性に関して,グループ内に系統的偏り(systematic bias)は存在しない.
無作為割り付けの目的を考えてみよう.
出産したばかりの経産婦の集団に対し,受胎調節相談プログラムの有効性について研究したいと仮定しよう.
「相談を行う」群と,「相談を行わない」群の2つの対象者集団を設定する.
標本となった女性は,年齢,婚姻状態,経済状態,育児に対する態度など,多くの特性が異なると予測されよう.
これらの特性のどれもが,相談を受けるか否かにかかわらず,その女性がどの程度,真剣に受胎調節を行うかに影響する可能性がある.
女性の次なる妊娠への実験的相談プログラムの影響を評価するためには,これらの外生変数に関して,相談を「行う」群と「行わない」群とで等しく処する必要がある.
研究対象をいずれかの群に無作為割り付けすることは,この均等化の機能を成し遂げるためのデザインである.
各女性について,硬貨を投げて決めるのも1つの方法である(もっと洗練された手法についてはあとで検討する).
硬貨が「表」ならば一方の群に割り付け,「裏」ならば,他方の群に割り付けることになる.
無作為化は,グループを均等にするには好ましい科学的方法であるが,各グループが実際に等しいという保証はない.
極端な例として,4人以上の子どもを出産したことのある10人の女性のみが研究標本であったとしよう.
10人のうち5人は35歳以上であり,残りの5人は35歳未満であった.各群には,2つの年齢層から2〜3人の女性が無作為に割り付けられると予想されよう.
ところが,偶然,35歳以上の女性5人全員が実験群に入ったとしよう.
これらの女性は,出産年齢の終わりに近づいているので,今後,受胎する可能性は少なくなる.
したがって,彼女らのその後の出産(従属変数)を追跡した場合,相談プログラムは,以降の妊娠の減少に有効であったと示すこともあろうが,コントロール群がより高い出産率を示すのは,年齢や生殖可能性の差のみが反映したものであって,相談を受けなかったことによるのではないともいえる.
上記のような可能性があるにもかかわらず,無作為化は,グループを均等化する上で,依然として,もっとも信頼のおける,また容認できる方法である.
この例のような異常な,または逸脱した割り付けが生じることはまれであり,対象数の増加とともに,著しく不均等なグループが生じる可能性は減少する.
なぜ,実験結果に影響するようなこれらの対象の特性を意識してコントロールしないのかと,不思議に思うかもしれない.
これを遂行するために,マッチング(matching)として知られている手法をもちいることがある.
たとえば,マッチングを受胎調節相談の研究にもちいた場合,実験群に6人の子どもがいる38歳の既婚女性がいるならば,コントロール群にも6人の子どもがいる38歳の既婚女性を含めたいと思うであろう.
しかし,マッチングには,2つの重大な問題がある.
まず,マッチングを効果的に行うには,従属変数に影響する可能性のある特性が何かを知る(そして測定する)必要があるが,この情報をいつもわかっているとはかぎらない.
2つ目は,そのような特性を知ったとしても,3つ以上の特性を同時にマッチングするのはきわめてむずかしい.
他方,無作為割り付けでは,すべての識別可能な特性(年齢,性別,理解力,血液型,宗教など)は,全グループに均等に割り付けられるだろう.
長い目で見れば,数限りない生物学的,心理的,経済的,社会的特性に関して,グループは釣り合うようになるものである.
無作為割り付けをどのように行うかを示すために,もう一例をあげよう.
扁桃摘出術を受ける子どもの手術前の不安を軽減するための2種の介入を検証するとしよう.
1つの介入は,手術チームの活動についての構造化情報(手順の情報)を与えることであり,もう1つの介入は,子どもが何を感じるかについての構造化情報(感覚情報)を与えることである.
3番目のコントロール群には,特別な介入はしない.15人の標本で,3グループにそれぞれ5人の子どもを割り付ける.
3つのグループでは,硬貨を投げて割り付けを決める方法は使えない.
しかし,子どもの名前を紙片に書き,その紙片を帽子に入れ,そこから名前を引く方法をとることができよう.
名前が引かれた最初の5人をグループIに,次の5人をグループUに,残りの5人をグループVに割り付ける.
帽子から名前を引くという作業は,標本が大きい場合には結構,厄介である.
研究者は,一般に,無作為化のプロセスで乱数表(table of random numbers)を使う.
乱数表は,0から9までの数字をもちいて,出現頻度が均等になるように配列している.
乱数表の任意の点からどちらの方向に進んでも,無作為配列になっている.
先の例では,15人の対象に,1から15まで番号をつける.
次に,乱数表から01と15のあいだの数を取り出す.開始点を決めるための簡単な方法は,目を閉じて,その表の上で指先があてた点を開始点とする.
この開始点からその表をどちらの方向に進んでもよく,01と15のあいだの数字を選ぶ.
開始点から右のほうへ2桁(9より大きい数,つまり10から15の数字も必要なので)の数字をみていくとしよう.52の右側の次の数字は06である.
06番の人,つまり,ネイサンはグループIに割り付けられる.
さらに表に沿って進むと,1から15のあいだの次の数字は11である(必要な数字は限られているので,16から99までの数字は無視する).
11番目のアラナもまた,グループIに割り付けられる.
行の最後にきたら,次の行に移る.
次の3つの数は, 01,15, 14である.
したがって,クリスティーナ,クリストファー,テイラーがグループIに入る.
乱数表に現れる01と15のあいだの次の5つの番号を,同じやり方でグループIIに5人を割り付けるのにもちいる.
標本の残りの5人は,グループVに入る.
作業を終えるまでに,すでに使用した数字が,その表に繰り返し現れることに注意しなければならない.
たとえば,15は,無作為化の過程で4回現れる.
数字は無作為であるから,これはまったくふつうのことである.
最初に数字が現れたときは使用し,その後に現れた場合は無視する.
容易に識別できる特性,たとえば対象者の性別が,3つのグループにほぽ均等に割り付けられるかどうかをみるのは有益であろう.
グループ全体は,8人の女の子と7人の男の子からなっている.男女を3つの研究グループに均等に割り付けるという無作為化の作業は成功している様に,他の特性(例:世帯所得,健康状態,術前不安)も,無作為割り付けしたグループにかなり均等に割り付けられていると受けとめてよい.
研究を始めるとき,ふつうは十分な標本が集まっておらす,「順次登録(rolling enrollment)」の方法で対象者を標本に加える,
しかし,標本の大きさがあらかじめ決まっている場合は,参加者の名前を知ることなく,前述の方式と同じやり方をもちいることができる.
こうして,15人の対象者と3つのグループを使う研究で,割り付けをもちいて,研究に最初に当たった人をグループIに,2番目と3番目の人をグループVに,というように割り付けることもできる.
この方法を使うと,比較されるグループの標本の大きさは,確実に等しくなる.
上述の説明では,グループIの5人の対象者を,「手順情報」グループに割り付けるとは述べていない点に注意しよう.
これは,個人をグループに無作為に割り付けるのと同じように,グループを実験処理に無作為に割り付けるのが,優れた方略であるという理由による.
「手順情報」,「感覚情報」,「コントロール」という各条件に,それぞれ1, 2, 3の数字を与える.
乱数表で新しい開始点を決めて,1, 2, 3という数を求める.今度は,3が一番大きな数なので,1桁の数字を見ていけばよい.
多くの場合,無作為化は,個々の対象を異なるグループに無作為割り付けすることである.
しかし,他の方法に,クラスター(集群)無作為化法(cluster randomization)がある.
その方法では,個人からなるクラスター(集群)を無作為に,異なる処理グループに割り付ける〔Hauck,GiVss, Donner, & Gortner, 1991〕.
クラスター無作為化法は,真の実験の実行可能性を高めることもある。
ある時期に病院の1ユニットに入院した患者のグループ,または異なる医療を実施されている患者のグループに,1単位として無作為にある処理条件を割り付けることができる.
いくつかの状況では,無作為化に対するいくつかの実際上の障害によって,適用できないこともある.
この方法は,2つの異なる処理間のコンタミネーション(contamination ; 汚染)の可能性も少なくする.
つまり,グループ内の対象の混合があれば,処理の効果を減じるだろう.クラスター無作為化法の主な欠点は,この方法から得たデータの統計解析がさらに複雑になることであり,通常,ある一定の正確さの水準を得るためには,より大きな標本のサイズが必要になることである.
通常,研究者は,対象者を,比較されるグループの数に応じてグループに割り付ける.
たとえば,2群をもちいるデザインでは, 300人の対象者からなる標本は,一般に実験群に150人,コントロール群に150人となる.
3群を比較する場合は,1群に100人となろう.
しかし,違った割り付けの可能性もある(そして,倫理的に望ましい場合もある).
たとえば,重症の病気にとくに有望な治療を開発した場合は, 200人を実験処理群に, 100人をコントロール群に割り付ける.
しかし,こうした割り付けでは,実験処理の効果を統計学的に有意な水準で検知するのはよりむずかしくなる.
無作為割り付けとは、研究対象者をいくつかのグループに無作為に振り分ける手法で、無作為化(randomization)や無作為割り当て(random assignment)とも呼ばれる。この方法は研究デザインの一環であり、実験群と対照群といった異なるグループ間で、従属変数に影響を及ぼす特性が偏ることなく平等に割り付けられるようにするためのものである。無作為化の目的は、グループ間で系統的な偏り(systematic bias)を除去し、実験処理の効果がより正確に評価できるようにすることである。たとえば、出産後の経産婦の集団に対して、受胎調節相談プログラムの有効性を検証する場合を考えてみる。この研究では、「相談を行う」群と「相談を行わない」群という2つの対象者集団を設定するが、集団内の各個人は年齢、婚姻状態、経済状態、育児に対する態度など、さまざまな特性が異なると予想される。これらの特性は、受胎調節相談の効果に影響を及ぼす可能性があるため、各グループに無作為に対象者を割り当てることで、こうした特性の影響が均等に反映されるようにする必要がある。このような無作為割り付けの方法として、例えば硬貨を投げて割り当てる手法が挙げられる。硬貨が「表」であれば一方のグループに、硬貨が「裏」であれば他方のグループに割り付けるなど、簡易でありながら実用的な方法である。こうした手法は、対象者が少数の場合には適しているが、無作為性が確保されないときには、例えば異なる特性を持つ対象者が一方のグループに偏ってしまう場合もある。無作為割り付けは非常に重要なデザイン要素であるが、偶然による偏りが完全に排除されるわけではない。例えば、出産年齢の終わりに差し掛かっている経産婦ばかりが一方のグループに偏った場合、そのグループでは受胎調節の影響にかかわらず妊娠率が自然に低下する可能性がある。無作為割り付けは、そうしたリスクを低減するために最も信頼性が高いとされるが、完全な均等化が保証されるものではない。対象者が少ない場合には偏りが生じやすいが、研究対象が多くなればなるほど、偏りが減少し、グループ間の均等化がより効果的に行われる。また、無作為割り付けが機能しない場合、マッチング(matching)と呼ばれる方法もある。マッチングとは、例えば相談プログラムを研究する実験群に既婚女性がいる場合、その特性を考慮して対照群にも同じ年齢や同様の特性を持つ女性を配置する手法である。しかし、マッチングには2つの大きな課題がある。まず、従属変数に影響を与える可能性のある特性を事前に把握していなければならないこと、そして3つ以上の特性を同時にマッチングすることが非常に難しいことである。無作為割り付けは、この点において優位性があり、数多くの特性を自動的に均等に配置できるため、より多くの特性に対して影響を受けないグループを作り出すことができる。無作為化の方法には乱数表を用いるものもあり、乱数表は0から9までの数値がランダムに配置され、頻度が均等になるようになっている。乱数表を使用すると、開始点を選び、どの方向に進むかを決めて数字を選んでいくことができるため、硬貨を投げる手法よりも洗練されている。さらに、大規模なサンプルや異なるグループ数を対象とする場合、クラスター無作為化法(cluster randomization)を使うこともある。この方法では、個人ではなく集団単位でランダムに割り当てを行う。例えば、ある病院の患者群を一単位とし、異なる医療処置を行うグループに割り当てることができる。この手法はコンタミネーションのリスクを減らし、各グループ内で処理の効果が変わらないようにするのに適している。しかし、クラスター無作為化法の欠点として、データの統計解析が複雑になることや、より大きな標本が必要になることが挙げられる。具体的な例として、手術前の不安を軽減するための介入を検証する研究がある。この研究では、「手順情報を提供する群」「感覚情報を提供する群」「特別な介入を行わない群」に対象者を割り当て、それぞれの群での効果を比較する。対象者15人を3つのグループに均等に分けるには、乱数表や名前のくじ引きなどを用いた割り付けが有効であるが、対象数が増えると、コンピュータを用いた乱数割り付けや順次登録(rolling enrollment)が用いられることが多い。順次登録では、標本数が決まっていない場合に、参加者が集まるごとに順次グループに追加していく手法であり、無作為化の原則を保ちつつも標本数を確保するのに便利である。無作為割り付けの利点としては、対象者がどの特性においてもグループ間で均等に分布されることであるが、これにより実験処理の効果が明確になり、各グループの均等な比較が可能となる。無作為割り付けを行う際には、対象者の数が多いほど、特性の偏りが少なくなり、無作為性が確保されやすくなる。例えば、手順情報を提供するグループ、感覚情報を提供するグループ、対照群といった各グループに、対象者が均等に割り当てられるよう、乱数表を使用することで、実験の精度が高まる。加えて、クラスター無作為化法を用いた場合、より大規模な研究に適応でき、コンタミネーションのリスクが低減し、統計解析の精度も向上する。また、無作為割り付けを行うにあたり、対象者の識別可能な特性(例えば性別や年齢)が均等に割り付けられているかを確認することは有益であり、これは研究の信頼性を高めるための重要なチェックポイントとなる。
関連記事