無作為割り付け【統計解析講義応用】

無作為割り付け【統計解析講義応用】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

無作為割り付け|【統計学・統計解析講義応用】

無作為割り付け【統計解析講義応用】


目次  無作為割り付け【統計解析講義応用】

 

 

無作為割り付け

 

無作為化(randomization)〔無作為割り付けまたは無作為割り当て(random assignment)ともいう〕とは,研究対象をいくつかのグループ(群)に無作為に割り付けることである.

 

無作為(random)とは,本質的に,すべての研究対象がどのグループにも平等のチャンスで割り付けられることを意味する.

 

対象が無作為にグループに割り付けられたなら,従属変数に影響する可能性のある属性に関して,グループ内に系統的偏り(systematic bias)は存在しない.

 

無作為割り付けの目的を考えてみよう.

 

出産したばかりの経産婦の集団に対し,受胎調節相談プログラムの有効性について研究したいと仮定しよう.

 

「相談を行う」群と,「相談を行わない」群の2つの対象者集団を設定する.

 

標本となった女性は,年齢,婚姻状態,経済状態,育児に対する態度など,多くの特性が異なると予測されよう.

 

これらの特性のどれもが,相談を受けるか否かにかかわらず,その女性がどの程度,真剣に受胎調節を行うかに影響する可能性がある.

 

女性の次なる妊娠への実験的相談プログラムの影響を評価するためには,これらの外生変数に関して,相談を「行う」群と「行わない」群とで等しく処する必要がある.

 

研究対象をいずれかの群に無作為割り付けすることは,この均等化の機能を成し遂げるためのデザインである.

 

各女性について,硬貨を投げて決めるのも1つの方法である(もっと洗練された手法についてはあとで検討する).

 

硬貨が「表」ならば一方の群に割り付け,「裏」ならば,他方の群に割り付けることになる.

 

無作為化は,グループを均等にするには好ましい科学的方法であるが,各グループが実際に等しいという保証はない.

 

極端な例として,4人以上の子どもを出産したことのある10人の女性のみが研究標本であったとしよう.

 

10人のうち5人は35歳以上であり,残りの5人は35歳未満であった.各群には,2つの年齢層から2〜3人の女性が無作為に割り付けられると予想されよう.

 

ところが,偶然,35歳以上の女性5人全員が実験群に入ったとしよう.

 

これらの女性は,出産年齢の終わりに近づいているので,今後,受胎する可能性は少なくなる.

 

したがって,彼女らのその後の出産(従属変数)を追跡した場合,相談プログラムは,以降の妊娠の減少に有効であったと示すこともあろうが,コントロール群がより高い出産率を示すのは,年齢や生殖可能性の差のみが反映したものであって,相談を受けなかったことによるのではないともいえる.

 

上記のような可能性があるにもかかわらず,無作為化は,グループを均等化する上で,依然として,もっとも信頼のおける,また容認できる方法である.

 

この例のような異常な,または逸脱した割り付けが生じることはまれであり,対象数の増加とともに,著しく不均等なグループが生じる可能性は減少する.

 

なぜ,実験結果に影響するようなこれらの対象の特性を意識してコントロールしないのかと,不思議に思うかもしれない.

 

これを遂行するために,マッチング(matching)として知られている手法をもちいることがある.

 

たとえば,マッチングを受胎調節相談の研究にもちいた場合,実験群に6人の子どもがいる38歳の既婚女性がいるならば,コントロール群にも6人の子どもがいる38歳の既婚女性を含めたいと思うであろう.

 

しかし,マッチングには,2つの重大な問題がある.

 

まず,マッチングを効果的に行うには,従属変数に影響する可能性のある特性が何かを知る(そして測定する)必要があるが,この情報をいつもわかっているとはかぎらない.
2つ目は,そのような特性を知ったとしても,3つ以上の特性を同時にマッチングするのはきわめてむずかしい.

 

他方,無作為割り付けでは,すべての識別可能な特性(年齢,性別,理解力,血液型,宗教など)は,全グループに均等に割り付けられるだろう.

 

長い目で見れば,数限りない生物学的,心理的,経済的,社会的特性に関して,グループは釣り合うようになるものである.

 

無作為割り付けをどのように行うかを示すために,もう一例をあげよう.

 

扁桃摘出術を受ける子どもの手術前の不安を軽減するための2種の介入を検証するとしよう.

 

1つの介入は,手術チームの活動についての構造化情報(手順の情報)を与えることであり,もう1つの介入は,子どもが何を感じるかについての構造化情報(感覚情報)を与えることである.

 

3番目のコントロール群には,特別な介入はしない.15人の標本で,3グループにそれぞれ5人の子どもを割り付ける.

 

3つのグループでは,硬貨を投げて割り付けを決める方法は使えない.

 

しかし,子どもの名前を紙片に書き,その紙片を帽子に入れ,そこから名前を引く方法をとることができよう.

 

名前が引かれた最初の5人をグループIに,次の5人をグループUに,残りの5人をグループVに割り付ける.

 

帽子から名前を引くという作業は,標本が大きい場合には結構,厄介である.

 

 

研究者は,一般に,無作為化のプロセスで乱数表(table of random numbers)を使う.

 

乱数表は,0から9までの数字をもちいて,出現頻度が均等になるように配列している.

 

乱数表の任意の点からどちらの方向に進んでも,無作為配列になっている.

 

先の例では,15人の対象に,1から15まで番号をつける.

 

次に,乱数表から01と15のあいだの数を取り出す.開始点を決めるための簡単な方法は,目を閉じて,その表の上で指先があてた点を開始点とする.

 

この開始点からその表をどちらの方向に進んでもよく,01と15のあいだの数字を選ぶ.

 

開始点から右のほうへ2桁(9より大きい数,つまり10から15の数字も必要なので)の数字をみていくとしよう.52の右側の次の数字は06である.

 

06番の人,つまり,ネイサンはグループIに割り付けられる.

 

さらに表に沿って進むと,1から15のあいだの次の数字は11である(必要な数字は限られているので,16から99までの数字は無視する).

 

11番目のアラナもまた,グループIに割り付けられる.

 

行の最後にきたら,次の行に移る.

 

次の3つの数は, 01,15, 14である.

 

したがって,クリスティーナ,クリストファー,テイラーがグループIに入る.

 

乱数表に現れる01と15のあいだの次の5つの番号を,同じやり方でグループIIに5人を割り付けるのにもちいる.

 

標本の残りの5人は,グループVに入る.

 

作業を終えるまでに,すでに使用した数字が,その表に繰り返し現れることに注意しなければならない.

 

たとえば,15は,無作為化の過程で4回現れる.

 

数字は無作為であるから,これはまったくふつうのことである.

 

最初に数字が現れたときは使用し,その後に現れた場合は無視する.

 

容易に識別できる特性,たとえば対象者の性別が,3つのグループにほぽ均等に割り付けられるかどうかをみるのは有益であろう.

 

グループ全体は,8人の女の子と7人の男の子からなっている.男女を3つの研究グループに均等に割り付けるという無作為化の作業は成功している様に,他の特性(例:世帯所得,健康状態,術前不安)も,無作為割り付けしたグループにかなり均等に割り付けられていると受けとめてよい.

 

研究を始めるとき,ふつうは十分な標本が集まっておらす,「順次登録(rolling enrollment)」の方法で対象者を標本に加える,

 

しかし,標本の大きさがあらかじめ決まっている場合は,参加者の名前を知ることなく,前述の方式と同じやり方をもちいることができる.

 

こうして,15人の対象者と3つのグループを使う研究で,割り付けをもちいて,研究に最初に当たった人をグループIに,2番目と3番目の人をグループVに,というように割り付けることもできる.

 

この方法を使うと,比較されるグループの標本の大きさは,確実に等しくなる.

 

上述の説明では,グループIの5人の対象者を,「手順情報」グループに割り付けるとは述べていない点に注意しよう.

 

これは,個人をグループに無作為に割り付けるのと同じように,グループを実験処理に無作為に割り付けるのが,優れた方略であるという理由による.

 

「手順情報」,「感覚情報」,「コントロール」という各条件に,それぞれ1, 2, 3の数字を与える.

 

乱数表で新しい開始点を決めて,1, 2, 3という数を求める.今度は,3が一番大きな数なので,1桁の数字を見ていけばよい.

 

多くの場合,無作為化は,個々の対象を異なるグループに無作為割り付けすることである.

 

しかし,他の方法に,クラスター(集群)無作為化法(cluster randomization)がある.

 

その方法では,個人からなるクラスター(集群)を無作為に,異なる処理グループに割り付ける〔Hauck,GiVss, Donner, & Gortner, 1991〕. 

 

クラスター無作為化法は,真の実験の実行可能性を高めることもある。

 

ある時期に病院の1ユニットに入院した患者のグループ,または異なる医療を実施されている患者のグループに,1単位として無作為にある処理条件を割り付けることができる.

 

いくつかの状況では,無作為化に対するいくつかの実際上の障害によって,適用できないこともある.

 

この方法は,2つの異なる処理間のコンタミネーション(contamination ; 汚染)の可能性も少なくする.

 

つまり,グループ内の対象の混合があれば,処理の効果を減じるだろう.クラスター無作為化法の主な欠点は,この方法から得たデータの統計解析がさらに複雑になることであり,通常,ある一定の正確さの水準を得るためには,より大きな標本のサイズが必要になることである.

 

通常,研究者は,対象者を,比較されるグループの数に応じてグループに割り付ける.

 

たとえば,2群をもちいるデザインでは, 300人の対象者からなる標本は,一般に実験群に150人,コントロール群に150人となる.

 

3群を比較する場合は,1群に100人となろう.

 

しかし,違った割り付けの可能性もある(そして,倫理的に望ましい場合もある).

 

たとえば,重症の病気にとくに有望な治療を開発した場合は, 200人を実験処理群に, 100人をコントロール群に割り付ける.

 

しかし,こうした割り付けでは,実験処理の効果を統計学的に有意な水準で検知するのはよりむずかしくなる.

 

 

無作為割り付け【統計解析講義応用】


セミナー詳細                    解析ご相談                    LINEでお友達

 

無作為割り付け【統計解析講義応用】

無作為割り付け【統計解析講義応用】