準実験|【統計学・統計解析講義応用】
準実験
準実験(quasi-experiment)では,真の実験と同じように,独立変数の操作,つまり介入を施す.
しかし,準実験デザインは,真の実験の特徴である処理群への無作為化が欠けている.
準実験デザイン
準実験は,介入と結果の因果関係を,実験ほど強力には確証できない.
その理由を示す前に,キャンベルとスタンリー〔Campbell & Stanley, 1963〕の古典的モノグラフに基づいた記号を,いくつか紹介しよう.
0は,観察(従属変数に関するデータの収集)をあらわす.
Xは,介入への曝露である.
これに従うと,実験群があり,それは,対象従業員の士気が,最初から異なっていたかもしれない.
キャンペルとスタンリー〔Campbell, & Stanley.1963〕は,「不等価コントロール群事後テストのみデザイン」を,その根本的な欠点ゆえに,準実験ではなく前実験(preexperimental)とよんでいる.
このように,準実験は,真の実験のコントロールという特性を欠いているが,準実験の顕著な特徴は,無作為化またはコントロール群のいずれかが欠如している場合に,それを補う方略を導入しようとする点にある.
不等価コントロール群事前事後テストデザインの例
ジョンソン,バズ,マッケイ,そしてミラー〔Johnson,Budz, Mackay, & Miller, 1999〕は,心疾患で入院している患者の喫煙状態および喫煙の自己効力感に対する,ナースが行う禁煙介入の効果を評価した.
実験の対象者は,ある循環器病棟に入院し,比較の対象者は,別の病棟に入院した.
同じ病棟内の患者間で情報が共有されると,処理条件が汚染されるおそれがあるので,病棟内の無作為化のために,上記の方法を選んだ.事前データを収集することで,人口学的な特徴および介入前の喫煙歴に関して,両群が類似していることがわかった,
不等価コントロール群デザイン
もっともよくもちいられる準実験デザインは,不等価コントロール群事前事後テストデザイン(nonequivalent control group pretest-posttest design)である.
このデザインは,実験処理と,実施の前後に観察する2群の対象を含む.
たとえば,大都市の大病院で,プライマリー・ナーシングを導入した場合の,看護スタッフの士気に与える影響を研究するとしよう.
新しい看護ケア提供システムを病院全体で実施するので,無作為化は不可能である.
そのため,プライマリー・ナーシングをもちいていない類似の特徴をもった病院のナースから,比較データを収集することにする.
システム変更の前に両方の病院でスタッフの士気についてのデータを収集し(事前テスト),
新システムを前者の病院で行ったのちに再びデータを収集する(事後テスト).
実験(プライマリー・ナーシング)病院があり,従来の看護を行っている病院がある.
時系列デザイン
今述べたデザインでは,コントロール群は使われているが,無作為化はされていない,
しかし,介入のある研究には,コントロール詳も無作為化もないものもある.
ある病院が,そこで働くすべてのナースに,昇進や昇給の条件として一定数の継続教育の単位を修得させることを決めたとしよう.
ナース管理者が,この方針の結果を退職率,欠勤率,昇進者数と昇給者数などをもとに評価したいとする.
この例の目的にとっては,この研究のための比較に適した病院がほかに1つもないと仮定しよう.
そのような場合に比較できる唯一のものは,前後の対比である.その方針が1月に開始されたとすれば,たとえば,その新しい規則が実施される前の3か月間と,実施後の3か月間の退職率を比較できる.
この1群事前事後テストデザイン(one-group pretest-posttest design)は簡明にみえるが,弱点がある.
前後の3か月間のいずれかが,新しい規則にかかわらず,いつもと違うとしたら,どうなるか同じ期間中に開始された他の規則の影響はどうか.地域経済の変化のように,雇用決定に影響する外生因子の影響はどうか.この前実験デザインは,これらの因子をコントロールできない。
この1群事前事後テストデザインを修正して,ナースの退職率の変化について,少なくともいくつかの他の説明を排除できよう.
このようなデザインの1つが時系列デザイン(time series design)であり〔中断時系列デザイン(interrupted time series deign)ともいう〕.
時系列デザインでは,情報は長期にわたって収集され,その間,介入が導入される.
01〜04は,実験処理前の従属変数についての,4つの独立したデータ収集を例示している.
Xは,実験処理を示し(独立変数の導入),05〜08は,4つの実験処理後の観察を示している.
今の例でいえば,01は,新しい継続教育の規則が開始される前年の1月から3月にかけての,病院を退職したナースの数,02は4月から6月の退職者数,以下,同様である.
規則の施行後も05〜08を観察し,連続して4回の3か月間,退職に関するデータを同じように収集する.
時系列デザインでさえも,退職率の変化の解釈と,後者の図式では,対象が処理群に無作為割り付けされていないこと以外,互いに同一であることを示している.
「実験群と比較群が研究着手段階で等しいということを前提としていない」ので,より欠陥が多い.
無作為化がなされていないので,この研究は,実験研究というよりも準実験研究である.
それにもかかわらず,このデザインは強固である.
なぜなら,事前テストによって,当初の両群の士気が似ているかどうかを判断できるからである.
比較群と実験群が事前テストの段階で類似していれば,自己報告された士気における事後テストの差は,新しい看護ケアシステムによる結果であると,比較的に確信できる.
しかし,当初の2群の士気がとても異なった場合は,統計学的方法の助けがあるにせよ,事後テストの差の解釈はむずかしくなるだろう.
実験処理群の結果を評価する際に,比較の対象となるグループを指して,準実験では,コントロール群という代わりに,ふつう,比較群(comparison group)という用語をもちいる.
事前テストのデータを収集できなかったと仮定しよう.
2群の看護スタッフの当初の均等性については,もはや情報がない.
事後テストで,実験病院のスタッフの士気が,コントロール病院のスタッフの士気よりも低い場合,新しいケア提供方法が,スタッフの士気の低下をもたらしたと結論できるだろうか.事後テストの差については,他の説明ができよう.
とくに,2つの病院のにおける問題をすべて排除できるわけではないが,長期間にわたるとらえ方が,変化を介入に関連づけることを可能にする.
1年間に48人のナースが病院を退職した場合,年間を通じて毎月4人ずつ等間隔に退職するなどとは,誰も期待しないだろう.
実験処理の前後に1回だけしか観察しない,
退職者数は04と05のあいだ,すなわち新しい継続教育の規則が導入された直後に増加している.
しかし,パターンBの退職者数は06で降下し,07でも降下し続けている.
05での増加は,他の時期の退職率における偶然の変動と,どうやら類似しているようである.
それゆえ,新しい規則が退職に影響したと結論づけるのは,おそらく誤りであろう.
他方,パターンAでの退職者数は05で増加し,その後の観察でも比較的高いままで推移している.
もちろん,毎年の退職率の変化については,別の説明もできよう.
しかし,2つの時点のみでの退職率の測定でみられるような,データが不安定な測定値を示す可能性を,時系列デザインであれば排除できる.
パターンAとBの結果は,これらの2時点でみると,同様に見える.しかし,より長期間でとらえた場合,結果の2つのパターンについて,異なる結論を導き出せる.
時系列デザインの例
ナームとボストン〔Nahm & Poston, 2000〕は,時系列デザインを使って,事例の要点を統合したコンピュータシステムが,ナースの記録の質に与える影響を評価した.
介入前に,記録の質を測定した.
そして,施行後6か月,12か月,18か月後に再び測定した.
研究者は,看護記録の質が高まり,図式での変動が減ったことを見いだした.
時系列デザインと不等価コントロール群デザインを組み合わせた場合,とくに強力な準実験デザインとなる.
時系列不等価コントロール群デザイン(time series nonequivalent control group design)は,継続教育の規則を導入した病院とその規則を課していない他の病院の両者から,長期間にわたってデータを収集することになろう.
類似した特性をもつ他の病院からの情報をこのように使用することで,その規則の効果に関して,より説得力のあるなんらかの推論を行えるだろう.
なぜなら,外生因子によって影響された傾向は,おそらく両部で観察されるだろうからである.
関連記事