同期する擬似反復|【統計学・統計解析講義応用】
同期する擬似反復
擬似反復は,すぐには分からないような経路から生じることがある。
例を1つ見てみよう。
これは,生態学の文献で擬似反復が蔓延していることについて論評した記事から引いた例だ。
成長する草の若芽に含まれる化学物質が,かわいらしいふさふさの齧歯類の動物の繁殖期の始まりに影響するかを調べたいとする。
仮説は,草が春に発芽したときに,その齧歯類の動物がそれを食べて繁殖期を始めるというものだ。
このことを検証するために,動物を何匹か実験室に置いて,半分に通常の食事を,残りの半分にその草を混ぜた食事を与え,いつ繁殖の周期が始まるかが分かるまで待機することとしよう。
だが,待ってほしい。
ある論文を読んだことをぼんやりと思い出したのだ。
その論文では,フェロモンがどうこうすることで群れで生活する哺乳類の繁殖周期が同期する可能性があることが示されていた。
となれば,実際は,各グループで個々の動物は互いに独立しているわけではない。
結局,みな同じ研究室にいるのだから,同じフェロモンにさらされている。
そして,1匹が発情期に入れば,何を食べてきたかに関係なく,そのフェロモンによって他の動物も続いて発情期に入ることになる。
標本の大きさは実質的には1なのだ。
思い出した研究とは,マーサ・マクリントックが「ネイチャー」に発表した1970年代初めの有名な論文のことだ。
この論文では,緊密に接触して生活すれば,女性の月経周期が同期するということが示されている。
他のいくつかの研究によって,ゴールデンハムスター,ドブネズミ,チンパンジーにも似たような結果が見いだされている。
これらの結果は,同期が擬似反復を引き起こす可能性があることを示すように見える。
すばらしい。
それでは,このことは,齧歯類の動物を互いに隔離するために,フェロモンを防ぐカゴを作らなければならないということを意味するのだろうか。
必ずしもそうではない。
生理や発情の周期が同期することをどうやって証明するのかと思う人もいるだろう。
そう,結局のところ,できないのだ。
さまざまな動物で同期を「証明」した研究は,それ自体が狡猾な方法で擬似反復されたものなのだ。
マクリントックは人間の生理周期をこんな感じで研究した。
1.学生寮に住む大学生のように,緊密な接触のある生活をしている女性のグループを見つける。
2.おおよそ1か月ごとに,個々の女性に前の月経期がいつ始まったかを問い,ほとんどの時間を一緒に過ごした他の女性の名前を挙げてもらう。
3.こうやって挙げられたものを使って,女性たちを,一緒に時間を過ごす傾向にあるグループに分ける。
4.各グループについて,女性の月経期が始まる日付の平均からのずれの平均がどれくらいかを見る。
ずれが小さいことは,女性の周期が,すべてほぼ同じ時期に始まるという点で,そろっていることを意味するだろう。
そして,研究者は,ずれが時間が経つにつれて減るかを調べた。
時間が経つにつれて減るということは,女性たちの同期を示すことになるだろう。
このことのために,研究者は研究期間の5つの異なる時点において,ずれの平均を確認し,ずれが偶然で予想される以上に減ったかを検定した。
不運にも,使用された統計的検定は,同期がない場合にずれがランダムに月経期ごとに増加または減少することを仮定するものだった。
ここで,周期がそろった状態で始まった2人の女性が研究対象になっていたとしよう。
1人目の期と期の間の幅は平均28日で,2人目は30日だとする。2人の周期は研究が進むにつれてー貫して離れて行くだろう。
月経期は時期が完璧に決まっているわけではないために若干のランダムな変動こそあるが,最初は2日,次は4日といった形で徐々に離れていくのだ。
同様に,2人の女性の月経期がそろっていない状態から始まって,だんだんとそろっていくこともある。
比較のために,以下の例を考えてみよう。
渋滞に遭遇したことがあれば,異なるペースで明滅する2つの信号がだんだんと同期し,その後だんだんとずれていくのを見たことがあるかもしれない。
もし交差点で動けない時間が十分に長ければ,こうしたことが起きるのを何度も見るはずだ。
だが,私の知るかぎり,信号にフェロモンなんてものはない。
だから,2人の月経周期が実際にはそろっていなかったとしても,少なくとも一時的にそろうことがあることを予期することができる。
研究者は,統計的検定においてこの効果を説明することに失敗したのだ。
しかも,研究の始まりにおける同期の計算で誤りを犯していた。
もし,ある女性の月経期が研究開始の4日前に始まり,別の女性の月経期が研究開始の4日後に始まっていたとしたら,その差は8日しかない。
しかし,研究開始前の月経期は計算に入れられていなかったため,記録された差は,4日目と前者の女性の次の月経期であるおよそ3週間後との間の差になったのだ。
これら2つの誤りが合わさったことにより,たとえフェロモンによる同期現象が存在しなくても,くだんの科学者は統計的に有意な結果を得ることができたのだ。
さらなる月経周期の間に被験者を追跡することによって研究者が追加で得たデータ点は,同期の証拠をまったく提供しなかった。ここでは,単に,フェロモンに関係なく同期が偶然起きたという証拠が得られたのみだった。
統計的仮説検定が,科学者が問おうとしていたこととは異なる問題を扱っていたのだ。
同様の問題は,小さなふさふさの哺乳類やチンパンジーが発情周期を同期させていると主張する研究にも存在している。
統計的な手法を正して実施されたその後の研究は,発情周期や月経周期の同期に関する証拠を見つけることにまったく成功していない(ただ,これは議論の余地がある)。
ここでは,擬似反復された研究を信じたことにより,齧歯類の実験が擬似反復をおかしているかもしれないと考えただけだ。
なお,もし,友だちが月経期の同期について不満を漏らしたとしても,その友だちを馬鹿にしないでほしい。
もし,1回の周期が平均して28日続くのならば,普通の2人の女性の月経期の差は長くても14日になる(もし月経期が友だちの20日後に始まったとしたら,それは友だちの次の月経期の8日前に始まったことになる)。
これは最大値だ。
そして,平均は7日になるだろう。
さらに,月経期は5日から7日の間続きうるから,時を経るにつれて周期がそろっていくにせよ,離れていくにせよ,2人の月経期が重複することはしばしばあるだろう。
統計分析が,研究で解明したいことに本当に答えられるようにしよう。
追加して測定されたものが,先立つデータに強く依存するようなものならば,結果がより大きな集団に一般化できることは立証されない。
こうした追加の測定をしても,研究対象となった特定の標本についての確実さが増すだけだ。
測定したものの間で強い依存関係があることを説明するために,階層モデルやクラスター標準誤差といった統計的な手法を使おう。
変数の間の相関を生じさせるような隠れた原因を打ち消すように実験を計画しよう。
もしそれが不可能ならば,交絡因子を統計的に調整できるように,そうした因子について記録しよう。
もし最初から依存関係を考慮することがなければ,データを敘う方法は見つけられなくなるかもしれない。
関連記事