擬似反復と同期現象:統計誤りの真相【ChatGPT統計解析】
擬似反復は、実験対象が独立していない場合に統計的誤りを生む可能性があり、例えば動物の繁殖周期に影響を与えるフェロモンが例として挙げられる。マーサ・マクリントックの1970年代の研究では、共同生活する女性の月経周期が同期することが示されたが、その統計検定は誤りを含んでいた。研究開始前の差の記録の欠如や仮定の間違いで、無意識に有意な結果が得られたことがわかった。同期は自然のランダム変動によって起きることもあるため、統計的な方法を正しく設計しなければ、真の原因を誤解する恐れがある。後続の研究では、同期に関する証拠は見つかっていない。結果を一般化するためには、階層モデルやクラスター標準誤差を用いるなど、変数間の相関に対応する方法が求められる。隠れた原因を排除するような計画がないとデータ解析が難しくなる。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
同期する擬似反復
擬似反復は,すぐには分からないような経路から生じることがある。
例を1つ見てみよう。
これは,生態学の文献で擬似反復が蔓延していることについて論評した記事から引いた例だ。
成長する草の若芽に含まれる化学物質が,かわいらしいふさふさの齧歯類の動物の繁殖期の始まりに影響するかを調べたいとする。
仮説は,草が春に発芽したときに,その齧歯類の動物がそれを食べて繁殖期を始めるというものだ。
このことを検証するために,動物を何匹か実験室に置いて,半分に通常の食事を,残りの半分にその草を混ぜた食事を与え,いつ繁殖の周期が始まるかが分かるまで待機することとしよう。
だが,待ってほしい。
ある論文を読んだことをぼんやりと思い出したのだ。
その論文では,フェロモンがどうこうすることで群れで生活する哺乳類の繁殖周期が同期する可能性があることが示されていた。
となれば,実際は,各グループで個々の動物は互いに独立しているわけではない。
結局,みな同じ研究室にいるのだから,同じフェロモンにさらされている。
そして,1匹が発情期に入れば,何を食べてきたかに関係なく,そのフェロモンによって他の動物も続いて発情期に入ることになる。
標本の大きさは実質的には1なのだ。
思い出した研究とは,マーサ・マクリントックが「ネイチャー」に発表した1970年代初めの有名な論文のことだ。
この論文では,緊密に接触して生活すれば,女性の月経周期が同期するということが示されている。
他のいくつかの研究によって,ゴールデンハムスター,ドブネズミ,チンパンジーにも似たような結果が見いだされている。
これらの結果は,同期が擬似反復を引き起こす可能性があることを示すように見える。
すばらしい。
それでは,このことは,齧歯類の動物を互いに隔離するために,フェロモンを防ぐカゴを作らなければならないということを意味するのだろうか。
必ずしもそうではない。
生理や発情の周期が同期することをどうやって証明するのかと思う人もいるだろう。
そう,結局のところ,できないのだ。
さまざまな動物で同期を「証明」した研究は,それ自体が狡猾な方法で擬似反復されたものなのだ。
マクリントックは人間の生理周期をこんな感じで研究した。
1.学生寮に住む大学生のように,緊密な接触のある生活をしている女性のグループを見つける。
2.おおよそ1か月ごとに,個々の女性に前の月経期がいつ始まったかを問い,ほとんどの時間を一緒に過ごした他の女性の名前を挙げてもらう。
3.こうやって挙げられたものを使って,女性たちを,一緒に時間を過ごす傾向にあるグループに分ける。
4.各グループについて,女性の月経期が始まる日付の平均からのずれの平均がどれくらいかを見る。
ずれが小さいことは,女性の周期が,すべてほぼ同じ時期に始まるという点で,そろっていることを意味するだろう。
そして,研究者は,ずれが時間が経つにつれて減るかを調べた。
時間が経つにつれて減るということは,女性たちの同期を示すことになるだろう。
このことのために,研究者は研究期間の5つの異なる時点において,ずれの平均を確認し,ずれが偶然で予想される以上に減ったかを検定した。
不運にも,使用された統計的検定は,同期がない場合にずれがランダムに月経期ごとに増加または減少することを仮定するものだった。
ここで,周期がそろった状態で始まった2人の女性が研究対象になっていたとしよう。
1人目の期と期の間の幅は平均28日で,2人目は30日だとする。2人の周期は研究が進むにつれてー貫して離れて行くだろう。
月経期は時期が完璧に決まっているわけではないために若干のランダムな変動こそあるが,最初は2日,次は4日といった形で徐々に離れていくのだ。
同様に,2人の女性の月経期がそろっていない状態から始まって,だんだんとそろっていくこともある。
比較のために,以下の例を考えてみよう。
渋滞に遭遇したことがあれば,異なるペースで明滅する2つの信号がだんだんと同期し,その後だんだんとずれていくのを見たことがあるかもしれない。
もし交差点で動けない時間が十分に長ければ,こうしたことが起きるのを何度も見るはずだ。
だが,私の知るかぎり,信号にフェロモンなんてものはない。
だから,2人の月経周期が実際にはそろっていなかったとしても,少なくとも一時的にそろうことがあることを予期することができる。
研究者は,統計的検定においてこの効果を説明することに失敗したのだ。
しかも,研究の始まりにおける同期の計算で誤りを犯していた。
もし,ある女性の月経期が研究開始の4日前に始まり,別の女性の月経期が研究開始の4日後に始まっていたとしたら,その差は8日しかない。
しかし,研究開始前の月経期は計算に入れられていなかったため,記録された差は,4日目と前者の女性の次の月経期であるおよそ3週間後との間の差になったのだ。
これら2つの誤りが合わさったことにより,たとえフェロモンによる同期現象が存在しなくても,くだんの科学者は統計的に有意な結果を得ることができたのだ。
さらなる月経周期の間に被験者を追跡することによって研究者が追加で得たデータ点は,同期の証拠をまったく提供しなかった。ここでは,単に,フェロモンに関係なく同期が偶然起きたという証拠が得られたのみだった。
統計的仮説検定が,科学者が問おうとしていたこととは異なる問題を扱っていたのだ。
同様の問題は,小さなふさふさの哺乳類やチンパンジーが発情周期を同期させていると主張する研究にも存在している。
統計的な手法を正して実施されたその後の研究は,発情周期や月経周期の同期に関する証拠を見つけることにまったく成功していない(ただ,これは議論の余地がある)。
ここでは,擬似反復された研究を信じたことにより,齧歯類の実験が擬似反復をおかしているかもしれないと考えただけだ。
なお,もし,友だちが月経期の同期について不満を漏らしたとしても,その友だちを馬鹿にしないでほしい。
もし,1回の周期が平均して28日続くのならば,普通の2人の女性の月経期の差は長くても14日になる(もし月経期が友だちの20日後に始まったとしたら,それは友だちの次の月経期の8日前に始まったことになる)。
これは最大値だ。
そして,平均は7日になるだろう。
さらに,月経期は5日から7日の間続きうるから,時を経るにつれて周期がそろっていくにせよ,離れていくにせよ,2人の月経期が重複することはしばしばあるだろう。
統計分析が,研究で解明したいことに本当に答えられるようにしよう。
追加して測定されたものが,先立つデータに強く依存するようなものならば,結果がより大きな集団に一般化できることは立証されない。
こうした追加の測定をしても,研究対象となった特定の標本についての確実さが増すだけだ。
測定したものの間で強い依存関係があることを説明するために,階層モデルやクラスター標準誤差といった統計的な手法を使おう。
変数の間の相関を生じさせるような隠れた原因を打ち消すように実験を計画しよう。
もしそれが不可能ならば,交絡因子を統計的に調整できるように,そうした因子について記録しよう。
もし最初から依存関係を考慮することがなければ,データを敘う方法は見つけられなくなるかもしれない。
擬似反復は実験においてしばしば見逃されがちな問題であり、統計的な誤りを引き起こしやすい。これは特に被験者や試料が互いに独立していない場合に生じ、結果として有意義ではない誤解を招く可能性がある。例えば、生態学における研究で示されるように、動物の繁殖周期に影響を与えると考えられるフェロモンが、実験環境において擬似反復を引き起こすケースがある。具体的な例として、成長する草の若芽に含まれる化学物質が、小型の齧歯類の繁殖期にどのように影響するかを調べる研究がある。この仮説では、草が春に発芽し、その草を齧歯類が食べることで繁殖期が始まるとされている。実験では、動物を複数のグループに分けて、通常の食事と草を混ぜた食事を与え、その結果を観察する方法が考えられるが、ここで問題が生じる。動物が同じ研究室にいる限り、フェロモンの影響を受けて同期する可能性がある。したがって、各グループの個体は本質的に独立しておらず、同じ環境で影響を共有している。これにより、結果として得られるデータは本来の仮説に基づく独立した結果ではなく、擬似反復によって生じたものであることがある。このような擬似反復が実験結果に与える影響を過小評価してはいけない。擬似反復はデータ分析の信頼性を損なう要因であり、標本の実際の大きさを過大に見積もる結果を生む。結果として、誤った結論に導かれることがあり、統計的に有意な結果が得られても、その意義は疑わしいものになる可能性がある。マーサ・マクリントックの1970年代初頭に発表された研究がこの問題を示している。この研究では、共同生活する女性たちの月経周期が同期することが示された。しかし、その後の分析によって、この研究には統計的な誤りが含まれていることがわかった。この研究で用いられた統計的検定は、同期がない場合に月経周期の差がランダムに増減することを前提としていたが、これは誤りであった。さらに、研究開始前の差を考慮しないことによって、実際には存在しない同期が統計的に有意と見なされる結果になってしまった。具体的には、研究開始前に女性の月経周期が既に同期していた場合、その差が小さく計算されてしまうという問題があった。これにより、実際には同期現象が存在しなくても、有意な結果が得られる可能性がある。このような誤りを防ぐためには、階層モデルやクラスター標準誤差を用いることが重要である。これらの手法は、変数間の依存関係を考慮に入れて分析を行うことができる。擬似反復による誤りを回避するためには、実験計画において隠れた要因を排除することが求められる。例えば、動物実験でフェロモンの影響を排除するためには、動物を互いに隔離し、独立した環境で実験を行う必要がある。さらに、変数間に強い依存関係がある場合は、統計的な方法を用いてその影響を調整することが求められる。これには、階層的な分析やクラスター標準誤差を使うことで、より正確な結果を得ることができる。また、比較として信号機の同期現象を考えることができる。例えば、渋滞で異なるペースで明滅する信号が、ある時期に同期し、その後またずれていくことがある。これは偶然の一致であり、決してフェロモンなどの外部要因が関与しているわけではない。同様に、2人の女性の月経周期が一時的に同期しているように見える場合も、偶然であることが多い。この現象を統計的に適切に解釈しなければ、誤った結論を引き出すことになるだろう。後に行われた多くの研究が示すように、統計的手法を正して実施した場合、発情周期や月経周期の同期に関する証拠を見つけることは非常に難しい。実際に、実験においてデータを追加して収集する場合、そのデータが先立つデータに依存していることを考慮しなければ、結果はより大きな集団への一般化に失敗する可能性がある。統計分析が、研究者が意図した疑問に正確に答えられるように設計されていなければならない。追加されたデータが既存の結果に大きく依存する場合、これは特定の標本の中での確実さを高めるだけであり、広範な結論にはつながらない。これを避けるためには、実験の段階で交絡因子を記録し、それを統計的に調整できるようにしておくことが重要である。もしこのような準備がないと、データを解析する際に正確な因果関係を見つけることが難しくなる。研究者は、変数間に生じる相関を理解するために、実験計画を慎重に立てる必要がある。こうした手順を省略すると、研究の結論に疑問が生じることになる。データの収集方法や解析の方法が、研究の結果を左右する大きな要素であることを忘れてはならない。特に、擬似反復のような誤りが実験結果をゆがめる可能性がある場合、これに対処するための適切な実験計画や統計的な手法を用いることが不可欠である。
関連記事