公刊の偏りと検定力の不一致に迫る真実【ChatGPT統計解析】
公刊の偏りや結果報告の偏りを調べることは可能であり、系統的再調査によって効果量の推定や検定力の測定が行われる。例えば、効果量が0.8の研究において、小規模な研究の検定力が0.2である場合、効果検出率は20%となるが、90%以上の公刊研究が効果を検出できている事例が示されることがある。未報告研究は捨てられることが多く、この偏りは神経学研究や心理学においても見られる。2011年のダロル・ベムの研究では、未来予測能力を主張する内容が査読付き誌に掲載されたが、懐疑的反応を受け、その後の論文で誤りや別の手法が示された。グレゴリー・フランシスはベムの成功率と検定力の不一致から公刊の偏りを指摘し、他の心理学研究にも同様の批判を行った。心理学界では今も公刊の偏りの影響について議論が続いている。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
報告の偏りの検出
公刊の偏りや結果報告の偏りについて調べることは可能だ。
あるテーマに対して一連の研究が行われていて,なおかつ系統的再調査が公刊されたデータから効果量を推定していれば,再調査の対象となった個別の研究の検定力は簡単に求めることができる。
例えば,効果量が何か適当な尺度で0.8だったとしよう。
ただ,再調査は,それぞれの検定力が0.2だった小規模な研究をたくさん集めて構成されたものだったとしよう。
ここから,効果を検出することができる研究は20%しかないということになるはずだ。
しかし,公刊された研究の90%以上が効果を検出できていることが発覚するかもしれない。
検出できなかった残りはくずかごに放りこまれたのだ。
この種の試験手法は,動物実験をともなう神経学研究の刊行物での気がかりな偏りを発見するために使われてきた。
動物実験は,それが科学と医学の発展の利益になるという理由があるからこそ倫理的に正当化されるものだ。
しかし,強い結果報告の偏りがあるという証拠は,公刊されないまま科学の記録として何も残さなかった研究で,多くの動物が使われたことを暗示している。
同種の試験手法が,心理学の有名な論争で使われたことがある。
ダロル・ベムの2011年の研究で,「認知と情動に対する異常な逆行作用」,要するに,未来を超能力で予測することに関する証拠があるという主張がなされた。
これは査読を経て評判の良い学術誌に掲載されたのだが,予想どおり,掲載されてすぐに懐疑的な科学者から否定的な反応を受けた。
その後のいくつかの論文でベムの分析の誤りが示され,より合理的な結果が得られる別の統計手法も示された。
これらの論文の中には,ここで紹介するには技術的に細かすぎるものもあるが,1つは直接的な関連性があるものだ。
グレゴリー・フランシスは,ベムが公刊の偏りによって良い結果を得たのだろうかと考えた。
ベムは,自身の発見がすぐに信じられることはないだろうということを知っていたので,1個だけでなく10個の異なった実験を同じ研究の中で実施し,それを公刊していた。そのうち9つの実験で,統計的に有意な超能力が見られた。
これは強力な証拠のように見える。
ただし,これも超能力が見られなかった研究で未報告のものがたくさんなけれぱの話だ。
フランシスは,ベムの成功率がその検定力に合っていないことを発見した。
つまり,ベムの研究は,公刊の偏りがもたらしたものであって,超能力の産物ではなかったのだ。
フランシスは,類似した論文を多数公刊し,他の心理学の有名な研究を明確な公刊の偏りによるものだと批判した。
おそらく,フランシスは心理学の文献を底引き網のように拾いあげ,公刊の偏りの証拠を見つけるまで論文を調べていたのだろう。
これは誰かがその皮肉に気づくまで続いた。
心理学の文献では,公刊の偏りに関する公刊の公刊の偏りの影響についての議論が今なお激しく交わされている。
公刊の偏りや結果報告の偏りを調査することは、科学的な研究において重要な手続きである。あるテーマに関して行われた一連の研究があり、系統的再調査が行われ、効果量が公刊されたデータから推定される場合、その再調査の対象となる個別の研究の検定力を算出することが可能である。例えば、あるテーマにおいて効果量が0.8といった適当な尺度で評価される場合を考えてみると、これは中程度から大きな効果を示しているとみなされる。しかし、再調査が小規模な研究を複数集めて行われ、その各研究の検定力が0.2であると仮定すると、統計的に有意な効果を検出できる確率はわずか20%にすぎないということになる。この場合、効果を検出できる研究は全体の20%のみということになるが、公刊される研究のうち90%以上が有意な結果を示していることが発覚する事例も多く見られる。この状況は、統計的な結果報告の偏りが存在していることを強く示唆する。つまり、検出されなかった研究結果は報告されず、捨てられてしまう、いわゆる「くずかご効果」と呼ばれる現象がある。こうした偏りは、特定の研究分野において特に深刻であり、例えば動物実験を伴う神経学研究では、報告の偏りが問題視されてきた。動物実験は科学と医学の発展のために行われるものであり、倫理的な正当化は必須である。しかし、強い結果報告の偏りがあるという証拠は、公刊されなかった研究において多くの動物が無駄に使われたことを暗示している。この種の問題は心理学分野でも見られ、心理学における有名な論争においても検証されている。例えば、2011年にダロル・ベムが発表した研究は、「認知と情動に対する異常な逆行作用」、すなわち未来を超能力で予測できることを示唆するものであった。この研究は査読を経て評判の良い学術誌に掲載されたが、その内容はすぐに懐疑的な科学者たちの間で議論を巻き起こし、否定的な反応を受けた。ベムの研究が提示したデータは一見すると説得力があり、彼は1つの研究だけではなく10個の異なる実験を同一の研究に含め、そのうち9つで統計的に有意な結果を得たと報告していた。これは非常に強力な証拠であるかのように見えたが、同時に未報告の失敗実験が存在していた可能性が指摘された。グレゴリー・フランシスは、ベムの成功率がその検定力に照らして異常に高いことに気づき、これが公刊の偏りによるものではないかと指摘した。フランシスはさらに、他の心理学の研究においても同様の公刊の偏りが存在することを示し、多数の論文で公刊の偏りを批判し続けた。公刊の偏りは、特に実験の結果が期待される方向に偏っている場合に顕著となりやすく、研究の客観性を損ねる要因となる。フランシスの分析は、単に一つの研究だけではなく、広範な分野での偏りを明らかにしようとするもので、心理学界においても大きな議論を呼んだ。公刊の偏りに関する調査は、科学の透明性と再現可能性を高めるために重要である。ベムの研究はその後、いくつかの論文で分析の誤りが指摘され、より合理的な結果を得るための別の統計手法も提案された。これらの論文の中には非常に技術的なものもあり、その内容は専門的すぎて一般には理解されにくいものであったが、フランシスの指摘は心理学の研究における公刊の偏りの問題を再確認するものとなった。さらに、フランシスは心理学の文献全体を対象に、隠された公刊の偏りの証拠を網羅的に調査し、証拠が見つかるまで続けた。彼の方法は、心理学における底引き網のように文献を掘り起こし、次々と公刊の偏りを証明するというものであった。しかし、こうした研究手法は一部の研究者から皮肉をもって受け止められ、「公刊の偏りに関する公刊の偏りの影響についての議論」として批判の対象ともなった。心理学界では現在もなお、公刊の偏りとその影響についての議論が激しく交わされ続けている。結果報告の偏りが存在すると、科学的な結論は実際よりも強調され、誤った解釈が生じることがあるため、この問題は単なる学術的な関心に留まらない。公刊の偏りは、研究資金の分配や政策決定にも影響を与える可能性があるため、研究者はその存在を認識し、適切な方法で対策を講じることが求められる。
関連記事