再現性確保の実験とデータ分析戦略【ChatGPT統計解析】
再現性のための実験とデータ分析において、繰り返し実験は誤りを排除し、信頼性を高めるために重要である。科学者が他の研究を慎重に再現し新しいデータを検証することで、誤った結果や偶発的な偽陽性を除去しやすくなる。再現は科学の心髄とされるが、複雑な結果の再現は時間がかかり、自身の研究結果を再利用する際にのみ行われることが多い。心理学における再現性プロジェクトや製薬会社の試験結果は、多くの研究が再現性に耐えないことを示し、重要な研究でも誤りが潜んでいる可能性がある。分析プログラムはスプレッドシートやスクリプトを使って自動化し、コード参照や自動化テストによる検証が推奨される。計算機を使用した再現可能な研究の10個の簡単な規則やツールを用いて、データを公開し論文に含めることが望まれる。多くの学術誌は補足資料としてソースコードの公開を求めており、ドライアドやフィグシェアといったリポジトリに預けることも可能である。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
実験して繰り返す
他の解決手法としては繰り返しによる再現(replication)が挙げられるだろう。
もし科学者が何もないところから慎重に他の科学者の実験を再度作りあげれば,つまり,完全に新しいデータを集め,その結果を検証するという時間がかかる上に骨の折れる過程を経るのであれば,誤った結果を引き起こす誤字の可能性を排除することがずっと簡単になるだろう。
問題となっている効果を検出するのに十分な検定力があるようにしていれば,再現によって幸運な偽陽性も排除することができる。
多くの科学者が,実験の再現は科学の心髄だと主張している。
独立に調査され,世界中で再調査され,筋が通っていると分かるまで,新しい考えは受け入れられないのだ。
このことは完全に正しいわけではない。
再現はそれ自体を目的として行われることがほとんどない(ただしある種の分野を除く一物理学者は物理定数の測定をどんどん精確なものにするのが大好きだ)。
複雑な結果を再現することは何か月もかかるため,通常,研究者が自分自身の過去の結果を使う必要があるときにしか再現は行われない。
そうでなければ,再現が公刊する価値があるものだと考えられることはほとんどない。
珍しい例外として,多くの重要な結果が再現を耐え抜けないかもしれないという心理学者の中で増大する懸念から生まれた再現性プロジェクト(Reproducibility Project)というものがある。
これは心理学者の大規模な協同によって行われていて,重要な心理学誌の論文の内容を着実に再試験しつづけている。
予備段階の結果は,ほとんどの結果が新しい試験で再現されたという明るい見通しのものだった。
だが,まだ前途は遠い。
他の事例として,製薬会社のアムジェンのガン研究者たちがガン研究における53個の画期的な前臨床研究について再試験を実施したことがある(「前臨床」という言葉は,新しくて未証明の考えを試験しているために,人間の患者が関わらなかった研究だということを示している)。
原論文の著者と協力したにもかかわらず,アムジェンの研究者は,研究のうち6個しか再現できなかった。
バイエルの研究者は、公刊された論文で見つかった新しい薬として使える可能性がある薬の試験をした際に,同様の困難を報告している。
これはやっかいだ。
この傾向はあまり理論的でないような医学研究にも当てはまるだろうか。
どうやらそうらしい。
医学で最も引用されている研究論文の4分の1が公刊後に再試験がなされていないままだし,後の研究で3分の1が誇張されたものか誤っているものだったことが分かっている。
これはアムジェンの結果ほど極端ではないが,重要な研究の中にどんな誤りが気づかれないまま潜んでいるのだろうかという疑いを持たせることだろう。
再現は期待されているほど広く行われていないし,その結果はいつも好都合なものだとは限らないのだ。
データ分析は,既知の入力に対してテストができるスプレッドシート・分析スクリプト・プログラムを使って自動化しよう。
もし誰かがエラーを疑った場合,何をまさに実施したのかが分かるように自分のコードを参照できるようにすべきだ。
既知の入力に対してすべての分析プログラムをテストし,結果が意味の通るものになるか確認しよう。
自分かエラーを招き入れていないということを保証するために,自分で変更した場合は,コードを確かめる自動化テストを使うのが理想だ。
ソフトウェアを書くときは,科学における計算機使用についての最良の実践に従おう。
データを分析するためにプログラムやスクリプトを使っている場合,「計算機を使用した再現可能な研究のための10個の簡単な規則」(Ten Simple Rules for Reproducible Computational Research)に従おう。
分析からのデータを自動的に論文に含められるようにするため, Sweaveのような再現可能な研究のためのツールを使おう。
可能であれば,ジェンバンクやタンパク質構造データバンク(PDB)といった専門のデータベース,あるいはドライアドやフィグシェアといった一般的なデータリポジトリから、すべてのデータを入手できるようにしておこう。
ソフトウェアのソースコード,スプレッドシート,分析スクリプトなどを公開しよう。
多くの学術誌では,こうしたものを論文の補充資料として提出させている。
あるいは,ドライアドやフィグシェアにこうしたファイルを預けることもできる。
再現性を重視した実験とデータ分析において、繰り返し実験は研究の信頼性を高め、誤りを排除するために極めて重要な手段である。科学における再現性とは、他の科学者や自分自身が行った実験を新たに再現し、その結果が元の研究と同じ結論を導くかどうかを確認する過程である。この手法により、偶然やバイアスによる誤った結果や、データに基づく誤字や分析上のミスのリスクを排除できる。科学者が全く新しいデータを集めて実験を再現する過程は時間がかかり、骨の折れるものであるが、このようなアプローチによって誤った結果の排除が促進され、研究の健全性が保たれる。繰り返し実験には、研究結果が一度の試行による幸運な偽陽性や、研究デザインに潜む不具合によって誤って示された効果を排除する役割もあるため、信頼性の高い結論を得るために必須である。実験の再現は、多くの科学者が科学の中心的な要素と見なしているが、実際には多くの分野で再現が主目的として行われることは少ない。特に、物理学のような特定の分野では例外的に再現実験が精度を高めるために行われることが多いものの、多くの研究者にとっては、再現性の検証が行われるのは、研究者が自身の過去のデータや結果を使用する必要があるときに限られることが一般的である。複雑な結果を再現するためには数か月を要し、時間とリソースの制約から再現性のための努力が十分に行われないことも多い。そのため、再現の価値が科学界で十分に認識されていないことが課題とされている。これに関連して、心理学の分野では、重要な研究結果の再現性に疑問が投げかけられることが増えており、この懸念が心理学者の協力による再現性プロジェクトという取り組みを生み出した。再現性プロジェクトは、著名な心理学誌に掲載された論文を再試験する試みであり、その結果は、多くの研究が新たな試験においても再現されるかを検証し、研究の信憑性を評価するものである。初期段階の成果は多くが再現されており、比較的良好な結果を示していたが、依然として未解決の課題は多く、まだ道のりは長い。同様の試みとして、製薬会社のアムジェンは、がん研究における53件の前臨床研究を再試験し、そのうちわずか6件しか再現できなかったことを報告している。「前臨床研究」とは、人間の患者が関与しない初期段階の試験を指し、これらの試験は新しい概念を試すものである。アムジェンの研究者は、原論文の著者と協力してもなお、十分な再現性を得ることが難しかったと報告している。バイエルの研究者もまた、新薬候補として公刊された論文の試験を行った際に類似の問題に直面しており、多くの場合、論文の結果をそのまま再現することが困難であることを指摘している。このような再現性に関する問題は、理論的でない医学研究にも影響を及ぼしているようである。医学においては、最も引用されている研究の約4分の1が再試験を受けておらず、後の研究で3分の1が誇張されたものであったり、誤っていたことが判明している。この事実はアムジェンのケースほど極端ではないものの、重要な研究の中にも発見されないままの誤りが潜んでいる可能性があることを示唆している。再現は科学研究において期待されるほど一般的には行われていないし、その結果が必ずしも研究者にとって好ましいものではないこともある。データ分析においては、スプレッドシートや分析スクリプト、プログラムを用いて自動化することが重要である。これにより、既知の入力に対してテストができ、コードのエラーや分析の誤りを早期に発見しやすくなる。もし誰かが結果のエラーを疑った場合に備えて、実際にどのようなプロセスを実行したのかを明確にするために、自分のコードを参照できるようにすべきである。既知の入力に対してすべての分析プログラムをテストし、結果が意味のあるものになるかどうか確認することで、意図しないエラーの混入を防ぐことができる。自身のコードに変更を加えた場合は、変更後に正しい結果を得られることを保証するために、コードを検証するための自動化テストを実行することが理想的である。さらに、ソフトウェアを書く際には科学における計算機使用のベストプラクティスに従うことが推奨される。データを分析する際にプログラムやスクリプトを用いる場合、「計算機を使用した再現可能な研究のための10個の簡単な規則」に従うことで、より一貫性のある研究が可能になる。これには、データとその分析過程を明確にすること、また自動的に論文にデータを含められるようにするために、SweaveやR Markdownのようなツールを使用することが含まれる。これらのツールは、コードとデータ分析を一つのドキュメントにまとめることで、再現性の高い研究を実現しやすくする。加えて、可能であれば、ジェンバンクやPDB(タンパク質構造データバンク)などの専門的なデータベース、あるいはドライアドやフィグシェアのような一般的なデータリポジトリからすべてのデータを入手可能にしておくべきである。データのオープンアクセスは、他の研究者が研究を再現しやすくし、研究の透明性と信頼性を高める。ソフトウェアのソースコード、スプレッドシート、分析スクリプトなどを公開することも重要で、多くの学術誌が論文の補足資料としてこれらのファイルの提出を求めている。研究者は、自身の分析過程を公開することで他者が研究を再現しやすくし、結果の検証を可能にする。ドライアドやフィグシェアのようなデータリポジトリにファイルを預けることで、研究データの保存と共有がさらに容易になる。このような努力は研究の信頼性を高め、科学の発展に貢献する。さらに、再現可能性を確保するためには、データと分析手法に関する透明性を確保することが求められる。研究者は、使用するデータセットの詳細や、どのようにしてそのデータを収集し、分析したのかについて明確に記述することが重要である。研究の透明性を高めるために、使用した統計手法や計算手法の記録もまた重要である。これは、他の研究者が結果を再現しやすくし、結果の信頼性を向上させることに寄与する。さらに、再現性を高めるためのもう一つの手段として、ピアレビューの質を向上させることが挙げられる。ピアレビューは、研究結果の妥当性を事前に確認するプロセスであり、再現可能性に対する意識を高めるための機会でもある。レビューアーは研究手法や分析の詳細に焦点を当て、再現性の観点から評価することが求められる。
関連記事