実験して繰り返す|【統計学・統計解析講義応用】
実験して繰り返す
他の解決手法としては繰り返しによる再現(replication)が挙げられるだろう。
もし科学者が何もないところから慎重に他の科学者の実験を再度作りあげれば,つまり,完全に新しいデータを集め,その結果を検証するという時間がかかる上に骨の折れる過程を経るのであれば,誤った結果を引き起こす誤字の可能性を排除することがずっと簡単になるだろう。
問題となっている効果を検出するのに十分な検定力があるようにしていれば,再現によって幸運な偽陽性も排除することができる。
多くの科学者が,実験の再現は科学の心髄だと主張している。
独立に調査され,世界中で再調査され,筋が通っていると分かるまで,新しい考えは受け入れられないのだ。
このことは完全に正しいわけではない。
再現はそれ自体を目的として行われることがほとんどない(ただしある種の分野を除く一物理学者は物理定数の測定をどんどん精確なものにするのが大好きだ)。
複雑な結果を再現することは何か月もかかるため,通常,研究者が自分自身の過去の結果を使う必要があるときにしか再現は行われない。
そうでなければ,再現が公刊する価値があるものだと考えられることはほとんどない。
珍しい例外として,多くの重要な結果が再現を耐え抜けないかもしれないという心理学者の中で増大する懸念から生まれた再現性プロジェクト(Reproducibility Project)というものがある。
これは心理学者の大規模な協同によって行われていて,重要な心理学誌の論文の内容を着実に再試験しつづけている。
予備段階の結果は,ほとんどの結果が新しい試験で再現されたという明るい見通しのものだった。
だが,まだ前途は遠い。
他の事例として,製薬会社のアムジェンのガン研究者たちがガン研究における53個の画期的な前臨床研究について再試験を実施したことがある(「前臨床」という言葉は,新しくて未証明の考えを試験しているために,人間の患者が関わらなかった研究だということを示している)。
原論文の著者と協力したにもかかわらず,アムジェンの研究者は,研究のうち6個しか再現できなかった。
バイエルの研究者は、公刊された論文で見つかった新しい薬として使える可能性がある薬の試験をした際に,同様の困難を報告している。
これはやっかいだ。
この傾向はあまり理論的でないような医学研究にも当てはまるだろうか。
どうやらそうらしい。
医学で最も引用されている研究論文の4分の1が公刊後に再試験がなされていないままだし,後の研究で3分の1が誇張されたものか誤っているものだったことが分かっている。
これはアムジェンの結果ほど極端ではないが,重要な研究の中にどんな誤りが気づかれないまま潜んでいるのだろうかという疑いを持たせることだろう。
再現は期待されているほど広く行われていないし,その結果はいつも好都合なものだとは限らないのだ。
データ分析は,既知の入力に対してテストができるスプレッドシート・分析スクリプト・プログラムを使って自動化しよう。
もし誰かがエラーを疑った場合,何をまさに実施したのかが分かるように自分のコードを参照できるようにすべきだ。
既知の入力に対してすべての分析プログラムをテストし,結果が意味の通るものになるか確認しよう。
自分かエラーを招き入れていないということを保証するために,自分で変更した場合は,コードを確かめる自動化テストを使うのが理想だ。
ソフトウェアを書くときは,科学における計算機使用についての最良の実践に従おう。
データを分析するためにプログラムやスクリプトを使っている場合,「計算機を使用した再現可能な研究のための10個の簡単な規則」(Ten Simple Rules for Reproducible Computational Research)に従おう。
分析からのデータを自動的に論文に含められるようにするため, Sweaveのような再現可能な研究のためのツールを使おう。
可能であれば,ジェンバンクやタンパク質構造データバンク(PDB)といった専門のデータベース,あるいはドライアドやフィグシェアといった一般的なデータリポジトリから、すべてのデータを入手できるようにしておこう。
ソフトウェアのソースコード,スプレッドシート,分析スクリプトなどを公開しよう。
多くの学術誌では,こうしたものを論文の補充資料として提出させている。
あるいは,ドライアドやフィグシェアにこうしたファイルを預けることもできる。
関連記事