再現不可能な遺伝学【統計解析講義応用】

再現不可能な遺伝学【統計解析講義応用】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

再現不可能な遺伝学|【統計学・統計解析講義応用】

再現不可能な遺伝学【統計解析講義応用】


目次  再現不可能な遺伝学【統計解析講義応用】

 

 

再現不可能な遺伝学

 

この問題は2006年に始まった。

 

このとき,新しい遺伝学的検査によって,患者のガンの特定の変異を化学療法で注意深くねらうことができるようになることが期待された。

 

デューク大学の研究者が試験をしたところ,彼らの手法を使えば腫瘍に対して最も感性がある薬を判断できることが示された。

 

こうした手法があれば,患者は効果的でない治療がもたらす副作用から免れることができる。

 

腫瘍学者はこの待ち望んでいたものに興奮し,他の研究者は自分自身の研究を始めた。

 

だが,最初に腫瘍学者たちはキース・バガリーとケビン・クームスという2人の生物統計学者にデータの確認を依頼した。

 

これは予想より難しいことだった。

 

元々の論文には分析を再現するのに十分な詳細が載っていなかったので,バガリーとクームスは生のデータともっと詳しい情報を得るためにデューク大学の研究者に連絡を取った。

 

問題はすぐに見つかった。

 

データのいくつかは正しく分類されていなかった。

 

薬に耐性がある細胞のグループが感性があるものとして分類されていたり,あるいはその逆が起きていたのだ。

 

データの中で重複していた標本もあった。

 

時には,重複した標本で,一方は感性があるとされ,もう一方は耐性があるとされているものもあった。

 

デューク大学の研究者が出した修正によって,これらの問題のいくつかが解決されたものの,同時にこの修正で重複したデータがさらに増えてしまった。

 

いくつかのデータは,間違って1つずつずれた状態になっていた。

 

ある細胞のセットからの測定結果が,他の細胞系を分析するときに用いられたせいだ。

 

遺伝子マイクロアレイは,バッチ間で有意なばらつきがあった。

 

そして,マイクロアレイ機器のもたらす効果が,真の生物学上の違いと分離できなくなっていた。

 

ある薬の結果を示すとされていた図は,実際には他の薬の結果を含んでいた。

 

とどのつまり,この研究はめちゃくちゃだったのだ。

 

多くの誤りがデューク大学の研究者に対して指摘されたにもかかわらず,この遺伝学上の結果を用いて,米国国立ガン研究所が資金を提供した臨床試験がいくつか開始された。

 

バガリーとクームスは元々の研究が掲載された学術誌に研究に対する応答を公表しようとしたが,いくつかの状況においては掲載が拒否された。

 

革新的な研究の方が,退屈でうんざりするような統計の詳細よりおもしろいのだ。

 

それにもかかわらず,米国国立ガン研究所は問題に関するうわさをかぎつけて,デューク大学の管理者に業績を再評価するように求めた。

 

同大学は,外部評価委員会を設置することで応えたが,この委員会はバガリーとクームスの結果を利用できなかった。

 

当然のことながら,委員会は誤りを何も発見せず,試験は続けられた。

 

ここでの誤りが本格的な注目を浴びたのは,後々になってからだった。

 

 

バガリーとクームスが発見を公刊してからしばらく経ったころ,ある業界誌がデューク大学で研究を主導していたアニル・ボディの履歴書に虚偽があることを報じた。

 

ボディの論文のいくつかは撤回され,結局,詐欺との非難を受ける中,ボディはデューク大学を辞職した。

 

結果を利用していたいくつかの試験は中止され,この技術を売るために設立された会社は閉鎖された。

 

ボディの事案は2つの問題の例証となっている。

 

それは,現代科学の多くで見られる再現可能性の欠如と,学術誌に否定的だったり矛盾したりする結果を載せることの困難さだ。後者の問題については次の章のために取っておきたいと思う。

 

再現可能性というのは人気のある空虚な専門用語と化している。

 

なぜそうなったかについてお分かりになる読者もいるかもしれない。

 

バガリーとクームスはボディが何をして何を間違えたのかということを理解するのに,2000時間を費やしたと推計している。

 

こんな暇な時間がある学者はほとんどいない。

 

もしボディの分析ソフトとデータが精査のために隠されることなく手に入るものだったら,疑い深い同僚がボディの仕事の個々の段階を再現するのに苦労させられることはなかっただろう。

 

単にコードを読み通して,各々の図やグラフがどこから来たのかを見るだけで良かったのだ。

 

問題は,ボディがデータをすぐに共有しなかったことだけに限られない。

 

科学者は,生データを結果に変換するときに踏んだ段階について,記録や文書化をしないことがしばしばある。

 

記録してあったとしても,科学論文のしばしば曖昧な書式か,実験ノートに書き残したものぐらいだ。

 

生データは,編集を経て,他の形式へ変換し,他のデータセットと結びつける必要がある。

 

統計分析は,時には特別にあつらえられたソフトで実施する必要がある。

 

そして,図表は結果から作る必要がある。

 

こうした作業はしばしば人の手で行われる。

 

少量のデータをコピーした上で,他のデータファイルやスプレッドシートに貼り付けるのだ。

 

これは非常に誤りを招きやすい手順だ。

 

責任を負う大学院生のストレス過多な記憶を除けば,こうした手順の決定的な記録は存在しないのが普通だ。

 

その学生が修了してから何年か経った後に,処理のすべての段階を調査し再現できることを望んでいるにもかかわらず,記録は存在していないのだ。

 

 

再現不可能な遺伝学【統計解析講義応用】


セミナー詳細                    解析ご相談                    LINEでお友達

再現不可能な遺伝学【統計解析講義応用】

再現不可能な遺伝学【統計解析講義応用】