統計の誤用が科学信頼を揺るがす理由【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

統計の誤用や誤解は科学において深刻な問題を引き起こしているが、これには多くの要因が絡んでいる。例えば、統計的有意性やp値の誤解は科学的信頼を損なう要因となっており、特に医療や犯罪学、疫学など現実社会に直接影響を与える分野で顕著である。また、公刊バイアスやデータ不足、研究者間の競争圧力が結果の偏りを助長している。統計手法の柔軟性により、研究者がデータを都合よく解釈する余地が生じ、結果的に科学的誤りを増幅させる状況が見られる。さらに、興味深い結果を求める圧力が慎重な検証よりも優先され、科学的発見の信頼性が低下している。このような問題を解決するために、統計の改革が求められており、p値の廃止、新しい統計学、ベイズ的手法の採用など多様なアプローチが議論されている。しかし、統計そのものではなくその使用方法の問題とする見解もあり、現状の統計教育や実務に焦点を当てた改善が必要とされている。

▼▼▼▼▼▼▼▼
チャンネル登録はこちら

目次統計の誤用が科学信頼を揺るがす理由【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

統計に関する誤り

統計に関する知性が欠如しているとほとんどの科学者を非難するのは不公平かもしれない。

ほとんどの学術分野は、ｐ値の誤った解釈以上のものにのっとって成立しているからだ。

だが、こうした誤りは、現実世界に非常に大きな影響を及ぼしている。

医学における臨床試験は、私達の健康管理を左右するし、強力な新しい処方薬の安全性を決定する。

犯罪学者は犯罪を減らすためのさまざまな方法を評価するし、疫学研究者は新しい疾病の速度をゆるめようとする。

マーケティング担当者やビジネスマネージャーは商品を売る最善の方法を見つけようとする。

こうしたことは、つまるところ、統計に行き着く。

何が良いか悪いかについて医者が決定しないということに不満を述べたことがある人は、誰でもこの問題の範囲を理解するだろう。

私たちは、今や、何らかの食品や食事や運動が有害かもしれないと主張するニュース記事を拒否するような態度になっている。

数か月後の必然的な第二の研究を待つだけの話だ。

その研究は正反対の結果を示しているだろう。

ある著名な疫学研究者は、「私たちは急速に社会の厄介者になっている。人々は、もはや私たちのことを真剣に取り合ってくれない。

そして、人々が真剣に受け取ってくれるときは、私たちは、意図せず、有益なことより有害なことを多くなしているのかもしれない」と述べている。

私たちの勘は正しい。

多くの分野で、最初に出てきた結果は後から出てきた結果と矛盾する。

刺激的な結果を早く頻繁に公刊しようとする圧力の方が、追加の証拠で支持され、慎重に確かめられた結果を公刊しようとする責任よりも強いようなのだ。

ただ、そんなに急いで判断しないようにしよう。

いくつかの統計に関する誤りは、単に資金や資源が不足したことによって起こっている。

1970年代半ばに、ガソリンと時間を節約するために、米国で運転手に赤信号の右折を許すようにした運動について考えてみよう。

このようにしても変更前に比べて衝突事故が増えることはないという証拠は、統計的におかしいものだった。

そして、この後すぐに見るように、赤信号での右折を許すようになった結果、多くの人命が失われた。

交通安全の研究者を妨げた唯一の要因は、データの不足だった。

もし、より多くのデータを集め、より多くの研究を実施するための資金があれば、そしてさまざまな州の独立した研究者の結果を比較対照する時間があれば、真実は明らかになっていただろう。

製薬企業は、薬に効果がないことを示す研究を公刊しないことで証拠を歪ませる誘惑に特に駆られているように見える。

後から文献を評価する人は、薬に効果がないことを示す公刊されなかった８個の研究を知らないままに、薬に効果があることを示す他の公刊された１２個の研究を見つけて満足するだろう。

もちろん，薬に効果がないとする研究はたとえ投稿されたとしても，査読付きの学術誌で公刊されることはないかもしれない。

つまらない結果に対する強い偏見があるために，効果がなかったと述べる研究は決して公にならず，他の研究者がそれを見ることができない状況がもたらされるのだ。

データが欠けていることと公刊の偏りは，重要な問題に関する認識を歪め，科学への災いとなっている。

正しく行われた統計ですら信じることができない。

統計の手法や分析で使用可能なものが多すぎるため，研究者がかなり自由にデータを分析できるようになっている。

そして、「データが吐くまで拷問する」ことはとても簡単だ。

統計ソフトが提供しているさまざまな分析をどれかが興味深い結果を出すまで試し，そうした結果を出した分析こそが最初からやろうとしていた分析だったといつわるのだ。

超能力なしに，ある公刊された結果が，データへの拷問で得られたものかどうかを判断することはほとんど不可能だ。

理論があまり数量に基づくものでなく，実験の計画が難しく，手法があまり標準化されていないような柔らかい分野では，このような自由が付け加わることが顕著な偏りを引き起こす。

米国にいる研究者は，キャリアを進めるために，興味深い結果を生み出して公刊しなくてはならない。

大学などの研究職で空いているものはわずかで，このわずかな数の職を求める競争は激しいものになっている。

こうした競争があるために，科学者は統計的に有意でない結果を生み出すだけのデータを数か月あるいは数年かけて収集したり分析したりすることはできないのだ。

こうした科学者は，悪意がなくても，データから許されるところより自分の仮説に都合が良い方向に誇張された結果を生み出す傾向がある。

誤りの多くは，公刊された大量の文献の中にはびこっている。

何千もの論文について，その報告に疑いの目が向けられているのだ。

近年，多くの大が統計の改革を呼びかけている。

そして，当然，そうした人の中でも，問題対処の方法として何が一番良いかということについて，意見の相違がある。

p値については，まぎらわしく混乱を招くことがしばしばあると説明する予定だが，これの使用を完全にやめるべきだと主張している人がいる。

他には，信頼区間に基づく「新しい統計学」を提唱している人もいる。さらには，より解釈がしやすい結果を出す新しいベイズ的手法に切り替えるべきだと提案している人もいる。

また，今教えられている統計で大丈夫だが，用いられ方が良くないと信じている人もいる。

こうした立場はどれも見るべきところがある。

私としてはどれか１つの立場を選び取って，推奨するつもりはない。むしろ，私は，現役の科学者によって現在用いられている統計に着目している。

統計の誤用や誤解は現代科学において深刻な問題を引き起こしており、特に医療や犯罪学、疫学など現実社会に直接的な影響を与える分野でその影響が顕著に現れています。この問題は単に技術的なミスや手法の選択ミスだけではなく、科学者や研究者の行動、研究環境、学術的慣行、そして社会的要因など多くの要因が絡み合って発生しています。例えば、統計的有意性やp値に関する誤解が多くの科学者や研究者の間で広まっており、これが科学的な信頼性を損なう一因となっています。p値は本来、帰無仮説が正しいと仮定した場合に観測されたデータが得られる確率を示すものであり、科学的結論の決定打とされるものではありません。しかし、多くの研究者がp値を結果の有意性を示す「魔法の数値」として扱い、p<0.05であれば結論が有意であるとし、p>0.05であれば結論を無意味とみなすなど、極端な解釈がなされることが少なくありません。このような統計的有意性への過度の依存は、科学的結論の偏りや誤りを助長し、結果的に不正確な情報が社会に広まる原因となっています。また、p値の誤用だけでなく、公刊バイアスやデータ不足、研究者間の競争圧力も科学的誤りを引き起こす要因として重要です。公刊バイアスとは、特にポジティブな結果や「興味深い」結果が学術誌に掲載されやすい傾向を指します。この結果、ネガティブな結果や統計的に有意でない結果が公表されずに埋もれてしまい、科学全体のバランスを損なう状況が生じています。研究者がデータを都合よく解釈する余地が生まれることも問題の一つです。統計手法の柔軟性や多様性により、研究者は分析の過程で意図せずとも結果を都合よく導くことが可能となり、結果的に科学的誤りを増幅させることがあります。さらに、興味深い結果を求める圧力が慎重な検証や再現性の確保よりも優先される状況が見られます。これは特にアカデミックな世界における「パブリッシュ・オア・ペリッシュ」の文化が影響しており、研究者が自身のキャリアを守るために統計的に有意な結果を追求する傾向が強まる一因となっています。このような問題に対処するためには統計学そのものの改革が求められており、具体的にはp値の廃止や新しい統計学的手法の導入、さらにはベイズ統計の採用が議論されています。p値の廃止を主張する声は、統計的有意性に頼る現在の研究慣行が科学的結論の信頼性を低下させているとの懸念に基づいています。一方で、ベイズ統計は先験的な知識を活用し、より柔軟で解釈可能な結果を提供できる点で注目されています。しかし、統計そのものを変えるだけでは問題の解決にはつながらないとの見解もあります。統計の誤用は多くの場合、統計学そのものではなくその使用方法に起因しており、現状の統計教育や実務に焦点を当てた改善が必要です。例えば、統計の基礎概念をより深く理解させる教育プログラムの開発や、研究デザインの段階から統計の専門家を関与させる取り組みが重要視されています。また、研究者間での透明性の向上や、結果の再現性を重視する文化の醸成も不可欠です。こうした取り組みを通じて、科学的発見の信頼性を高め、統計の誤用による科学的信頼の低下を防ぐことが可能になるでしょう。

関連記事

経済統計と経済学的記述

朽ち果てるデータ

統計学におけるQC七つ道具

標本調査と統計的推測

賽は投げられた

分析単位と調査単位

統計学における３シグマのルール

中国の出生性比の統計学

訪問面接調査の統計学

磁石には痛み緩和の効果なし

前へ

1

2

次へ

【トップページへ戻る】
【YouTubeChannel】
【統計解析講義基礎】
【統計解析講義応用】
【ChatGPT・Python・Excel】
【多変量解析】
【医療統計解析】

【社会経済統計】
【ビジネス統計】
【AI・デジタル】
【統計解析コラム】
【統計解析用語集】
【統計解析セミナー】
【お問い合わせ】

セミナー詳細解析ご相談 LINEでお友達

Google Gemini・Python・エクセルを使った講義で最速マスター

統計の誤用が科学信頼を揺るがす理由【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】 | Google Gemini・Python・エクセルを使った講義で最速マスター

統計の誤用が科学信頼を揺るがす理由【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

統計に関する誤り

サブメニュー

最新記事