信頼区間の真実: 95%の確率で何を意味するか【ChatGPT統計解析】
95%信頼区間は、母平均が含まれる確率が95%であるという意味ではなく、95%の確率で的中する区間を求める方法である。実際には標本抽出は一度きりであり、論文で公表された結果も、100回中5回は誤りである可能性がある。ネイマン=ピアソンとフィッシャーの解釈は、統計学における信頼区間の意味を巡って大きな論争を引き起こした。現在ではネイマン=ピアソンの解釈が主流となっており、95%信頼区間による推測は、それが正確である保証はないが、統計的には95%の確率で信頼できる区間として解釈される。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
95%信頼区間の意味
統計学では独特の用語がたくさんありますが、この「信頼」という言葉はその言葉の意味をよく表している、いい用語だと思っています。
95%信頼区間といった場合、計算の結果、求められた区間に母平均が確率95%で入っているのではありません。
そうではなくて、
「確率95%で的中する方法で求められた区間」
なのです。
いわば、95%信頼区間を具体的な数値で求めるというのは、確率95%で「的中した信頼区間」が出てくるくじを引くのと同じです。
もしも外れくじのほうを引いてしまったら、そのときに計算された95%信頼区間は母平均を含まない「失敗」した95%信頼区間です。
しかし、こればかりは運なのでどうしようもありません。
私たちは、何か母集団のパラメータを推測しよう(たとえば日本人の平均体温を求めよう、など)として、標本抽出を行いますが、それは普通1回しか行いません。
その一回で、データから95%信頼区間を計算し、論文などに公表します。
しかし、その論文公表した話は、100回中5回は「ウソ」であるということです。
また、ウソであるかどうかは誰にもわかりません。しかしそれは仕方ないのです。
100回中5回程度なら、まあいいやと許すしかないのです。
このようにして得られた、95%信頼区間による推測を「信じる」とは、どういうことでしょう。
それは、ある占い師の予言について、
この占い師が今回言った予言は、ほんとうかどうかはわかりません。
しかし、この占い師は確率95%で本当のことを言うらしいです。だから、今回も信じることにしましょう。
もしかしたら、今回は外れるかもしれませんが、そのときはそのときであきらめます。
というのと同じです。信じているのは1つひとつの予言ではなく、この占い師の能力です。
これは、この占い師が「信頼のおける人」だと思っているからで、そう思ってもらえるのは、この占い師がそれまでの実績などによって「信頼を得た」からでしょう。
ネイマン=ピアソンの解釈とフィッシャーの解釈
統計学の歴史においては、「p(43.9≦μ≦53.1)=0.95 という式は間違いである」という考え方(ネイマン=ピアソンの解釈)と、
「p(43.9≦μ≦53.1)=0.95という式は、43.9≦μ≦53.1という命題の信頼性が95%であることを表すと考えれば意味がある」という考え方(フィッシャーの解釈)
があり、大きな論争を引き起こしました。
現在の統計学では、前者の考え方が主流になっています。
関連リンク