95%信頼区間は100回中5回はウソ|ネイマン=ピアソンの解釈とフィッシャーの解釈【統計学・統計解析講義基礎】
95%信頼区間の意味は、求められた区間に母平均が確率95%で入っているのではなく、確率95%で的中する方法で求められた区間のこと。標本抽出は普通1回しか行わず、その論文公表した話は、100回中5回は「ウソ」である
95%信頼区間の意味
統計学では独特の用語がたくさんありますが、この「信頼」という言葉はその言葉の意味をよく表している、いい用語だと思っています。
95%信頼区間といった場合、計算の結果、求められた区間に母平均が確率95%で入っているのではありません。
そうではなくて、
「確率95%で的中する方法で求められた区間」
なのです。
いわば、95%信頼区間を具体的な数値で求めるというのは、確率95%で「的中した信頼区間」が出てくるくじを引くのと同じです。
もしも外れくじのほうを引いてしまったら、そのときに計算された95%信頼区間は母平均を含まない「失敗」した95%信頼区間です。
しかし、こればかりは運なのでどうしようもありません。
私たちは、何か母集団のパラメータを推測しよう(たとえば日本人の平均体温を求めよう、など)として、標本抽出を行いますが、それは普通1回しか行いません。
その一回で、データから95%信頼区間を計算し、論文などに公表します。
しかし、その論文公表した話は、100回中5回は「ウソ」であるということです。
また、ウソであるかどうかは誰にもわかりません。しかしそれは仕方ないのです。
100回中5回程度なら、まあいいやと許すしかないのです。
このようにして得られた、95%信頼区間による推測を「信じる」とは、どういうことでしょう。
それは、ある占い師の予言について、
この占い師が今回言った予言は、ほんとうかどうかはわかりません。
しかし、この占い師は確率95%で本当のことを言うらしいです。だから、今回も信じることにしましょう。
もしかしたら、今回は外れるかもしれませんが、そのときはそのときであきらめます。
というのと同じです。信じているのは1つひとつの予言ではなく、この占い師の能力です。
これは、この占い師が「信頼のおける人」だと思っているからで、そう思ってもらえるのは、この占い師がそれまでの実績などによって「信頼を得た」からでしょう。
ネイマン=ピアソンの解釈とフィッシャーの解釈
統計学の歴史においては、「p(43.9≦μ≦53.1)=0.95 という式は間違いである」という考え方(ネイマン=ピアソンの解釈)と、
「p(43.9≦μ≦53.1)=0.95という式は、43.9≦μ≦53.1という命題の信頼性が95%であることを表すと考えれば意味がある」という考え方(フィッシャーの解釈)
があり、大きな論争を引き起こしました。
現在の統計学では、前者の考え方が主流になっています。
関連リンク