Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における信頼という言葉【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における信頼という言葉【統計解析講義基礎】

統計学における信頼という言葉【統計解析講義基礎】


統計学における信頼という言葉【統計解析講義基礎】

 

統計学では独特の用語がたくさんありますが、この「信頼」という言葉はその言葉の意味をよく表している、いい用語だと思っています。

 

95%信頼区間といった場合、計算の結果、求められた区間に母平均が確率95%で入っているのではありません。

 

そうではなくて、

 

「確率95%で的中する方法で求められた区間」

 

なのです。

 

いわば、95%信頼区間を具体的な数値で求めるというのは、確率95%で「的中した信頼区間」が出てくるくじを引くのと同じです。

 

もしも外れくじのほうを引いてしまったら、そのときに計算された信頼区間は母平均を含まない「失敗」した信頼区間です。

 

しかし、こればかりは運なのでどうしようもありません。

 

私たちは、何か母集団のパラメータを推測しよう(たとえば日本人の平均体温を求めよう、など)として、標本抽出を行いますが、それは普通1回しか行いません。

 

その一回で、データから95%信頼区間を計算し、論文などに公表します。

 

しかし、その論文公表した話は、100回中5回は「ウソ」であるということです。

 

また、ウソであるかどうかは誰にもわかりません。しかしそれは仕方ないのです。100回中5回程度なら、まあいいやと許すしかないのです。

 

このようにして得られた、95%信頼区間による推測を「信じる」とは、どういうことでしょう。

 

それは、ある占い師の予言について、

 

この占い師が今回言った予言は、ほんとうかどうかはわかりません。

 

しかし、この占い師は確率95%で本当のことを言うらしいです。だから、今回も信じることにしましょう。

 

もしかしたら、今回は外れるかもしれませんが、そのときはそのときであきらめます。

 

というのと同じです。信じているのは1つひとつの予言ではなく、この占い師の能力です。

 

これは、この占い師が「信頼のおける人」だと思っているからで、そう思ってもらえるのは、この占い師がそれまでの実績などによって「信頼を得た」からでしょう。

 

なお、統計学の歴史においては、「p(43.9≦μ≦53.1)=0.95 という式は間違いである」という考え方(ネイマン=ピアソンの解釈)と、

 

「p(43.9≦μ≦53.1)=0.95という式は、43.9≦μ≦53.1という命題の信頼性が95%であることを表すと考えれば意味がある」という考え方(フィッシャーの解釈)

 

があり、大きな論争を引き起こしました。現在の統計学では、前者の考え方が主流になっています。

セミナー詳細こちら                    解析ご相談こちら


 

統計学における信頼という言葉【統計解析講義基礎】

統計学における信頼という言葉【統計解析講義基礎】

統計学における信頼という言葉【統計解析講義基礎】