Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学者フィッシャーの考案した紅茶の実験【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学者フィッシャーの考案した紅茶の実験【統計解析講義基礎】

統計学者フィッシャーの考案した紅茶の実験【統計解析講義基礎】


統計学者フィッシャーの考案した紅茶の実験【統計解析講義基礎】

 

目次  統計学者フィッシャーの考案した紅茶の実験【統計解析講義基礎】

 

紅茶の実験

 

実験計画法という言葉に聞きなれない方も多いかと思いますが、実は身近にある重要な方法論です。

 

たとえば、ミルクティをつくるときに、普通は紅茶を先ず入れ、あとからミルクを入れるのが一般的です。これを逆にします。

 

ミルクを先にいれ、次いで熱い紅茶を入れます。このような入れ方をする人はあまりいれませんが、かつて英国に、両者の入れ方の違いで紅茶の味が変わるのではないかといった婦人がいたのです。

 

そのまわりには何名かの科学者がいたのですが、皆、同じものを混ぜるのだから味が変わるわけがないと反発していました。

 

そんな中、ある一人の老人が、では実験してみたらいいではないか、と言いはじめました。

 

老人は、以下のような実験を考案しました。

 

ふつうに紅茶にミルクを入れて作ったミルクティと、逆にミルクの紅茶を入れて作ったミルクティをあわせて5個用意する。

 

これらを5個のミルクティを順番にランダムに並べる(つくるところや並べるところは婦人には見せない)。

 

婦人に目隠しをした状態で、このランダムに並べた5個のミルクティを、どちらのミルクティか(紅茶が先か、ミルクが先か)を当てさせる。

 

結果としては、婦人は5個のミルクティを見事に全部当てたので、婦人の言ったことは正しかった(ミルクを先に入れるのと後で入れるのでは味が変わる)ということになったそうです。

 

この実験方法を考案した老人こそが、フィッシャーとは、R.A.Fischer(1890-1962)、現代統計学の父と呼ばれた人です。

 

フィッシャーが考案したこの実験は、紅茶の実験とよばれる有名な実験ですが、もう少しこれを掘り下げてみます。

 

さて、実験ではミルクティを5個用意しましたが、これがもし4個であったら、婦人が正しいという結論は得られるでしょうか?また6個ではどうでしょうか?

 

まずはあなた自身で考えてみてください。

 

考えていただきたいことをもう一度お伝えすると、

 

何のための5回なのか。4回ではいけないのか。6回ではいけないのか。

 

さあ、いかがでしょうか。少し時間をかけても構いません。

 

頭を使うことが大切なので、是非、ゆっくりと考えてみてください。

 

「考える」ことが大切なので、間違えても全く問題ありません。

 

反復と無作為化

 

それでは、答えを解説していきたいと思います。

 

まず、これがたった1回であれば、どちらを先に入れたかだけの話ですから、まぐれでも婦人が正解する確率は1/2となります。

 

これが2回であれば、

 

1/2×1/2=1/4=0.25

 

つまり全問正解する確率は1/4となります。

 

3回であれば、

 

1/2×1/2×1/2=1/8=0.125

 

4回であれば、

 

1/2×1/2×1/2×1/2=1/16=0.0625

 

5回であれば、

 

1/2×1/2×1/2×1/2×1/2=1/32=0.03125

 

6回であれば、

 

1/2×1/2×1/2×1/2×1/2×1/2=1/64=0.01563

 

これらはすべて、婦人がミルクティの味を見分けることができず山勘で答えるしかできないとしたときの、全問正解する確率です。

 

ただし全問正解ですから1回でも間違えてはいけません。

 

つまり、5回実施した場合、偶然全問正解する確率はたったの3%で、ほとんどの場合少なくとも1回ははずれてしまうことになります。

 

言い換えれば、もし婦人が全問正解したならば、それは偶然全問正解する確率はたった3%なので、偶然全問正解したとはとても考えられない、ということになります。

 

偶然ではなく、婦人は全問正解すべくしてした。必然で全問正解した。つまり婦人のいう通り本当にミルクティの味は違っていて区別がつくのである、という結論になります。

 

さて、では4回や6回の場合はどうでしょうか。

 

4回の場合は6%、つまり偶然全問正解する確率が少し高まります。

 

6回の場合は1.6%なので、偶然全問正解する確率はかなり低くなります。

 

結論からいうと、4回は少ないかな、6回では多いかな、5回くらいがちょうどいいというのが結論です。

 

4回では6%なのでまぐれで全問正解されてしまうリスクが6%あります。

 

もちろん1回では50%つまり半分はまぐれ当たりしてしまうので、4回は1回に比べるとはるかに良いのです。

 

しかし4回の場合、6%でもたまたま偶然全問正解されると、本当は婦人の言うことは間違っているのに正しいとみなされてしまいます。

 

6回の場合は1.6%ですので、上記リスクをほとんど回避できますが、そこまでする必要があるか、という議論が発生します。

 

もう一杯余計に作らないといけないですし、結論を得るのに時間も余計にかかります。3%というのは適度な按配なわけです。

 

一般に統計学では、一応5%を切った場合は、偶然による全問正解を否定し、真に正解できるという結論にすることが多いです。

 

この5%を有意水準と呼び、5%を切った場合を有意である、という言い方をします。

 

そして大事なことは、5%を切るか切らないかの結論を得るためには、何回か繰り返す(反復)が必要ということです。

 

ミルクティの例では5回がまあまあ妥当な数ということになります。

 

この5回という数を決めることを、サンプルサイズの設計といいます。

 

実験計画法においては、先ずは「反復」つまり繰り返すことが大切です。

 

その繰り返しの数も適度な按配でもって行うことが大切です。

 

では、反復だけで果たして十分でしょうか。

 

かりに4回までの試行の結果がたとえば以下のようだったとします。

 

例1: ミルク先 ミルク先 ミルク先 ミルク先

 

例2: 紅茶先 ミルク先 紅茶先 ミルク先

 

例1の場合には、5回目は「紅茶先」と結論するのは難しいのではないでしょうか。

 

というのは、もしかしたらミルクを先につくらざるをえない理由が発生していることが背景にある可能性があるからです。

 

作る人のクセがそうであるとか、いろいろ考えられます。

 

また、例2の場合も、「交互につくる」というクセが存在するため、5回目は「紅茶先」と結論しやすくなるのではないのでしょうか。

 

統計学ではこういったクセのことを偏り「バイアス」といいます。

 

私たちは一定の規則性を尊ぶ風習がり、規則正しいものを美しいと看做しがちですが、統計学では時としてこれが邪魔になる場合があります。

 

「偶然を否定しなければいけない」都合上、変な規則はあってはいけないのです。

 

言い換えれば、これら5回の試行はランダム「無作為」であるということがとても大切です。

 

ミルクティの例では、5回の試行の順番はランダムであり、婦人には知られないようにするということがとても大切になります。

 

まとめると、

 

繰り返し「反復」とランダム化「無作為化」というのが実験計画では大切です。

セミナー詳細こちら                    解析ご相談こちら


 

統計学者フィッシャーの考案した紅茶の実験【統計解析講義基礎】

統計学者フィッシャーの考案した紅茶の実験【統計解析講義基礎】

統計学者フィッシャーの考案した紅茶の実験【統計解析講義基礎】