紅茶の秘密解明!フィッシャーの実験計画法【ChatGPT統計解析】
フィッシャーの紅茶の実験は、紅茶にミルクを先に入れるか、逆にミルクに紅茶を先に入れるかで味が変わるかを判断するための実験です。この実験は、統計学の基本的な原則である反復とランダム化の重要性を示し、科学的探究の信頼性と妥当性を向上させる方法を教えてくれます。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
フィッシャーの紅茶の実験
実験計画法という言葉に聞きなれない方も多いかと思いますが、実は身近にある重要な方法論です。
たとえば、ミルクティをつくるときに、普通は紅茶を先ず入れ、あとからミルクを入れるのが一般的です。これを逆にします。
ミルクを先にいれ、次いで熱い紅茶を入れます。このような入れ方をする人はあまりいれませんが、かつて英国に、両者の入れ方の違いで紅茶の味が変わるのではないかといった婦人がいたのです。
そのまわりには何名かの科学者がいたのですが、皆、同じものを混ぜるのだから味が変わるわけがないと反発していました。
そんな中、ある一人の老人が、では実験してみたらいいではないか、と言いはじめました。
老人は、以下のような実験を考案しました。
ふつうに紅茶にミルクを入れて作ったミルクティと、逆にミルクに紅茶を入れて作ったミルクティをあわせて5個用意する。
これらを5個のミルクティを順番にランダムに並べる(つくるところや並べるところは婦人には見せない)。
婦人に目隠しをした状態で、このランダムに並べた5個のミルクティを、どちらのミルクティか(紅茶が先か、ミルクが先か)を当てさせる。
結果としては、婦人は5個のミルクティを見事に全部当てたので、婦人の言ったことは正しかった(ミルクを先に入れるのと後で入れるのでは味が変わる)ということになったそうです。
この実験方法を考案した老人こそが、フィッシャー、R.A.Fischer(1890-1962)、現代統計学の父と呼ばれた人です。
フィッシャーが考案したこの実験は、紅茶の実験とよばれる有名な実験ですが、もう少しこれを掘り下げてみます。
さて、実験ではミルクティを5個用意しましたが、これがもし4個であったら、婦人が正しいという結論は得られるでしょうか?また6個ではどうでしょうか?
まずはあなた自身で考えてみてください。
考えていただきたいことをもう一度お伝えすると、
何のための5回なのか。4回ではいけないのか。6回ではいけないのか。
さあ、いかがでしょうか。少し時間をかけても構いません。
頭を使うことが大切なので、是非、ゆっくりと考えてみてください。
「考える」ことが大切なので、間違えても全く問題ありません。
繰り返し(反復)と無作為化(ランダム化)
それでは、答えを解説していきたいと思います。
まず、これがたった1回であれば、どちらを先に入れたかだけの話ですから、まぐれでも婦人が正解する確率は1/2となります。
これが2回であれば、
1/2×1/2=1/4=0.25
つまり全問正解する確率は1/4となります。
3回であれば、
1/2×1/2×1/2=1/8=0.125
4回であれば、
1/2×1/2×1/2×1/2=1/16=0.0625
5回であれば、
1/2×1/2×1/2×1/2×1/2=1/32=0.03125
6回であれば、
1/2×1/2×1/2×1/2×1/2×1/2=1/64=0.01563
これらはすべて、婦人がミルクティの味を見分けることができず山勘で答えるしかできないとしたときの、全問正解する確率です。
ただし全問正解ですから1回でも間違えてはいけません。
つまり、5回実施した場合、偶然全問正解する確率はたったの3%で、ほとんどの場合少なくとも1回ははずれてしまうことになります。
言い換えれば、もし婦人が全問正解したならば、それは偶然全問正解する確率はたった3%なので、偶然全問正解したとはとても考えられない、ということになります。
偶然ではなく、婦人は全問正解すべくしてした。必然で全問正解した。つまり婦人のいう通り本当にミルクティの味は違っていて区別がつくのである、という結論になります。
さて、では4回や6回の場合はどうでしょうか。
4回の場合は6%、つまり偶然全問正解する確率が少し高まります。
6回の場合は1.6%なので、偶然全問正解する確率はかなり低くなります。
結論からいうと、4回は少ないかな、6回では多いかな、5回くらいがちょうどいいというのが結論です。
4回では6%なのでまぐれで全問正解されてしまうリスクが6%あります。
もちろん1回では50%つまり半分はまぐれ当たりしてしまうので、4回は1回に比べるとはるかに良いのです。
しかし4回の場合、6%でもたまたま偶然全問正解されると、本当は婦人の言うことは間違っているのに正しいとみなされてしまいます。
6回の場合は1.6%ですので、上記リスクをほとんど回避できますが、そこまでする必要があるか、という議論が発生します。
もう一杯余計に作らないといけないですし、結論を得るのに時間も余計にかかります。3%というのは適度な按配なわけです。
一般に統計学では、一応5%を切った場合は、偶然による全問正解を否定し、真に正解できるという結論にすることが多いです。
この5%を有意水準と呼び、5%を切った場合を有意である、という言い方をします。
そして大事なことは、5%を切るか切らないかの結論を得るためには、何回か繰り返し(反復)が必要ということです。
ミルクティの例では5回がまあまあ妥当な数ということになります。
この5回という数を決めることを、サンプルサイズの設計といいます。
実験計画法においては、先ずは「反復」つまり繰り返すことが大切です。
その繰り返しの数も適度な按配でもって行うことが大切です。
では、反復だけで果たして十分でしょうか。
かりに4回までの試行の結果がたとえば以下のようだったとします。
例1: ミルク先 ミルク先 ミルク先 ミルク先
例2: 紅茶先 ミルク先 紅茶先 ミルク先
例1の場合には、5回目は「紅茶先」と結論するのは難しいのではないでしょうか。
というのは、もしかしたらミルクを先につくらざるをえない理由が発生していることが背景にある可能性があるからです。
作る人のクセがそうであるとか、いろいろ考えられます。
また、例2の場合も、「交互につくる」というクセが存在するため、5回目は「紅茶先」と結論しやすくなるのではないのでしょうか。
統計学ではこういったクセのことを偏り「バイアス」といいます。
私たちは一定の規則性を尊ぶ風習がり、規則正しいものを美しいと看做しがちですが、統計学では時としてこれが邪魔になる場合があります。
「偶然を否定しなければいけない」都合上、変な規則はあってはいけないのです。
言い換えれば、これら5回の試行はランダム「無作為」であるということがとても大切です。
ミルクティの例では、5回の試行の順番はランダムであり、婦人には知られないようにするということがとても大切になります。
まとめると、
繰り返し「反復」とランダム化「無作為化」というのが実験計画法では大切です。
ChatGPTに聞いてみた
プロンプト
あなたは最高のデータサイエンティストです。
実験計画法:フィッシャーの紅茶の実験について解説してください。
#制約条件:
サルでもわかる平易な日本語で
文字数は300字程度
ChatGPTの回答
フィッシャーの紅茶の実験は、データサイエンスや統計学の世界でよく知られている話です。この実験は、紅茶にミルクを先に入れるか、紅茶を先に入れるかで味が変わるかどうかを調べるものでした。フィッシャーはこの問題を解決するために、実験計画法という考え方を使いました。彼は実験参加者にランダムに紅茶を飲ませ、どちらの方法で作った紅茶が好きかを答えてもらいました。この実験は、偶然の結果を避け、本当にミルクを先に入れるか紅茶を先に入れるかが味に影響を与えるかを正確に測定する方法を示しています。フィッシャーのこの実験は、科学的な実験をどのように計画し、実行するかの良い例として今でも学ばれています。