統計的仮説検定と背理法:薬の効果を証明する鍵【ChatGPT統計解析】
統計的仮説検定は、背理法を応用した方法です。まず背理法とは、逆の仮説を立て、それを否定することで元の主張を証明する方法です。例えば、浮気を疑われた場合、浮気をしていたと仮定し、その日に大阪市内にいなければ浮気をしていなかったと証明できます。これを統計的仮説検定に当てはめると、薬の効果を調べる際、「薬に効果がない」という仮説(帰無仮説)を立て、それを否定することで薬の効果を証明します。ただし、帰無仮説が否定できなくても、薬に効果がないとは断定できないことに注意が必要です。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
統計的仮説検定は一種の背理法
統計的仮説検定は一種の背理法です.と言われても,そもそも背理法ってナニ? という人もいるかもしれないので,まず背理法について例を挙げて簡単にお話しします.
妻から浮気の容疑をかけられました.ある日,ママ友から妻のところに,大阪市内で私らしき人がきれいな女の人と仲良さそうに歩いているのを見かけた,浮気の疑いあリ,との通報があったというのです.(フィクションです)
浮気をしていないことの証拠を出すのは難しいですよね.
そこで,浮気をしていないことを証明するために次のようなロジックを考えます.
仮に,私か浮気をしていたとしましょう.だとすれば,その日に大阪市内にいたはずです.
だから,その日に大阪市内にいなかったことが証明できれば,浮気していなかったと言えるわけです.
これが背理法です.
「浮気していない」ことを証明するために,わざわざ逆の「浮気している」という仮説を立てて,それを否定することにより,浮気をしていない,と証明するわけです.
注意しなければならないのは,もし仮に,私かその日に大阪市内にいたとしても,それがすなわち浮気の証拠にはならないということです.
私か大阪市内にいたのは事実だとしても,大阪市内には多くの人がいるので,ママ友が見た人が私であるという確証はないのです.
他人の空似かもしれません.
ストレートに証明しづらい場合は,逆の否定したい仮説を立てて,それを否定することを考えるわけです.
統計的仮説検定は,この背理法の原理を応用しているのです.
では,統計的仮説検定では,いったいどのように背理法の原理を応用しているのでしょうか?
上に述べた原理を当てはめてみると、例えば薬を飮むグループと飲まないグループを比較するランダム化研究では,(平均的に)薬に効果があることを証明したいわけです.
このことを証明するために,わざわざ逆の薬に効果がない,つまり,「比較するグループのリスクに違いがない」という仮説を立てて,それを否定しようというわけです.
この,「比較するグループのリスクに違いがない」という仮説のことを帰無仮説と言います.
注意しなければならないのは,大阪市内にいたからといって即浮気したと断定できないように,帰無仮説が否定できなかったからといって,「比較するグループのリスクに違いがない」(薬の効果はない)とは言えないということです.
統計的仮説検定は、背理法を応用した手法です。ではまず、背理法そのものがどのような論理の展開を示すのか、具体例を挙げて説明していきます。背理法とは、ある命題が真であることを直接証明するのが困難な場合に、逆の命題が誤りであることを証明することで、元の命題の正しさを間接的に証明する手法です。もっともシンプルな例として、「浮気」をテーマにした仮定を用いて説明してみましょう。ある日、あなたが浮気の疑いをかけられたとします。例えば、妻から「あなたが大阪市内で他の女性と一緒に歩いているのを見た」という通報を受けたと仮定します。この状況で、あなたは「浮気をしていない」ということを証明しなければならないのですが、そもそも浮気をしていないこと自体を証明するのは難しいですよね。なぜなら、浮気をしていない証拠として何を提示すべきかが曖昧であり、何も起こっていないことを示すのは非常に困難です。そこで、この問題を解決するために背理法を使います。具体的には、逆に「もし自分が浮気をしていたらどうなるか」という仮定を立て、その仮定に基づいた事実を検討します。たとえば、「もし浮気をしていたなら、その日に大阪市内にいたはずだ」という条件を設定します。そして、その日に自分が大阪市内にいなかったことを証明できれば、「浮気をしていない」と結論づけることができます。これが背理法の基本的な考え方です。つまり、証明したい命題の逆を仮定し、それが成り立たないことを証明することで、元の命題を証明するという手法です。この考え方は日常的にもよく使われるものです。たとえば、「部屋に誰もいないこと」を証明したい場合、全ての部屋を調べて誰もいないことを確認するのは非常に手間がかかります。しかし、「もし誰かが部屋にいたら、足音や声が聞こえるはずだ」という仮定を立て、そのような証拠がないことを確認すれば、「誰もいない」という結論に到達できます。このように背理法は、直接的な証明が難しい場合に逆の視点から考え、矛盾を排除することで元の主張を証明する手法として非常に有用です。さて、この背理法の考え方は、統計的仮説検定にどのように応用されているのでしょうか?統計的仮説検定では、調査や実験の結果をもとに、ある仮説がどの程度支持されるかを判断します。この際、背理法と同様に、「ある仮説が真である」と証明するために、「その仮説が偽である」という逆の仮説を立て、それを否定することで元の仮説が支持されるかどうかを判断します。この逆の仮説のことを「帰無仮説(null hypothesis)」と呼びます。例えば、新薬の効果を検証するランダム化比較試験を考えてみましょう。この試験では、薬を投与されたグループとプラセボを投与されたグループを比較し、薬が効果を持つかどうかを確認したいとします。ここで直接「薬に効果がある」という仮説を立てて、それを証明することは難しいため、まず「薬に効果がない」という帰無仮説を立てます。そして、実験の結果、もし帰無仮説を否定できるほどの統計的な証拠が得られた場合、「薬に効果がある」という対立仮説が支持されるという形になります。重要なのは、この仮説検定の結果として帰無仮説が否定されなかった場合、それがすなわち「薬に効果がない」と断定することにはならないという点です。つまり、帰無仮説が否定できなかったという結果は、「薬に効果がない」と断定するには不十分であり、単に「薬に効果があるという強い証拠が得られなかった」ということを意味するに過ぎません。この点を理解することが、統計的仮説検定の誤解を避ける上で非常に重要です。もう少し具体的に統計的仮説検定の手順を見てみましょう。まず、帰無仮説を立てます。この仮説は通常、「差がない」「効果がない」「関係がない」といった形で定義されます。次に、データを集めて統計的な分析を行い、帰無仮説が正しいかどうかを評価します。この評価には、p値と呼ばれる指標が用いられます。p値は、帰無仮説が正しいと仮定した場合に、実際のデータのような結果が得られる確率を示します。通常、p値が非常に小さい(たとえば0.05未満)場合、帰無仮説を棄却し、対立仮説が支持されるという結論を下します。ここで再度注意したいのは、p値が0.05以上だからといって、帰無仮説が「真である」と断定することはできないという点です。統計的仮説検定は、あくまで確率的な判断を基にしており、100%の確実性を持って結論を出すものではないからです。仮説検定においてよくある誤解の一つは、「p値が有意でない場合、研究結果に意味がない」と捉えがちな点です。実際には、p値が有意でないからといって研究が無意味なわけではなく、その結果をどう解釈するかが重要です。例えば、サンプルサイズが小さい場合、効果があっても検出できない可能性があります。また、検出力が低い場合も、帰無仮説を棄却できないことがあり、このような状況では追加のデータ収集や再検討が必要となることもあります。さらに、統計的仮説検定に関連する概念として、「第一種の過誤」と「第二種の過誤」があります。第一種の過誤とは、実際には帰無仮説が正しいのに、それを誤って棄却してしまうエラーです。つまり、薬に効果がないにもかかわらず、効果があると誤って結論づけてしまうことを指します。第二種の過誤はその逆で、実際には対立仮説が正しいのに、帰無仮説を棄却できずに誤って帰無仮説を支持してしまうエラーです。薬に効果があるにもかかわらず、効果がないと結論してしまう場合がこれに当たります。第一種の過誤を避けるためには、厳密な統計的基準を設定する必要があります。一方、第二種の過誤を減らすためには、サンプルサイズを増やすなど、実験の検出力を高める工夫が必要です。このように、統計的仮説検定は背理法の考え方に基づいており、逆の仮説を立ててそれを否定することで証明を行う手法です。しかし、結果の解釈には注意が必要であり、単に「帰無仮説が否定されなかったから正しい」といった単純な結論に飛びつくことは避けるべきです。統計的仮説検定はあくまで確率的な推論であり、常にエラーの可能性があることを理解することが大切です。
関連記事