リスク差の真実:95%信頼区間の魔法【ChatGPT統計解析】
リスク差がある特定の値であるという仮説を立てた場合、有意水準両側5%で「有意差なし」となる範囲が95%信頼区間です。つまり、95%信頼区間内の値をリスク差と仮定すれば、有意水準両側5%で「有意差なし」となることを示しています。具体的には、帰無仮説「リスク差=0」について、95%信頼区間に0が含まれていれば「有意差なし」、含まれていなければ「有意差あり」となります。95%信頼区間は、単なる仮説検定よりも多くの情報を提供し、リスク差の推定精度を示す指標です。例えば、リスク差0.10に対して、95%信頼区間(−0.03−0.23)では帰無仮説は否定できませんが、95%信頼区間(0.01−0.19)では否定されます。信頼区間が狭いほど推定精度が高いとされます。確率1/2を例にとると、サンプルサイズが増えるにつれて信頼区間が狭くなり、確信度が高まることが分かります。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
95%信頼区間と仮説検定
リスク差が〇〇だという仮説を考えたとき、有意水準両側5%で「有意差なし」となる。この〇〇に当てはまる値の範囲が95%信頼区間です。
ということは、
帰無仮説「リスク差=0」について、
95%信頼区間に0が含まれていれば、有意水準両側5%で「有意差なし」
95%信頼区間に0が含まれていなければ、有意水準両側5%で「有意差あり」
となります。
95%信頼区間を見れば、帰無仮説について有意差の有無がわかることになります。
統計的仮説検定は、「有意差あり」「有意差なし」の二者択一の情報しか提供してくれませんでした。
それに対して、95%信頼区間は、「リスク差が〇〇だという仮説が否定できない値の範囲」に関する情報を与えてくれます。
よって、95%信頼区間は統計的仮説検定よりも多くの情報を与えてくれることになります。
リスク差が95%信頼区間の範囲の中で有意水準両側5%で「有意差なし」
リスク差が〇〇だという仮説を考えたとき、有意水準両側5%で「有意差なし」となる。この〇〇に当てはまる値の範囲が95%信頼区間です。
言い方を変えると、リスク差を95%信頼区間の範囲の中の値に仮定すると、有意水準両側5%で「有意差なし」となります。
「有意差なし」ということは、「仮説が間違っているとは言えない」ということです。
つまり、有意水準両側5%という基準において、95%信頼区間の範囲の中の値は、本当のリスク差であることが否定できないわけです。
では、以下の2つの95%信頼区間を比べてみると、どうでしょう。
ケース1 リスク差0.10 95%信頼区間 −0.03−0.23
ケース2 リスク差0.10 95%信頼区間 0.01−0.19
95%信頼区間の幅が狭いケース2の方が、情報としては価値が高いですよね。
本当のリスク差であることが否定できない範囲が狭いのですから。
例えば、帰無仮説(リスク差=0)を考えてみると、ケース1の95%信頼区間では帰無仮説は否定できませんが、ケース2では否定されることになります。
データから推定されたリスク差はどちらも0.10なのに、このようになります。
95%信頼区間の幅が狭い方が価値の高い情報を与えてくれます。
価値の高い情報を与えてくれるということは、それだけその推定値(この場合はリスク差)の推定精度が高い、ということになります。
95%信頼区間は推定の精度を示す指標です。
例えば、確率1/2(=0.5)を考えてみましょう。
一言に確率1/2と言っても、5/10と50/100、500/1000では意味が違います。
5/10よりも500/1000の方がより確信が持てます。
この確信の度合いを95%信頼区間は示してくれるのです。
推定値 95%信頼区間
5/10 0.19-0.81
50/100 0.40-0.60
500/1000 0.47-0.53
5/10よりも50/100、50/100よりも500/1000の方がより確信の度合いが高くなるにつれて、95%信頼区間の幅が狭くなっているのがわかります。
関連リンク