信頼区間と基準範囲|【統計学・統計解析講義応用】
信頼区間と基準範囲
個々についての推測
統計学の講師がまだ現れず,他にすることがないとき,次に入ってくる学生が太りすぎかどうかを当ててみて下さい。
問題をシンプルにするために,その学生が男子でスポーツ選手ではないこと(したがって体重が100 kg超のオフェンスラインマンは除外します)を私たちは知っているものとしましょう。
そして私たちの任務は体重(kg)を身長(m)の2乗で割った数値,体格指数BMIを当てることとします。
ここで手がかりとなる少しばかりの統計的情報を示します。
スポーツ選手でない男子学生100人を調査すると, BMIの平均値は26.0でその標準偏差は3.9でした。
そのため,もし今まさにドアの外に立っている学生のBMIを言い当てるとしたら,「ペストな予測」は26.0です。
実際,これはまさに“平均値”当てなければならないものの定義にぴったりです。
BMIが正確に26.0だとどれくらいの自信があるかと尋ねられたらどうでしょう?
「あまりない」と答えるのではないでしょうか。
事実, BMIが小数第一位まで丸められるものと仮定して,スポーツ選手でない男子学生のBMIがちょうど26.0である割合は1%程度でしかないことを計算できます。
26.0という数値を推測するためのもう1つのやり方は,「BMIは多分22から30の間だと思う」ということです。
そのときその答えにどれくらいの自信があるでしょうか?
22と30は平均から標準偏差1つ分離れたところの値であり,データの3分の2が平均値を挟んで標準偏差1つ分の値の間にあることを知っているので,その自信は,正しくおよそ3分の2ということができるでしょう。
もし,平均値からそれぞれ標準偏差2つ分離れた値である「18から34の間」と推測したなら,それは95%ほどの割合で正しいでしょう。
研究結果についての推測
同じようなことを調査研究の結果についても考えてみましょう。
統計学の講師が遅れているのは,講師がスポーツ選手でない100人の男子学生のBMIに関する解析を終えようとしている最中だからです。
講師はその平均値についてなんと発表するでしょうか。
再びベストな推測は26.0ですが,調査の結果は変動することがわかっています。
そして変動によって答えの確信度が薄れることも知っているので,答えを範囲で与えようと考えました。
しかしここで私たちは異なる個人(病的な様子の野蛮人やジャンクフード中毒のフットボールファンなど)の間のBMIがどう変わるのかではなく, BMIの平均が調査問でどう変わるのかを気にしています(ふとしたことから私たちは非常に多くの野蛮人のサンプリングを経験することになりますが)。
そのため,標準偏差ではなく標準誤差について考えたいと思います。
調査では,標準偏差をサンプルサイズの平方根で割った値である標準誤差は0.39です。
私たちの経験則では研究の結果の95%が平均値から標準誤差の2倍の範囲に入るので,講師の研究の結果は25.2から26.8の間にあるとすればそれが正しい可能性は大きいでしょう。
信頼区間と基準範囲
理由ははっきりしないのですが,私たちが個々の値について示した範囲は基準範囲とよばれ,研究結果の値の範囲は信頼区間とよばれます。
基準範囲はよく医師が使います。
例えば,血液中の何かの値,例えば白血球数などを検査して,それが基準範囲の外側にあった場合,医師はこの患者の白血球数は通常の値ではないと判断して,何が悪いのかさらに追加の検査を行おうと考えるでしょう。
信頼区間は研究の結果を解釈するのに役に立ちます。
例えば,「メンタリング」とよばれる教育指導プログラムが大学進学適性試験(SAT)のスコアに影響するかという研究について考察しているとします。
メンタリングによってSATのスコアが−2−10の95%信頼区間をもって4ポイント増加したという結果がわかりました。
明らかな点は,メンタリングによってスコアを悪化させることが実際あるということです(SATスコアが−2ポイント増加するということは2ポイント悪化することを意味します)。
そのため,私たちは学校にメンタリングの導入を勧めることはもちろんしないでしょう。
さらにこのメンタリングに関してさらなる研究を行わないことを提案するでしょう。
信頼区間は,メンタリングによるスコアの改善が,1600点満点で採点されるSATにおいて小さなベネフィットでしかなく,10ポイントを超えることはめったにないことを示しています。
つまり,メンタリングには学校全体への新プログラムとしてスタートするのに十分なベネフィットがないということです。
一方で,もし信頼区間が54まであったとしたら,メンタリングの効果についてはまだはっきりしないけれども,さらに研究を行うべきであることを結論付けるでしょう。
関連記事