統計上の灯火管制|【統計学・統計解析講義応用】
統計上の灯火管制
二分法の大きな欠陥として,情報を捨て去るということがある。
この手法は,患者あるいは観察ごとに精確な数値を使うのではなく,観察されたものをグループに分けることで数値を捨て去ってしまうのだ。
これによって研究の検定力が下がってしまう。
多くの研究がもとから検定力が足りていない状況において,これは大きな問題となる。
測定しようとしている相関の推定の精確さが失われるし,多くの場合,効果量を小さく見積もることにもなる。
一般的に言えば,検定力と精確さがこのように失われることは,データの3分の1を捨て去るのと同じようなことになる。
肥満の健康への影響を測定する研究について考えてみよう。
例えば,患者をBMIに基づいて「正常」と「過体重」のグループに分けるとしよう。
BMIが25であるところを正常の範囲の最大値であるとするにれは臨床上の実践で用いられている標準的な分割点だ。
しかし,こうすると,この分割点より大きいすべてのBMIについて,違いが失われてしまう。
ここで,もし心臓病の割合が体重とともに増加するのであれば,割合がどれだけ増加するかを知ることがとても難しくなる。
というのも,わずかに過体重である患者と病的な肥満である患者の間の違いが記録されていないからだ。
他の見方から説明してみよう。「正常」なグループがBMIがちょうど24である患者から構成されていて,「過体重」のグループはBMIが26だったとしよう。
これら2つのグループの間に大きな違いがあれば. BMIがさして違わないのだから,驚くべきことになる。
逆に,「過体重」のグループのBMIがみな36だったとしたら,大きな違いでも,あまり意外なものではなくなる。
そして、BMIの1単位あたりの違いがずっと小さくなっていることが示唆されることになる。
二分法はこの違いを消してしまい,有用な情報と検定力を失わせてしまう。
もしかしたら,2つのグループしか使わなかったのが馬鹿げた選択だったのかもしれない(例えば,低体重の患者はどうだろうか)。
だが,グループの数を増やせば,個々のグループの患者の数が減ることになる。
グループを増やすことでより詳細な分析ができるかもしれないが,各グループの心臓病の割合の推定量が少数のデータに基づくものとなってしまって,信頼区間は広くなる。
そして,データを多くのグループに分けようとすればするほど,どこでデータを分けるのかという判断が増えることになる。
そして,このことは,異なった研究を比較することを一層困難にし,研究者が偽陽性を作り出すことを一層容易にするのだ。
関連記事