不必要な二分法|【統計学・統計解析講義応用】
不必要な二分法
ありふれた単純化の手法として,連続的な測定がなされたものを2つの別々のグループに分けるという変数の二分(dichotomization)が挙げられる。
例えば,肥満の研究の例では,患者を「健康」なグループと「過体重」のグループに分けることになるかもしれない。
データをこう分けることで,正しい回帰モデルを選ぶことについて余計な心配をしなくてもよくなる。
t検定を使って2つのグループを比較するだけで済むのだ。
このことは,データを分ける場所をどうやって決めるのかという問題を生む。
自然に分かれる場所が存在するかもしれないし,肥満のように広く認められた定義が存在するかもしれない。
だが,そういったものはしばしば存在しない。
ありふれた解決方法として,データを標本の中央値で分けるというものがある。
この方法は,中央値分割(median split)と呼ばれ,データを同じ大きさの2つのグループに分ける。
この方法の問題点としては,同じ現象を研究している他の研究者が別のところで分けることになるため,メタ分析をするときに結果を比較したり集計したりすることが難しくなることが挙げられる。
中央値分割の代替手段として,グループ間のp値が最小になるような分割点を選ぶというものがある。
これは,グループ同士が最も異なったものになるようにグループ分割方法を選ぶものと考えてよいだろう。
想像がつくかもしれないが,この手法は偽陽性の可能性が高くなる。
最も良いp値になる分割点を探すことは,本質的には,望む結果が得られるまで数多くの仮説検定を実施することを意味する。
ここからもたらされる結果は前に多重比較について見たときと同じだ。
つまり,偽陽性率が10倍になるのだ。
効果量の信頼区間も誤解を招くほど狭いものになるだろう。
二分法の問題は,S期比率を研究した1990年代初めの乳ガンに関する多数の論文で生じていた。
S期比率とは,腫瘍の中で,活発に新しいDNAを複製・合成している細胞の割合を指す。
腫瘍学者はこの比率でガンの最終的な推移を予測できるかもしれないと考えていた。
予測できれば,医者は患者に対する治療をさらに効率的に行えることになる。
この問題を研究する科学者は,患者をS期比率が高いグループと低いグループの2つに分けた。
当然,「高い」と「低い」の分割点としては,p値が最も良くなる場所か中央値が採用され,研究によって異なるものが選ばれることになった。
案の定,「最適」な分割点を選んだ研究では統計的に有意な結果が得られた。
だが,多重比較を説明するための修正がなされると,どれも統計的に有意にならなかった。
それどころか,さらなる研究でも,S期比率と腫瘍の経過の予測の関係が示されつづけたのだが,その根拠は長らく貧弱なものだった。
例の方法は,その欠陥が公になった後も,何年かの間,ガン研究で使われつづけた。
ガンの予測因子研究に関する2005年の報告ガイドラインでは,「腫瘍学における腫瘍マーカーについて長年の研究と数百件の報告があるにもかかわらず,臨床的に有用なものとして明らかになったものは話にならないほど少ない」と指摘されている。
この問題の主な理由としては,検定力が足りないことのほかに,不完全な結果報告,標本抽出の偏り,「最適」な分割点の選び方が挙げられている。
関連記事