平均への回帰の例|【統計学・統計解析講義応用】
平均への回帰の例
ある量を経時的に追いかけることを考えよう。
ビジネスの業績,ある患者の血圧など,時間が経つにつれて変化するものなら何でもかまわない。
日付を1つ決めて,そのときに目立つ対象をすべて選ぼう。
最高の収益を得ている部類のビジネス,最も高血圧となっている部類の患者といったものだ。
こうした対象を次に測定したとき,何か起きるだろうか。
確かに最もうまくやっているビジネス、慢性的高血圧の患者はすべて選んでいる。
だが,通常ではありえないくらい運がよかった四半期を経験したビジネスや,特にストレスが強い週を経た患者も選んでしまっている。
こうした幸運な対象や不幸な対象は永遠に例外的な状況にとどまるわけではないだろう。
こうした対象を数か月後にまた測定すれば,通常の状況に戻っているはずだ。
この現象は,平均への回帰(regression to the mean)と呼ばれる。
これは血圧やビジネスに限られた特別な性質ではない。
これは,幸運は永遠に続かないということを述べたに過ぎない。
平均的に言えば,個々人の運は平均的なのだ。
フランシス・ゴルトンはこの現象を早くも1869年に確認している。
ゴルトンは,著名で傑出した人々の家系をたどった際に,著名な人々の子孫は著名でなくなる傾向があることに気づいた。
著名人の子どもは,親を著名にした音楽や知能に関する卓越した遺伝子を引き継いだかもしれないが,親と同じぐらい著名であることはまれだった。
後の調査で,身長にも同様のふるまいがあることが明らかになった。
並外れて背の高い親から生まれた子どもは親よりも平均的な身長になっていたし,並外れて背の低い親から生まれた子どもは通常親よりも高い身長になっていた。
血圧の例に戻ろう。
高血圧の患者を抽出して,実験的な薬を試すとする。
血圧が高くなっているように見える理由にはさまざまなものがある。
例えば,遺伝子が悪いのかもしれないし,普段の食事が悪いのかもしれないし,日取りが悪いりかもしれない。
あるいは測定誤差かもしれない。遺伝子や普段の食事はほとんど変化しないものだが,他の要因は測定された血圧が日ごとに変わる原因となりえる。
高血圧の患者を抽出したとき,そうした患者の多くが,単に日取りが悪かったか,血圧を測るときに腕に巻き付ける布である加圧帯が正しく調整されていなかっただけだったという可能性もある。
遺伝子は一生つきまとうものだが,正しく調整されていない加圧帯はそうではない。
運の悪かった患者の運は,その患者の治療が行われたかどうかに関係なく,すぐにまずまずのところまで回復する。
この実験は,単に被験者を選ぶ際に使った基準によって,血圧改善の効果を発見する方向に偏ることになる。
治療の効果を正確に推定するには,治療を行う処置群と治療を行わない統制群に標本をランダムに分ける必要がある。
処置群の血圧改善の平均が,統制群よりも相当良いものだったときにだけ,治療が功を奏したと主張できるのだ。
平均への回帰のもう1つの例がテストの得点だ。
検定力についての章で,個々の生徒の運が学校の結果の平均に大きな影響を与えるような小規模の学校では,ランダム変異が大きいことについて論じた。
このことは,生徒の良さ,教師の良さ,そして運の良さが組み合わさった成績の最も良かった学校において,次年度の成績低下が予想されることを意味する。
こうなるのは,単に幸運というものが一瞬のものであるためだ。
不運についても同様だ。
成績の最も悪かった学校は次年度の改善が予想される。
このことは,学校の管理者にとっては自らの介入が功を奏したと納得させるものになるだろうが,実際には単に平均への回帰が起きただけに過ぎないのかもしれない。
最後に, 1933年という数理統計学の幼年時代にさかのぼる有名な例を挙げよう。
ホレス・シークリストというノースウェスタン大学の統計学の教授が,『ビジネスにおける平凡さの勝利』という本を出版し,非常に成功したビジネスはあまり成功しないようになる傾向があり,成功しなかったビジネスは成功するようになる傾向があるということについて論じた。
つまり,ビジネスは平凡に向かう傾向があるということを示したのだ。
シークリストの議論によれば,これは統計による仮構の存在ではなく,競争市場の力が作り出したものだという。
シークリストは,大量のデータと多数の図を使用しただけでなく,ゴルトンの平均への回帰に関する業績までも引いて,自分の議論を立証しようとした。
明らかにシークリストはゴルトンの論点を理解していなかったのだ。
シークリストの本は,「ジャーナル・オブ・ジ・アメリカン・スタティスティカル・アソシエーション」で,ハロルド・ホテリングという影響力の大きな数理統計学者によって批評された。
ホテリングは,誤謬を指摘した上で,同じデータを使ってビジネスは平凡から離れていく傾向にあることを簡単に示せると述べた。
最も良かったビジネスとその後の衰退を取り出すかわりに,最も良くなる前の成長を追うのだ。
そうすれば,決まって成長していることが分かるだろう。
シークリストの議論は「本当は,問題となっている比率がふらつく傾向があるということ以外,何も示していない」のだ。
関連記事