Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における平均への回帰【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における平均への回帰【統計解析講義基礎】

統計学における平均への回帰【統計解析講義基礎】


統計学における平均への回帰【統計解析講義基礎】

 

プロ野球選手などで1年目に大活躍した選手は、多くの場合、2年目にはそれほど活躍せず、「2年目のジンクス」などと呼ばれます。また、非常に偉大な選手の子供は、たいていの場合、親ほどには活躍できません。

 

こうした現象について、たとえば「2年目のジンクス」については、相手チームが研究してきたからとか、慢心があったからとか、さまざまな理由説明は可能です。

 

しかし、実はこうした現象の原理は、「平均への回帰」(回帰効果、並に戻る効果)という統計概念で説明が可能なのです。

 

例えば、100人のプロ野球選手を、各年度の実績で1位から100位までランクづけたとしましょう。

 

このとき、ある年度に1位だった選手が次年度も1位、そして2位だった選手が次年度も2位、・・・というように年度を越えて順位がまったく同じということは普通考えられません。

 

順位は通常はある程度変動するものです。

 

ここで、ある年度に1位だった選手の順位が変動するとしたら、1位より上はないですから、その選手は順位を落とすしかありません。

 

逆にビリだった選手の順位が変動するとしたら、その選手は順位が上がるしかありません。

 

このことからわかるように、順位が変動するとしたら、つまり順位の間の相関関係が完全なものでないとしたら、ある年度に高い順位だった選手は次年度には順位が下がる可能性が高く、逆に低い順位だった選手は次年度には順位が上がる可能性が高いのです。

 

このように考えれば、「2年目のジンクス」はないほうが珍しいのです。むしろ自然な現象といえます。もちろん、ジンクスを感じさせないケースも皆無ではありません。

 

偉大な選手の子が親ほど偉大でないということも、親の成績と子の成績を、1年目の成績と2年目の成績に置き換えて考えれば、まったく同様に理解できます。

 

このように、2つのものの関係において、一方のもの(1年目の成績や親の成績)が高い値をとれば、他方のもの(2年目の成績や子の成績)は高い値をとらず、逆に一方のものが低い値をとれば、他方のものはそれほど低い値をとらないという傾向があります。

 

この傾向のことを、他方の値が平均のほうに戻る傾向(平均に回帰する傾向)という意味で、「平均への回帰」(回帰効果、回帰現象)と呼ばれます。

 

なお、「回帰分析」という統計手法の名称も、この言葉に由来しています。

 

「輪切り」進路指導の影響

 

回帰効果を具体的に考える例として、進路指導における「輪切り」の影響について考えてみましょう。

 

「輪切り」とは、たとえば高校進学において、中学卒業時の成績によって上位から順番に受験する高校を決めていくといったやり方であり、教育界では、生徒の興味関心や進学する学校の特徴を無視したものとして批判されてきたものです。

 

ここでは、そうした進路指導の是非を問題にするのではなく、そうやって進学する高校を成績順に決められた場合、進学した高校によって、高校卒業時点での学力に、どの程度の差が生じるかという問題を考えてみましょう。

 

図1は、横軸に中学校卒業時の学力偏差値、縦軸に高校卒業時の学力偏差値をとり、両者の間の相関係数が0.6という場合を想定して描いた散布図です。

 

横軸の成績によって、上位・中位・下位それぞれ3分の1ずつが、順にA高校、B高校、C高校に進学したものとします。

 

図中の「同偏差値の直線」より上の白丸は中学校時代より偏差値が上昇した生徒を表し、その直線より下の黒丸は低下した生徒を表しています。

 

この図をみると、学力上位のA高校の生徒は高校時代に偏差値が低下した者(黒丸)が多く、学力下位のC高校の生徒は逆に偏差値が上昇した者(白丸)が多いことがわかります。

 

このことは、中学校卒業時の成績から高校卒業時の成績を予測する回帰直線の傾きが、「同偏差値の直線」の傾きよりも小さくなっていることにも表れています。

 

その結果、図2のように、高校卒業時の学力偏差値の分布は高校間でかなり重複したものとなります。

 

中学校卒業時には分布が全く重ならなかったにも関わらず、そうなるのです。

 

この例はら、出身学校によって学力を判断することがいかに当てにならないかがわかるでしょう。

セミナー詳細こちら                    解析ご相談こちら


 

統計学における平均への回帰【統計解析講義基礎】

統計学における平均への回帰【統計解析講義基礎】

統計学における平均への回帰【統計解析講義基礎】