平均への回帰:ジンクスを科学で解明!【ChatGPT統計解析】

平均への回帰:ジンクスを科学で解明!【ChatGPT統計解析】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

平均への回帰:ジンクスを科学で解明!【ChatGPT統計解析】

平均への回帰:ジンクスを科学で解明!【ChatGPT統計解析】
平均への回帰は、一方が極端な値を示した場合、他方は極端でない値をとる傾向を指す。例としては「2年目のジンクス」や親の成績と子の成績の関係があり、統計学での回帰効果で説明される。この現象は、順位や成績が完全に一致することは稀で、変動が普通であるために生じ、高い成績を持つ者は下がりやすく、低い成績を持つ者は上がりやすい。また、「輪切り」進路指導の例では、学力の平均への回帰が示され、高校間での学力分布が重複することから、出身学校による学力判断の不確実性が示される。


目次  平均への回帰:ジンクスを科学で解明!【ChatGPT統計解析】

 

平均への回帰:並に戻る効果

 

プロ野球選手などで1年目に大活躍した選手は、多くの場合、2年目にはそれほど活躍せず、「2年目のジンクス」などと呼ばれます。また、非常に偉大な選手の子供は、たいていの場合、親ほどには活躍できません。

 

こうした現象について、たとえば「2年目のジンクス」については、相手チームが研究してきたからとか、慢心があったからとか、さまざまな理由説明は可能です。

 

しかし、実はこうした現象の原理は、「平均への回帰」(回帰効果、並に戻る効果)という統計概念で説明が可能なのです。

 

例えば、100人のプロ野球選手を、各年度の実績で1位から100位までランクづけたとしましょう。

 

このとき、ある年度に1位だった選手が次年度も1位、そして2位だった選手が次年度も2位、・・・というように年度を越えて順位がまったく同じということは普通考えられません。

 

順位は通常はある程度変動するものです。

 

ここで、ある年度に1位だった選手の順位が変動するとしたら、1位より上はないですから、その選手は順位を落とすしかありません。

 

逆にビリだった選手の順位が変動するとしたら、その選手は順位が上がるしかありません。

 

このことからわかるように、順位が変動するとしたら、つまり順位の間の相関関係が完全なものでないとしたら、ある年度に高い順位だった選手は次年度には順位が下がる可能性が高く、逆に低い順位だった選手は次年度には順位が上がる可能性が高いのです。

 

このように考えれば、「2年目のジンクス」はないほうが珍しいのです。むしろ自然な現象といえます。

 

もちろん、ジンクスを感じさせないケースも皆無ではありません。

 

偉大な選手の子が親ほど偉大でないということも、親の成績と子の成績を、1年目の成績と2年目の成績に置き換えて考えれば、まったく同様に理解できます。

 

このように、2つのものの関係において、一方のもの(1年目の成績や親の成績)が高い値をとれば、他方のもの(2年目の成績や子の成績)は高い値をとらず、逆に一方のものが低い値をとれば、他方のものはそれほど低い値をとらないという傾向があります。

 

この傾向のことを、他方の値が平均のほうに戻る傾向(平均に回帰する傾向)という意味で、「平均への回帰」(回帰効果、回帰現象)と呼ばれます。

 

なお、「回帰分析」という統計手法の名称も、この言葉に由来しています。

 

 

「輪切り」進路指導の影響

 

回帰効果を具体的に考える例として、進路指導における「輪切り」の影響について考えてみましょう。

 

「輪切り」とは、たとえば高校進学において、中学卒業時の成績によって上位から順番に受験する高校を決めていくといったやり方であり、教育界では、生徒の興味関心や進学する学校の特徴を無視したものとして批判されてきたものです。

 

ここでは、そうした進路指導の是非を問題にするのではなく、そうやって進学する高校を成績順に決められた場合、進学した高校によって、高校卒業時点での学力に、どの程度の差が生じるかという問題を考えてみましょう。

 

図1は、横軸に中学校卒業時の学力偏差値、縦軸に高校卒業時の学力偏差値をとり、両者の間の相関係数が0.6という場合を想定して描いた散布図です。

 

平均への回帰:ジンクスを科学で解明!【ChatGPT統計解析】

 

横軸の成績によって、上位・中位・下位それぞれ3分の1ずつが、順にA高校、B高校、C高校に進学したものとします。

 

図中の「同偏差値の直線」より上の白丸は中学校時代より偏差値が上昇した生徒を表し、その直線より下の黒丸は低下した生徒を表しています。

 

この図をみると、学力上位のA高校の生徒は高校時代に偏差値が低下した者(黒丸)が多く、学力下位のC高校の生徒は逆に偏差値が上昇した者(白丸)が多いことがわかります。

 

このことは、中学校卒業時の成績から高校卒業時の成績を予測する回帰直線の傾きが、「同偏差値の直線」の傾きよりも小さくなっていることにも表れています。

 

その結果、図2のように、高校卒業時の学力偏差値の分布は高校間でかなり重複したものとなります。

 

平均への回帰:ジンクスを科学で解明!【ChatGPT統計解析】

 

中学校卒業時には分布が全く重ならなかったにも関わらず、そうなるのです。

 

この例から、出身学校によって学力を判断することがいかに当てにならないかがわかるでしょう。

 

ChatGPTに聞いてみた

プロンプト

あなたは最高のデータサイエンティストです。
平均への回帰について解説してください。
#制約条件:
サルでもわかる平易な日本語で
文字数は300字程度

ChatGPTの回答

平均への回帰とは、物事がその普通の状態に戻ろうとする考え方です。たとえば、とても良い成績を取った学生がいたとします。次のテストでは、その成績が少し下がって、普通の範囲に戻るかもしれません。逆に、とても悪い成績を取った学生がいた場合、次のテストでは改善されて普通に戻る可能性があります。これは、例外的な事象がずっと続かないという考えです。サッカーの試合でたくさんゴールを決めた選手も、次の試合では平均的な成績に戻ることが多いです。この原理は、学校のテストからスポーツ、ビジネスの世界まで、いろいろな場面で見られます。つまり、とても良いことや悪いことが起きた後は、状況が普通の状態に戻る傾向があるということです。

 

 

平均への回帰:ジンクスを科学で解明!【ChatGPT統計解析】


セミナー詳細                    解析ご相談                    LINEでお友達

平均への回帰:ジンクスを科学で解明!【ChatGPT統計解析】

平均への回帰:ジンクスを科学で解明!【ChatGPT統計解析】