MRCによる多変量回帰/相関の予測力|重回帰方程式:線形結合された説明変数と目的変数【統計学・統計解析講義基礎】
多変量の回帰/相関の予測力が二変数の回帰/相関よりも強くなることは、複数の予測因子による予測の絶対的水準が、それぞれを単独で用いた場合よりも少なくとも同程度に良い。MRCは線形結合された説明変数と目的変数の間の関係、重回帰方程式について、どの程度予測が正確なのかも推定する
目次 MRCによる多変量回帰/相関の予測力|重回帰方程式:線形結合された説明変数と目的変数【統計学・統計解析講義基礎】
MRCによる多変量回帰/相関の予測力
重回帰分析と相関分析(MRC:Multiple Regression and Correlation)を実践的な予測目的で使うのは、最も一般的には教育とか、職業とか、法医学とか、臨床的な場面でしょう。
説明変数のセット、たとえば、デモグラフィック要因とか、テストの得点、行動の観察などが、他の重要な出来事や行動、いわゆる目的変数(たとえば学校の成績、仕事の成績、暴力や自殺企図、テストの得点など)を予測するのに有用かどうかを推定するために用いられます。
多変量の回帰/相関の予測力が二変数の回帰/相関よりも強くなることは、複数の予測因子による予測の絶対的水準が、それぞれを単独で用いた場合よりも少なくとも同程度に良いということです。
そして、ほとんどの場合より良くなることが容易に見てとれます。
たとえば、大学院での成功基準を予測しようとすると、学部の学年とGREスコアを使ったほうが、学年変数1つだけを説明変数としてやるよりもよい予測ができます。
少なくとも、それと同程度にはなります。
もしも学部の成績に加えてGRE(Graduate Record Examinations)のスコアを予測に用いることに意味がなかったとしても、MRCに含まれているGREのスコアは無視されるだけで、最終的な正確さが損なわれることはありません。
さらに言えば、成績で予測されていないGREの何らかの予測効果が、予測精度を向上させるようにはたらくでしょう。
重回帰方程式:線形結合された説明変数と目的変数
しかし、不必要に説明変数を増やすことは避けなければなりません(たとえば、他の説明変数以上に意味のある予測をしないような変数を増やさないことです)。
なぜなら追加された説明変数それぞれがもつ、サンプル固有の特性による影響が生じる可能性が、増加してしまうからです。
予測するための線形式、すなわち重回帰方程式という、2つ以上の変数に重みづけをして足し合わせたものを導くためにMRCが使われるものを導出研究(derivation study)と呼びます。
この式は、説明変数のスコアが目的変数のスコアを最も正確に予測するように結合したものです。
また、重回帰分析と相関分析(MRC)はこの線形結合された説明変数と目的変数の間の関係について、どの程度予測が正確なのかも推定します。
関連リンク