重相関係数と重決定係数|【多変量解析・統計学・統計解析】
重相関係数と重決定係数
MRCでは基準変数を一方に重みづけられた積和の形で表現された回帰式をもう一方においたときの関係の強さを示す指標が提供される。
別の言い方をすれば観測された基準変数と回帰方程式で予測されたスコアの間の相関関係ともいえる。そ
れは0から1の範囲の値をとり,0は実際の得点と予測得点にまったく関係がないことを,1は両者が完璧に関係していること(完全予測)を示す。
重相関係数の意味はもっと簡単に把握できる。
重相関係数の重みづけ積和の予測変数によって,基準変数の分散が説明される割合を示している。
言い換えれば,基準変数における個人間の差(たとえば分散)が,重回帰方程式によって見いだされた予測変数の結合によって,どの程度予測可能かを表している。
最初の導出研究における例では0.68が0.46だった。
これが示すのはIQにおける46%の分散が,NARTと敦育によって説明できるということであり、54%がこれらの変数では予測できないことを意味している。
これらの結果で縮小がどれぐらい生じたかを評価するため,交差妥当性研究が実施された。
最初の交差妥当性研究の結果では,交差妥当性の値が得られた。
これらは@導出研究の回帰式に基づいて予測された,新しい被験者サンプルに対する予測尺度得点と, Aそれらの被験者の実際の尺度得点の相関を求めることで得られる。
交互妥当性研究における値は導出研究での対応する値とほぽ等しい。
新しい被験者サンプルに対して重回帰式を適用した際のこれらの値がほとんど変化しなかった(つまり,縮小した可能性がなかった)ため,この式が同じ母集団をもつ他のサンプルにおいてもIQスコアの50%近くを予測するということに,十分な信頼性が得られたといえる。
例1の調査者らは,これらの予測変数を用いた予測の期待度に対する彼らの結論の土台をつくるため,さらに多くの情報を入手しようとした。
すなわち。二重交差妥当性研究を行った。
新たな導出研究における値は一度目の導出研究と比べてわずかに大きかった。
二度目の研究における相互検証では,導出研究における値が75であるのに対して相互検証の値が68を示し,わずかに縮小する可能性がみられた。
しかし最初の交差妥当性研究から得られた値とがだいたい同じ程度の縮小だった。
こうした調査結果の一貫性を考えるとこれらの予測変数の組み合わせによって,この母集団のIQスコアの分散の約50%を予測可能であるという信頼性の高い結論を得ることができたといえる。
もちろん基準変数の分散の50%弱が予測できるだろう。
またこの分散の50%強は予測できないのだろう,という使い方を結論とすることは,応用場面における決定にさまざまな効果をもたらし,それに続く結果の基礎を形作るべき判断基準になる。
導出研究における重回帰式が予測に関して事実上同一の相互検証レベルを示したことを考えると,どの式を使用するかという問題が残る。
例1に示された結果からはどの式が用いられても違いはないように思われる。
どの重回帰式を使用するかについてはいろいろな考え方がある。
関連記事