重相関係数と重決定係数で探る予測精度の秘密【ChatGPT統計解析】
重相関係数は観測された基準変数と回帰式で予測されたスコア間の相関を示す指標で、0から1の値をとり、0は無関係、1は完全予測を意味する。また、重決定係数は予測変数が基準変数の分散をどれだけ説明するかを示す。研究例では、IQ分散の46%がNARTと敦育で説明可能で、交差妥当性研究によりその信頼性が確認された。二重交差妥当性研究でも結果の一貫性が示され、IQスコアの分散の約50%を予測可能であるという結論が得られた。どの回帰式を使用するかは大きな差がないとされるが、適切な選択は応用場面の決定基準に影響を与える。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
重相関係数と重決定係数
MRCでは基準変数を一方に重みづけられた積和の形で表現された回帰式をもう一方においたときの関係の強さを示す指標が提供される。
別の言い方をすれば観測された基準変数と回帰方程式で予測されたスコアの間の相関関係ともいえる。そ
れは0から1の範囲の値をとり,0は実際の得点と予測得点にまったく関係がないことを,1は両者が完璧に関係していること(完全予測)を示す。
重相関係数の意味はもっと簡単に把握できる。
重相関係数の重みづけ積和の予測変数によって,基準変数の分散が説明される割合を示している。
言い換えれば,基準変数における個人間の差(たとえば分散)が,重回帰方程式によって見いだされた予測変数の結合によって,どの程度予測可能かを表している。
最初の導出研究における例では0.68が0.46だった。
これが示すのはIQにおける46%の分散が,NARTと敦育によって説明できるということであり、54%がこれらの変数では予測できないことを意味している。
これらの結果で縮小がどれぐらい生じたかを評価するため,交差妥当性研究が実施された。
最初の交差妥当性研究の結果では,交差妥当性の値が得られた。
これらは@導出研究の回帰式に基づいて予測された,新しい被験者サンプルに対する予測尺度得点と, Aそれらの被験者の実際の尺度得点の相関を求めることで得られる。
交互妥当性研究における値は導出研究での対応する値とほぽ等しい。
新しい被験者サンプルに対して重回帰式を適用した際のこれらの値がほとんど変化しなかった(つまり,縮小した可能性がなかった)ため,この式が同じ母集団をもつ他のサンプルにおいてもIQスコアの50%近くを予測するということに,十分な信頼性が得られたといえる。
例1の調査者らは,これらの予測変数を用いた予測の期待度に対する彼らの結論の土台をつくるため,さらに多くの情報を入手しようとした。
すなわち。二重交差妥当性研究を行った。
新たな導出研究における値は一度目の導出研究と比べてわずかに大きかった。
二度目の研究における相互検証では,導出研究における値が75であるのに対して相互検証の値が68を示し,わずかに縮小する可能性がみられた。
しかし最初の交差妥当性研究から得られた値とがだいたい同じ程度の縮小だった。
こうした調査結果の一貫性を考えるとこれらの予測変数の組み合わせによって,この母集団のIQスコアの分散の約50%を予測可能であるという信頼性の高い結論を得ることができたといえる。
もちろん基準変数の分散の50%弱が予測できるだろう。
またこの分散の50%強は予測できないのだろう,という使い方を結論とすることは,応用場面における決定にさまざまな効果をもたらし,それに続く結果の基礎を形作るべき判断基準になる。
導出研究における重回帰式が予測に関して事実上同一の相互検証レベルを示したことを考えると,どの式を使用するかという問題が残る。
例1に示された結果からはどの式が用いられても違いはないように思われる。
どの重回帰式を使用するかについてはいろいろな考え方がある。
重相関係数および重決定係数は、多変量解析における回帰分析の重要な指標として用いられる。重相関係数は、基準変数(目的変数)とその変数を説明するために用いられる予測変数(説明変数)との間の相関の強さを示す。これは、観測された基準変数と回帰式で予測されたスコアとの間の相関係数であり、0から1の範囲をとる。具体的には、0は観測された基準変数のスコアと回帰式で予測されたスコアの間に全く関係がないことを示し、1は両者が完全に一致する、すなわち予測が完璧であることを意味する。一方で、重決定係数(R2)は、基準変数の分散が予測変数によってどの程度説明されるかを示す指標であり、これも0から1の範囲をとる。言い換えれば、R2は基準変数における個人間のばらつき(例えば分散)が、重回帰式によって見いだされた予測変数の結合によってどれだけ説明可能かを表している。例えば、ある導出研究の結果で重決定係数が0.46であれば、基準変数の分散の46%が予測変数によって説明可能であることを示し、残りの54%はこれらの変数では予測できないことを意味する。これらの指標は、回帰モデルの適合度を評価する上で不可欠である。
さらに、重回帰モデルの信頼性を評価するために交差妥当性研究が行われることがある。この方法では、最初の導出研究で構築された回帰式を用いて、新しい被験者サンプルに対する予測尺度得点と、実際の得点との相関を測定することで、予測モデルの妥当性を確認する。例えば、ある研究において重回帰モデルの導出研究での重相関係数が0.68だった場合、交差妥当性の結果がほぼ同じ値であれば、そのモデルが新しいサンプルにも適用可能であるという信頼性が得られる。一方で、交差妥当性の値が大幅に低下した場合、モデルが過学習している可能性があり、実際の応用においては慎重な再検討が必要となる。このような方法により、重回帰モデルが新しいデータに対しても同様の予測性能を示すことが確認される。
例として、ある研究ではNARTと敦育という2つの予測変数を用いてIQスコアを予測した。この研究では、基準変数であるIQスコアの分散の46%が予測変数によって説明可能であり、残りの54%はこれらの変数では説明できないとされた。これに基づいて実施された交差妥当性研究では、導出研究の回帰式に基づいて新しい被験者サンプルを予測した結果、実際のスコアと予測スコアの相関がほぼ一致していた。これにより、このモデルが新しいサンプルに対しても同じ母集団内で高い予測能力を持つことが示された。
さらに信頼性を高めるために、二重交差妥当性研究が行われる場合もある。この方法では、最初の導出研究と別の導出研究を行い、それぞれの回帰式を新しいサンプルに適用して交差妥当性を評価する。例えば、ある二重交差妥当性研究において、最初の導出研究での重決定係数が0.46、二度目の導出研究ではわずかに高い0.50という結果が得られた場合、両者の間に大きな差がないことが確認された。また、二度目の交差妥当性研究では、最初の導出研究に基づく重回帰式の値が新しいサンプルに対してもほぼ一致しており、モデルの信頼性がさらに強化された。この結果は、重回帰モデルがこの母集団においてIQスコアの分散の約50%を予測する能力を持つという高い信頼性を示している。
こうした分析結果の一貫性を考慮すると、予測変数の組み合わせが適切に選ばれている場合、母集団の分散の一定割合を予測可能であるという結論が得られる。ただし、重相関係数や重決定係数が示す結果をどのように解釈し、応用場面においてどのように活用するかについては慎重な検討が必要である。例えば、基準変数の分散の50%弱が予測可能であるという結論を基に応用場面での意思決定を行う場合、それが最終的な結果にどのような影響を及ぼすかを事前に十分に評価する必要がある。また、重回帰モデルが示す結果に基づいて判断基準を構築する際には、その限界を認識し、予測可能でない分散部分に対する補足的な検討を行うべきである。
さらに、導出研究における重回帰式が予測性能に関してほぼ同一の交差妥当性レベルを示した場合、どの回帰式を採用するかについて議論が必要となる。一部の研究者は、最初の導出研究の結果に基づいて回帰式を選択することを推奨しており、他の研究者は新たなデータに対する適用性をより重視する。これに関連して、回帰式の選択における柔軟性や適合性を高めるために、新しい統計手法やモデリング技術が導入されることもある。
最後に、予測変数の選択とモデルの構築において、理論的背景や実際のデータに基づいた慎重な判断が重要である。例えば、ある予測変数が基準変数の分散に大きな影響を与える場合、その変数を含めることでモデルの予測性能が大幅に向上する可能性がある。一方で、予測変数を増やしすぎるとモデルが複雑になりすぎ、過学習のリスクが高まる。そのため、重相関係数や重決定係数の解釈に加えて、交差妥当性や二重交差妥当性の結果を総合的に検討し、モデルの適合性と汎化能力をバランスよく評価することが求められる。このようにして、重回帰分析を通じて得られた知見が、実際の応用場面や研究課題の解決に貢献することが期待される。
関連記事