予測変数の影響|【多変量解析・統計学・統計解析】
予測変数の影響
しかし,後に議論するように,不必要に予測変数を増やすことは避けなければならない(たとえば,他の予測変数以上に意味のある予測をしないような変数を)。
なぜなら追加された予測変数それぞれがもつサンプル個有の特性による影響が生じる可能性が,増加してしまうからだ。
予測するための線形式,すなわち重回帰方程式という2つ以上の変数に重みづけをして足し合わせたものを導くためにMRCが使われるものを導出研究(derivation study)という。
この式は,予測変数のスコアが基準変数のスコアを最も正確に予測するように結合したものである。
また, MRCはこの線形結合された予測変数と基準変数の間の関係について,どの程度予測が正確なのかも推定する。
導出研究における線形方程式は。その研究のサンプルに合わせて「カスタムメイド」されているため,違うやり方で入手した他のサンプルを予測するのは期待できない。
つまり,予測の正確さと関係の強さは他のサンプルにその方程式が使われたとき,縮小(shrinkage)してしまう。起こりうる縮小の量を見積もるには2つの方法がある。
1つの方法は,次の例で示すように,交差妥当性研究とよばれる第二の研究を行うことだ。
そこでは新しいサンプルを集めて,元の研究から得られた式が,異なる母集団からのサンプルに対してどの程度正確に予測するかを検証する。
これは反復研究ではないことに留意すべきであり,第二の重回帰分析の結果はたんに元の結果と比較されるわけではない。
むしろ,最初の分析が新しいサンプルからのデータを使って評価されると考えたほうがいい。
縮小する量を判別するための2つ目の方法は,任意の式を用いて推定値を得ることである。
これは縮小式(shrinkage formulas)とよばれるものを被験者の数と同じぐらい,予測変数のために集めることである。
関連記事