誤差(残差)得点についての仮定|【多変量解析・統計学・統計解析】
誤差(残差)得点についての仮定
すでに標準誤差の推定の節で述べたように,誤差,すなわち残差得点は,被験者によって実際に観測された基準変数のスコアと,回帰方程式を使って被験者から予測したスコアの間のズレのことである。
統計的理由かつ解釈上のさまざまな理由によって,こうした誤差得点は.
@平均がゼロで、
A等分散性があり(すなわち,全予測変数の分散が等しい)、
B予測変数は相互に無相関であり、
C正規分布に従う,のが最良とされている。
さらに,外れ値の存在や極端な残差得点は望ましくない影響を引き起こす。
こうした誤差得点についての特徴は. MRCを評価するときに使えるし,こうした仮定から少し逸脱するぐらいなら,大きな問題にはならない。
さらに,刊行された論文は、ときおりこうした問題を評価するのに必要な情報を載せている。
だから,それらはここでは長々と論じないことにする。
しかし,その他の2つの仮定、すなわち誤った定式化と測定誤差については,本章で記載されている重要な注意点のほとんどに関与しているので,この2つのカテゴリーの仮定について論じよう。
誤った定式化
以下にあげる要件のいずれかに反する場合,誤った定式化が生じる。
@変数どうしの関係は線形でなければならない、
Aすべての関係のある予測変数が分析に含まれていなければならない、
B関係ない予測変数は含まれてはならない。
最初の要件については. MRCは予測変数と基準変数の間に線形か曲線関係を想定している。
MRCにおいては線形関係のみが検出されるが,予測変数どうしの非線形関係および相互作用は,特定の変換を行うことで対応可能である。
定式化に関する残り2つの要件が設けられる主要な理由は. MRCで算出される指標のすべてが1つの重要な予測変数が分析に加わるだけで,劇的に変化してしまうことがあるからである。
だから,もし重要な変数が含まれていなかったら,得られた重回帰分析の指標は誤解を招くものになる。
無関係の変数を含むこともまた指標の値に影響を与えるが,もし本当に無関係な変数であればその影響は小さくてすむだろう。
しかし,無関係の変数が多すぎたら。統計的な有意差や交差妥当性を見出すのがむずかしくなる。
経験的あるいは理論的な検討によって, MRCにおいて使われる予測変数が選択される。
純粋に経験的な手続きについてのいくつかの反論,すなわち。理論的考察を伴わない単独で,経験的な手続きだけをとる問題についてはすでに論じた通りである。
こうした反論はMRCが説明目的で使われるときに,より重要になってくる。
純粋に経験的に予測変数を選択することは,あらゆる理論的変数,無関係な予測変数を排除してしまい,誤解を生むような、あるいは再現できないような結果を生み出してしまう。
純粋に経験的な選択というのはおそらく仮説を生み出すときにだけ使われるべきであり,そのときはおもな問題についてほとんど知識がないわけだから,結果は十分な注意をもって解釈されるべきである。
MRCにおける誤った定式化を避けるために最も有効な方法は,検証されるべき仮説と研究に含まれる変数の両方を管理するために,興味のある現象についてのフォーマルな理論を用いることである。
誤った定式化は,現象に対する理論が弱いときに最も問題になるとされている。
このようなケースでは. MRCの結果は決定的なものというよりもむしろ示唆的なものとして扱われるべきである。
しかし,理論や仮説がより高度に,経験的になるにつれて,追加の研究に含まれる変数の推定は改善され,結果の解釈の信頼性も,それに応じて増加するはずである。
関連記事