素点vs標準化!重回帰分析の活用術【ChatGPT統計解析】
重回帰分析(MRC)では、回帰方程式が基準変数を予測する基本的な結果となり、偏回帰係数や切片が導出される。回帰方程式には素点回帰式と標準化回帰式があり、素点回帰式は基準変数や予測変数の値をそのまま使用し、変換が不要で、単位に意味がある場合に適している。一方、標準化回帰式は変数をZ得点に変換し、予測変数の寄与を比較するのに有効だ。予測の精度を高めるには、観測されたデータから回帰係数を計算し、誤差の平方和を最小化する最小二乗解を求める必要がある。標準化回帰式は予測変数の寄与を比較しやすいが、素点回帰式は変数の変換が不要で、特定の単位に意味がある場合に有利である。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
予測を目的としたときの結果と解釈
重回帰方程式,偏回帰係数,切片
回帰方程式はMRC分析の最も基本的な結果だ。
それは基準変数に対する予測変数から得られるもので,今回の例ではIQを基準変数とし各予測変数に数字を掛けたものとして表される。
積は足し合わされる。
この変数に掛けられる数字を,専門的には偏回帰係数とか偏回帰の重みとよぶ。
しかし,多くのMRC分析の論文では,この「偏」が抜けている場合が多い。
こうしたときよく記載されている回帰(方程)式には。2種類の形式がある。
1つ目は素点回帰式であり。基準変数や予測変数の値は尺度の値をそのまま反映している。
標準化された形式を基準変数の予測に用いる場合には,予測変数のスコアをそれらの素点からZ得点に変換する必要がある。
結果の予測されたスコアもZ得点の形式になる。
予測変数と基準変数の得点に素点と標準得点のどちらを用いるかということに加え,回帰式における両者の形式はさらに2つの側面で異なっている。
偏回帰係数は絶対値としても潜在的な解釈としても異なっている。
また,素点の回帰係数は,切片とよばれる定数を含んでいる。
予測を目的にするなら,素点の回帰方程式が好ましい。
なぜなら,変数の変換を必要としないからだ。
これはとくに,素点の単位に意味があるときにそういえる(たとえば,教育年数や,発生回数,お金の単位など)。
しかし素点の回帰方程式のある変数に対する係数は,他の変数の係数と比較し,どちらが予測に役立つかを検証することはできない。
たとえば,2回目の導出研究,回帰方程式から得られた係数において,性別はIQの予測に対して,最も大きな寄与をしたわけではない。
貢献の大きさは教育, NARTの次である。
これは,標準化回帰方程式から得られた係数を使って順序づけられる。
もっとも,さまざまな予測変数の結合と比較しようとしたとき, MRCの結果の解釈において他にたくさんの複雑な問題が生じる。
説明を主目的とした研究ではこのような比較が一般的であるので,説明を目的としたMRCの使用の導入がなされるまでこれらの問題についての議論はおいておく。
回帰式を導出するためには,各参加者について得られている予測と基準との値のデータサンプルを取得することがまず必要である。
その後. MRCを実行して,係数が定まり(偏回帰係数と切片),観測された基準変数に可能な限り予測変数を近づけるように計算される(つまり予測の誤差が最も小さくなるようにする)。
すなわち. MRCは被験者を交えて,得られた基準変数と予測変数の間の差の平方和を最小化するような数値を選ぶのである(誤差の平方和を最小化する)。
この基準がよく知られた最小二乗解である。
重回帰分析(MRC)は、基準変数を予測するための最も基本的な手法であり、その結果として得られる回帰方程式は、予測変数と基準変数の関係を表す重要な要素である。この回帰方程式は、基準変数に対して各予測変数を掛け合わせた積を足し合わせる形で表され、これに切片と呼ばれる定数が加わる。予測変数に掛けられる係数は偏回帰係数と呼ばれ、予測変数が基準変数に与える独立した影響を示している。しかし、多くのMRC分析の論文では、この「偏」という言葉が省略されることが多い。MRC分析において得られる回帰方程式には2種類の形式があり、1つは素点回帰式で、もう1つは標準化回帰式である。素点回帰式は、基準変数や予測変数の値をそのまま使用するもので、これらの値が元の尺度を反映している。一方、標準化回帰式は、基準変数や予測変数の値をZ得点に変換して使用するものであり、結果として得られる予測値もZ得点の形式となる。この違いにより、それぞれの形式は異なる特性を持つ。素点回帰式は、変数の変換を必要としないため、単位に意味があるデータ(例えば、教育年数、発生回数、お金の単位など)を扱う場合に特に有効である。これに対して、標準化回帰式は、各予測変数の影響を比較する場合に適している。たとえば、ある研究で導出された素点回帰式では、性別がIQの予測に最も大きく寄与していないことが明らかになったが、この貢献度は教育年数やNARTに次ぐものであるといえる。このような貢献度の比較には、標準化回帰式から得られた係数が役立つ。標準化回帰式では、予測変数のスコアをZ得点に変換することで、それぞれの変数の寄与を直接比較できるからである。しかし、MRC分析を用いた結果の解釈には、さらに多くの複雑な問題が存在する。特に、異なる予測変数を組み合わせたり比較したりする場合、解釈の複雑さは増す。説明を目的とする研究では、これらの比較が一般的に行われるため、予測を主目的とした研究とは異なる観点が求められる。MRC分析を実施するためには、まず基準変数と予測変数の値が含まれるデータサンプルを取得する必要がある。このデータを用いて回帰分析を行い、最適な偏回帰係数と切片を求めるプロセスが始まる。このプロセスでは、予測変数を基に基準変数を可能な限り正確に予測するような係数を求めるため、誤差の平方和を最小化することを目的として計算が進められる。この計算は、最小二乗解として広く知られており、予測の精度を高めるための基盤となるものである。最小二乗解は、得られたデータに基づいて観測された基準変数と予測変数との間の差を最小化するものであり、これにより、観測値に最も近い予測値が得られる。このようにして求められた回帰係数は、研究者にとって非常に重要な情報となり、基準変数と予測変数の関係を具体的に理解するための指針となる。一方で、素点回帰式と標準化回帰式のどちらを選択するかは、研究の目的やデータの性質によって異なる。例えば、予測を主目的とする場合には素点回帰式が好ましいとされるが、これは変数の変換を必要とせず、元の単位で解釈が可能であるためである。また、素点の単位に特別な意味がある場合(たとえば、給与額や時間の長さなど)、そのままの値を利用できる素点回帰式は非常に有用である。しかしながら、素点回帰式では、異なる変数間でその影響力を比較することが難しいという制約がある。例えば、ある変数が他の変数よりも予測に有用であるかどうかを評価するためには、標準化回帰式を使用することが推奨される。これは、標準化回帰式がすべての変数を同一の尺度上に位置付けるためであり、この統一された尺度によって変数間の比較が可能となるからである。このような特性は、特に説明を主目的とした研究で役立つ。説明を目的とする研究では、各予測変数の寄与を詳細に比較し、解釈を深めることが求められるため、標準化回帰式の利点がより顕著になる。さらに、予測変数の相互作用や多重共線性といった問題も、MRC分析の結果を解釈する際に考慮すべき重要な要素である。例えば、多重共線性が高い場合、偏回帰係数の解釈が困難になることがあるため、このような問題を適切に処理する手法も検討される必要がある。最終的に、MRC分析を通じて得られる知見は、データの特性や研究の目的に応じて適切に活用されるべきであり、そのためには回帰方程式の形式や結果の解釈に関する深い理解が欠かせない。
関連記事