カテゴリカル変数【多変量解析】

カテゴリカル変数【多変量解析】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

カテゴリカル変数|【多変量解析・統計学・統計解析】

カテゴリカル変数【多変量解析】


目次  カテゴリカル変数【多変量解析】

 

 

カテゴリカル変数

 

MRCにありがちな誤解として, MRCは連続尺度または比率尺度で測定した量的変数しか扱うことができないというものがある。

 

しかし。先述したように. MRCは多くのカテゴリカルな,または名義尺度水準の変数に対応している。

 

そのためには,カテゴリカル変数の変換が必要である(ダミーコーディングやエフェクトコーディング)。

 

たとえば,性別は二分割されたカテゴリカルな予測変数で,2つのカテゴリー。男性と女性からなっている。

 

男性の値を表現する(あるいはダミーコーディングする)のに1とし,女性を2としている。

 

女性に大きな値を与えているがそれは量的な解釈ができるものではない(たとえば,女性が男性より優れているという意味ではない)。

 

そこでは,数値は単純に数字が示す被験者が男性なのか女性なのかを表している。

 

2回目の研究で重回帰分析の中に入れたとき,性別に対する標準化されてない偏回帰係数は-7.4であった。

 

これは性別とIQに負の相関関係があることを示しており,全体的には,男性(1で表されている)が女性(2で表されている)よりも高いIQを示していることを意味する。

 

重回帰方程式によって予測されるIQスコアの女性の平均値は,全体のスコアから14.8 (偏回帰係数の-7.4に性別変数を掛けたもの,この場合は女性なので2を掛ける)を引いたものになっている.

 

それぞれの男性に対しては.全体の平均から7.4だけ引いたものになる.

 

だから,他のすべての状態(たとえばNARTや教育スコア)が同じであれば,男性は女性よりも高いIQであると予測される.

 

 

2つ以上のカテゴリーをもつカテゴリカルな予測変数の例が示されている.

 

ここでは社会経済的地位(SES)と家族構成(FAM)がいずれも3つのカテゴリーをもっている(たとえばFAMでは実の両親.片親.ステップファミリー).3つのカテゴリーは単に0. 1, 2と数字を与えられているわけではない.

 

なぜなら,これは特殊な量的順序を含意してしまうからだ(すなわち,ステップファミリーが他の2つよりも何か大きいことを表してしまう).

 

そうではなくて, FAMでは二値的なダミー予測変数に変換され,0はない,1はある,を意味するカテゴリーにされる.

 

たとえば, FAM1が1だったら,その学生の家族は生物学的な意味で自然なもので、0だったらそれは片親かステップファミリーである.

 

同様に. FAM2が1であれば,それは片親を表し,0であれば他の2つのカテゴリーであるとする.

 

この研究では3つのカテゴリーだけであったがFAM3を考えることもできる。

 

なぜなら. とFAM2のスコアを結合して,統合した第三のカテゴリーであるとするからだ.

 

つまり. FAM1で0でありFAM2で0であればステップファミリーである。

 

FAM1もFAM2も1であれば,それはステップファミリーではない.

 

しかしFAM3を回帰式に含めると.完全に多重共線性を引き起こす.

 

だから,2つのダミー変数. FAM1、FAM2だけが別々の予測変数として重回帰分析に含められる.

 

 

カテゴリカル変数【多変量解析】


セミナー詳細                    解析ご相談                    LINEでお友達

カテゴリカル変数【多変量解析】

カテゴリカル変数【多変量解析】