統計学における点双列相関係数|【統計学・統計解析講義基礎】
統計学における点双列相関係数
点双列相関係数は、二値変数と連続変数の関連尺度である。
数学的にはピアソンの相関係数と同等であるが、一方の変数が二値変数なので、異なる式を使って計算する。
性別(二値)と成人身長(連続)の関連の強さを求めたいとする。
点双列相関はピアソンの相関係数のように対称であるが、表記を簡単にするために、身長をX、性別をyで示し、yの符号は0=男性、1=女性とする。
男女の標本を抽出し、以下式に示す式を使って点双列相関を計算する。
点双列相関係数の式
この標本では、男性の平均身長は69.0インチ、女性は64.0インチ、身長の標準偏差は3.0インチ、標本の55%が女性であるとする。
性別と成人身長の相関は、以下式に示すように計算する。
性別と身長の点双列相関
−0.829の相関は強い関係であり、性別と成人身長には密接な関係があることを示している。
相関が負なのは、女性(平均身長が低い)を1、男性を0と符号化したからである。
符号化を逆にしたら、相関は0.829になる。
なお、この式で使用した平均と標準偏差は実際の値に近いので、性別と身長には実際にも強い関係がある。
関連リンク