Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における相関係数の求め方【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における相関係数の求め方【統計解析講義基礎】

統計学における相関係数の求め方【統計解析講義基礎】


統計学における相関係数の求め方【統計解析講義基礎】

 

相関関係の強さを表すのに、相関係数(correlation coefficient)を用います。

 

この値は、-1から1までの範囲の符号と大きさをとります。

 

一般的に言えば、次のような関係になります。

 

@相関係数=1は、正の相関が最大

 

A相関係数=0は、相関なし

 

B相関係数=−1は、負の相関が最大

 

相関係数を求めるには、次の算式にしたがって計算します。

 

平方和および相乗和を用いると以下で表されます。

 

相関係数 r=Sxy/√SSx・SSy

 

分散および共分散を用いると以下で表されます。

 

相関係数 r=Vxy/√Vx・Vy=Vxy/(σx・σy)

 

これらの式の分母は明らかにプラスですが、分子はプラス、マイナスいずれの値もとりえます。

 

またこの式による計算値は、最大1、最小ー1です。

 

このことを数学的に証明するのはそう難しくありません。

 

相関係数の実感

 

相関係数の目安としては、以下のようになります。

 

@相関係数が0.8以上: かなり相関がある

 

A相関係数が0.7-0.5: まあまあ相関がある

 

B相関係数が0.4-0.3: あまり相関はない

 

また、相関係数ゼロというときは、とくに右にも左にも傾斜しないでまんべんなく、上下左右に、丸くあるいは楕円の形に、点が散らばっている状態を想像しましょう。

 

丸く散らばるか、楕円の形になるかは、縦横の目盛りの関係で決まります。

 

相関係数が1またはー1というときは、すべての点が、右または左に傾斜する一本の直線上に並んだ状態です。

 

相関図のなかの度数分布

 

相関図のなかには、変数XおよびYの度数分布が潜んでいることに注意しましょう。

 

相関図を下のほうからながめると、変数Xの度数分布が浮かび上がってきます。

 

また相関図を左のほうからながめると、変数Yの度数分布が浮かび上がってきます。

 

点の散らばりの密度が高いところは、どちらの度数分布にも山となって現れ、点の密度が低いところは山の裾を描くことになります。

 

度数分布は非対称の場合が一般的ですが、もしここでもそうだとしたら相関図はどうなるでしょうか。

 

おそらく、相関図の分布の一方に偏って点の密度が高く、他の端のほうでは点がまばらに散らばっていることになるでしょう。

セミナー詳細こちら                    解析ご相談こちら


 

統計学における相関係数の求め方【統計解析講義基礎】

統計学における相関係数の求め方【統計解析講義基礎】

統計学における相関係数の求め方【統計解析講義基礎】