相関係数で読み解く!データ間の隠された関係性【ChatGPT統計解析】
相関係数は-1から1の範囲を持ち、XYの共分散とX及びYの標準偏差の積で計算されます。相関係数が1ならば完全な正の相関、0なら相関なし、-1なら完全な負の相関を意味します。相関係数が0.8以上なら強い相関があり、0.7から0.5ではまあまあの相関、0.4から0.3では弱い相関があるとされます。相関図にはXとYの度数分布が影響を与え、点の散布の形状が丸や楕円になることがあります。これらの分布が非対称の場合、相関図の点の密度に偏りが生じることがあります。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
相関係数の範囲は-1〜1
相関関係の強さを表すのに、相関係数(correlation coefficient)を用います。
この値は、-1から1までの範囲の符号と大きさをとります。
一般的に言えば、次のような関係になります。
@相関係数=1は、正の相関が最大
A相関係数=0は、相関なし
B相関係数=−1は、負の相関が最大
相関係数=XYの共分散÷(Xの標準偏差×Yの標準偏差)
相関係数を求めるには、次の算式にしたがって計算します。
平方和および相乗和を用いると以下で表されます。
相関係数 r=Sxy/√SSx・SSy
相関係数 r=Vxy/√Vx・Vy=Vxy/(σx・σy)
これらの式の分母は明らかにプラスですが、分子はプラス、マイナスいずれの値もとりえます。
またこの式による計算値は、最大1、最小ー1です。
このことを数学的に証明するのはそう難しくありません。
相関係数の目安
相関係数の目安としては、以下のようになります。
@相関係数が0.8以上: かなり相関がある
A相関係数が0.7-0.5: まあまあ相関がある
B相関係数が0.4-0.3: あまり相関はない
また、相関係数ゼロというときは、とくに右にも左にも傾斜しないでまんべんなく、上下左右に、丸くあるいは楕円の形に、点が散らばっている状態を想像しましょう。
丸く散らばるか、楕円の形になるかは、縦横の目盛りの関係で決まります。
相関係数が1またはー1というときは、すべての点が、右または左に傾斜する一本の直線上に並んだ状態です。
相関図のなかの度数分布
相関図のなかには、変数XおよびYの度数分布が潜んでいることに注意しましょう。
相関図を下のほうからながめると、変数Xの度数分布が浮かび上がってきます。
また相関図を左のほうからながめると、変数Yの度数分布が浮かび上がってきます。
点の散らばりの密度が高いところは、どちらの度数分布にも山となって現れ、点の密度が低いところは山の裾を描くことになります。
度数分布は非対称の場合が一般的ですが、もしここでもそうだとしたら相関図はどうなるでしょうか。
おそらく、相関図の分布の一方に偏って点の密度が高く、他の端のほうでは点がまばらに散らばっていることになるでしょう。
関連リンク