相関関係と相関係数の基本と注意点【ChatGPT統計解析】
相関関係とは、数量的データにおいて2つの量の間の関係を示す考え方です。例えば、身長と体重には正の相関があり、一方が大きくなると他方も大きくなる傾向があります。しかし、これは必ずしも当てはまるわけではなく、例外も存在します。このような傾向を数値で表すのが相関係数であり、その値は-1から1の範囲で表されます。値が1に近いほど強い正の相関、-1に近いほど強い負の相関を示します。相関係数は便利ですが、その使い方には注意が必要です。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
相関関係と相関係数(correlation, coefficient)
相関関係は統計のエッセンス
「相関関係」とは、量と量との相互的な(co)関係(relation)を、数量的データに現れた限りにおいて、とらえようとする考え方や方法である。
たとえば、人間の体の形(体型)がそれである。
身長と体重には互いに関係がある。
一方が大きく(小さく)なれば、他方も大きく(小さく)なる(「直線的に」という条件が必要との考え方もある)。
このとき両者の間には「正の相関関係」があるという。
それは人間の体の形というものが人問と認識される以上(つまり人間が人間である限り)当然のことである。
一般的にいえば、どのような現象も構造や型やパターンがあれば、数量上の関係が現れてくる傾向がある。
しかし、身長が大きければ必ず体重が大きくなるとういうわけではない。
表1は統計学の創始者の一人F.ゴルトンが示した有名な身長と上腕の長さの関係であるが、厳密ではないが明らかにある傾向(しかも直線的傾向)が認められる。
この「厳密ではないが、ある程度の法則性が明らかである」というのが、統計学でいう法則性である。
ゴルトンのこの例は現象として平凡だが、統計学のエッセンスを物語っている。
相関係数を計算する
今日においては、相関関係は「平均」、「度数分布」などについで、日常的によく知られた統計学の考え方となっている。
たとえば、表2を見て多くの人が「鉄道会社の資本金と従業員数には、ある程度の相関がある」というであろう。
この相関の強さが「相関係数」である。
次のデータから計算してみよう。
と計算される。
相関係数は−1から1の範囲にあり、「強い」、「弱い」、「やや強い」、「やや弱い」、「ほとんど相関係数関係なし」などの表現が、1あるいは−1への近さに対して用いられる。
マイナスならば「負の相関関係」、すなわち、一方が大きく(小さく)なれば他方は小さく(大きく)なる関係、いわゆる逆相関(正式用語ではない)を示している。
したがって−0.1はきわめて弱い負の相関関係を示す。
相関係数は、便利さのゆえに、使い方については十分に注意しなければ、足をすくわれるような現象も数多い。
相関関係、相関係数がうまく使えれば統計の工スパートである。
関連リンク