Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における回帰と相関の違い【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における回帰と相関の違い【統計解析講義基礎】

統計学における回帰と相関の違い【統計解析講義基礎】


統計学における回帰と相関の違い【統計解析講義基礎】

 

目次  統計学における回帰と相関の違い【統計解析講義基礎】

 

回帰分析

 

回帰(回帰分析)とは、説明変数を使って目的変数を予測する手法です。

 

体重から食前血糖値を予測する場合、体重を説明変数(独立変数)、食前血糖値を目的変数(従属変数)といいます。

 

説明変数ははじめから与えられており(独立)、目的変数は説明変数を使って計算して求めるため、説明変数なしでは求められない(従属)と理解すれば間違いないです。

 

このことから、説明変数を独立変数、目的変数を従属変数と呼ぶこともあります。

 

直線回帰分析とは、1つの連続する説明変数を使って連続する目的変数を直線により予測する手法です。

 

相関分析

 

これに対し相関(相関分析)は、説明変数同士の関係を調べる手法です。

 

一見回帰と似ていますが考え方は全く異なります。

 

相関は予測ではありません。あくまでも関係を調べる手法です。

 

統計学における回帰と相関の違い【統計解析講義基礎】

 

上の散布図では、食前血糖値とヘモグロビンA1c値との関係を示したものです。

 

一見、先の直線回帰分析に似ていますが、ここでは単に、「食前血糖値とヘモグロビンA1c値が右肩上がりの直線関係にある」ことを示しているだけです。

 

また、予測はできないとしても、仮にある患者で食前血糖値があってヘモグロビンA1c値がないという場合、食前血糖値で代替して診断を進められるというメリットがあります。

 

また、相関があるなしを定量的に表現したものが相関係数です。

 

相関係数は、XとYの関係性のばらつき(共分散といいます)を、Xのばらつき(Xの標準偏差)とYのばらつき(Yの標準偏差)で割ることにより計算できます。

 

Excelでは、例えば上の例では相関係数は=CORREL(B3:B6,C3:C6)により計算することができます。0.97ですので、強い相関関係があるといえるでしょう。

 

回帰分析とは、説明変数を用いて目的変数を計算により予測する手法です。

 

一方、相関(相関分析)は、説明変数同士の関係を調べる手法で、回帰分析とは全く考え方が異なります。

セミナー詳細こちら                    解析ご相談こちら


 

統計学における回帰と相関の違い【統計解析講義基礎】

統計学における回帰と相関の違い【統計解析講義基礎】

統計学における回帰と相関の違い【統計解析講義基礎】