Python・R・エクセルによるデータサイエンス | 統計解析講義

回帰診断統計量:決定係数またはR2乗【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

回帰診断統計量:決定係数またはR2乗【統計解析講義基礎】

回帰診断統計量:決定係数またはR2乗【統計解析講義基礎】


回帰診断統計量:決定係数またはR2乗【統計解析講義基礎】

 

目次  回帰診断統計量:決定係数またはR2乗【統計解析講義基礎】

 

回帰係数と予測値と残差平方和の関係

 

回帰診断統計量:決定係数またはR2乗【統計解析講義基礎】

 

最小2乗法の解は一意に決まるので、ソルバーで得られた変化させるセルから回帰係数(傾きとY切片)が求まります。

 

これらの回帰係数を予測式に代入することにより、それぞれの予測値が求まります。

 

上のExcelのテーブルではF列のYihatというのが予測値です。

 

そして、観測値Yiから予測値を引いたものが残差(H列のEi)です。

 

これを関数SUMSQで平方和を計算した結果がカラムH8に表示されています。

 

これが残差平方和です。ここでは値は27.527 先にソルバーで計算したものと一致していることを確認しましょう。

 

流れを整理すると、

 

@ソルバーで回帰係数を求める

 

A回帰係数を式に代入し予測値を求める

 

B観測値と予測値の差(残差)を求める

 

C残差平方和を求める

 

Dソルバーで求めた残差平方和と一致することを確認する

 

これら@〜Dの手順をExcelシート上で行ってみてください。

 

直線回帰分析の考え方を肌で感じとることができます。

 

Excelの優れた点は、セル単位で計算処理するので計算過程を実感できることです。

 

統計専用ソフトのように、自動的に結果だけが出力されるのと違った旨みがあります。

 

統計専用ソフトでも実行し、得られた結果が一致することを確認できるとなお良いでしょう。

 

決定係数(R2乗)

 

回帰分析はただ機械的に行うのではなく、実行した回帰分析の結果が妥当であるかどうかを確認することが大切です。

 

確認する上で大切なのが、回帰診断です。回帰診断では、いくつかの診断統計量と呼ばれるものにより評価します。

 

診断統計量には数多くのものがありますが、ここでは決定係数(R2乗)について解説しましょう。

 

さて、先ずは決定係数(R2乗)ですが、R2乗を理解する上で必要不可欠なのが、以下の関係式です。

 

全平方和(ST)=回帰平方和(SR)+残差平方和(SE)

 

回帰診断統計量:決定係数またはR2乗【統計解析講義基礎】

 

先ずSTですが、これはYの全変動を表します。Yの4つの観測値からそれぞれYの平均値Ymを引いたものの平方和です。

 

まじめに計算してもよいですが、C列のYiを全て選択し、DEVSQという関数により一発で計算できます。

 

次いでSRですが、これは回帰直線の変動、すなわちXとYの関係に起因する変動です。

 

そして、SEは残差(誤差)に起因する変動です。

 

予測値はYの平均値を引いたものの平方和です。G列の値をSUMSQで計算します。

 

図のようにST=SR+SEという関係となるので、

 

決定係数(R2乗)=SR/ST で表されます。

 

つまり、決定係数(R2乗)とは目的変数の全変動中の回帰直線の変動の割合を表します。

 

すべての残差が0、すなわちSE=0のときは、ST=SRとなり、R2乗は1となります。

 

つまり、R2乗というのは、観測値がいかに直線上にのっているかの指標です。

 

極端な例では、観測値すべてが直線にちょうどのっている場合、SE=0となり、R2乗は1になります。

 

目安として、R2乗は0.7以上が良いとされています。ここではR2乗は0.898となっております。

 

R2乗を理解する上では、ST=SR+SEという関係が大切です。R2乗というのは、簡単に言えば、観測値がいかに直線上にのっているかの指標です。

 

回帰診断統計量:決定係数またはR2乗【統計解析講義基礎】

 

上記のExcelテンプレート中央下にR2乗の計算式が入っています。

 

こちらのExcelテンプレートが欲しい方は以下お問い合わせフォームからリクエスト頂けれは差し上げます。

 

お問い合わせ

セミナー詳細こちら                    解析ご相談こちら


 

 

回帰診断統計量:決定係数またはR2乗【統計解析講義基礎】

回帰診断統計量:決定係数またはR2乗【統計解析講義基礎】

回帰診断統計量:決定係数またはR2乗【統計解析講義基礎】