エクセルで簡単! R2乗で見る予測精度の真実【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

エクセルで簡単! R2乗で見る予測精度の真実【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】
最小二乗法による回帰係数の推定は、残差平方和を最小化することで一意に決定されます。このプロセスを通じて、全平方和（全変動）、回帰平方和（説明された変動）、および残差平方和（未説明変動）の関係が確立され、これらの和は等しくなります。この関係を基に、決定係数（R2乗）が計算され、エクセルの関数を用いて簡単に求めることができます。R2乗は、モデルがデータをどの程度説明しているかを示す指標で、値が1に近いほど、モデルによる予測の精度が高いことを意味します。

▼▼▼▼▼▼▼▼
チャンネル登録はこちら

目次エクセルで簡単! R2乗で見る予測精度の真実【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

回帰係数と予測値と残差平方和の関係

全平方和＝回帰平方和＋残差平方和

決定係数（R2乗）をエクセルで計算

ChatGPTに聞いてみた

回帰係数と予測値と残差平方和の関係

最小２乗法の解は一意に決まるので、ソルバーによる最小２乗法で得られた変化させるセルから回帰係数（傾きとＹ切片）が求まります。

これらの回帰係数を予測式に代入することにより、それぞれの予測値が求まります。

上のExcelのテーブルではＦ列のYihatというのが予測値です。

そして、観測値Ｙｉから予測値を引いたものが残差（Ｈ列のＥｉ）です。

これを関数SUMSQで平方和を計算した結果がカラムH8に表示されています。

これが残差平方和です。ここでは値は27.527 先にソルバーで計算したものと一致していることを確認しましょう。

流れを整理すると、

①ソルバーで回帰係数を求める

②回帰係数を式に代入し予測値を求める

③観測値と予測値の差（残差）を求める

④残差平方和を求める

⑤ソルバーで求めた残差平方和と一致することを確認する

これら①～⑤の手順をExcelシート上で行ってみてください。

直線回帰分析の考え方を肌で感じとることができます。

Excelの優れた点は、セル単位で計算処理するので計算過程を実感できることです。

統計専用ソフトのように、自動的に結果だけが出力されるのと違った旨みがあります。

統計専用ソフトでも実行し、得られた結果が一致することを確認できるとなお良いでしょう。

全平方和＝回帰平方和＋残差平方和

回帰分析はただ機械的に行うのではなく、実行した回帰分析の結果が妥当であるかどうかを確認することが大切です。

確認する上で大切なのが、回帰診断です。

回帰診断では、いくつかの診断統計量と呼ばれるものにより評価します。

診断統計量には数多くのものがありますが、ここでは決定係数（R2乗）について解説しましょう。

さて、先ずは決定係数（R2乗）ですが、Ｒ２乗を理解する上で必要不可欠なのが、以下の関係式です。

全平方和（ＳＴ）＝回帰平方和（ＳＲ）＋残差平方和（ＳＥ）

先ずＳＴですが、これはＹの全変動を表します。Ｙの４つの観測値からそれぞれＹの平均値Ｙｍを引いたものの平方和です。

まじめに計算してもよいですが、Ｃ列のＹｉを全て選択し、DEVSQという関数により一発で計算できます。

次いでＳＲですが、これは回帰直線の変動、すなわちＸとＹの関係に起因する変動です。

そして、ＳＥは残差（誤差）に起因する変動です。

予測値はＹの平均値を引いたものの平方和です。Ｇ列の値をSUMSQで計算します。

図のようにＳＴ＝ＳＲ＋ＳＥという関係となるので、

決定係数（R2乗）をエクセルで計算

決定係数（R2乗）＝ＳＲ／ＳＴ　で表されます。

つまり、決定係数（R2乗）とは目的変数の全変動中の回帰直線の変動の割合を表します。

以下の図のように、すべての残差が０、すなわちＳＥ＝０のときは、ＳＴ＝ＳＲとなり、Ｒ２乗は１となります。

つまり、R2乗というのは、観測値がいかに直線上にのっているかの指標です。

極端な例では、観測値すべてが直線にちょうどのっている場合、ＳＥ＝０となり、R2乗は１になります。

目安として、R2乗は０．７以上が良いとされています。ここではR2乗は0.898となっております。

R2乗を理解する上では、ＳＴ＝ＳＲ＋ＳＥという関係が大切です。

R2乗というのは、簡単に言えば、観測値がいかに直線上にのっているかの指標です。

上記のExcelテンプレート中央下にR2乗の計算式が入っています。

こちらのExcelテンプレートが欲しい方は以下お問い合わせフォームからリクエスト頂けれは差し上げます。

お問い合わせ

ChatGPTに聞いてみた

プロンプト

あなたは最高のデータサイエンティストです。
R2乗、決定係数について解説してください。
#制約条件：
サルでもわかる平易な日本語で
文字数は300字程度

ChatGPTの回答

R2乗（決定係数）は、統計モデルの予測の当てはまり具合を表す数字です。0から1までの値を取り、1に近いほどモデルの予測がデータにピッタリ合っているということを意味します。逆に、0に近いと予測の精度が低いことを示します。例えば、あなたが友達とバスケをして、得点を予測するモデルを作ったとしましょう。このモデルのR2乗が0.9だったら、そのモデルはかなり正確に得点を予測できるってこと。でも、0.1だったら、その予測はあてにならないってことになります。簡単に言うと、R2乗は「このモデル、データにどれくらいフィットしてる？」って聞かれたときの答えです。値が大きいほど、「めっちゃフィットしてる！」ってこと。だから、モデルを作るときは、R2乗が高くなるようにがんばるんです。

関連リンク

前向き研究と後ろ向き研究【統計解析講義応用】

強制的開示【統計解析講義応用】

バイパーパラメータ【多変量解析】

正規分布はデータ分布の基本【ビジネス統計解析】

1

2

3

4

5

6

エクセルで簡単! R2乗で見る予測精度の真実【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【トップページへ戻る】
【YouTubeChannel】
【統計解析講義基礎】
【統計解析講義応用】
【ChatGPT・Python・Excel】
【多変量解析】
エクセルで簡単! R2乗で見る予測精度の真実【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【医療統計解析】

エクセルで簡単! R2乗で見る予測精度の真実【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【社会経済統計】
【ビジネス統計】
【AI・デジタル】
【統計解析コラム】
【統計解析用語集】
【統計解析セミナー】
エクセルで簡単! R2乗で見る予測精度の真実【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【お問い合わせ】

セミナー詳細解析ご相談 LINEでお友達

エクセルで簡単! R2乗で見る予測精度の真実【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

エクセルで簡単! R2乗で見る予測精度の真実【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

回帰係数と予測値と残差平方和の関係

全平方和＝回帰平方和＋残差平方和

決定係数（R2乗）をエクセルで計算

ChatGPTに聞いてみた

プロンプト

ChatGPTの回答

メニュー

サブメニュー

最新記事