Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における回帰直線の数式化【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における回帰直線の数式化【統計解析講義基礎】

統計学における回帰直線の数式化【統計解析講義基礎】


統計学における回帰直線の数式化【統計解析講義基礎】

 

この回帰直線を数式で表すことを試みましょう。

 

ここで、高校で習った数学の、横軸Xと縦軸Yのグラフ上の直線は、

 

y=a+bx

 

の形の1次式で表されることを思い出してみましょう。

 

この式において係数a, bの値を変えれば、どんな直線でもグラフ上に表すことができます。

 

この式が回帰直線を表しているときには回帰式と呼ばれます。

 

そして、回帰式を用いる分析手法が回帰分析です。

 

式の中の文字記号の意味は次の通りです。

 

@aの値: 回帰直線と縦軸との交点におけるyの大きさを表しており、回帰定数と呼ばれます。

 

Abの値: 回帰直線の傾きを表しており、回帰係数と呼ばれています。

 

横軸のxの値が1だけ増えたときにyの値がbだけ増えます。もし、xが増えたときにyが減少すれば、bの値はマイナスとなって、回帰直線は右下がりになります。

 

この回帰直線は、グラフの各点の散らばりの中心を縫うように引かれます。

 

定規をあてて、目安法で引けないことはないですが、精確には計算によって引く必要があります。

 

なお、目安(めやす)という言葉は「仕事に目安をつける」というときは先の見通し、見当という意味でしょうが、おおよその見当で、ええいと線を引く意味で用いることができます。

 

aおよびbの計算

 

回帰直線を求めるということは、式中の回帰定数a、回帰係数bの値を計算によって決定することです。

 

計算式のみ示せば次のようになります。

 

回帰係数 b=Sxy/SSx

 

回帰定数 a=ym−bxm

 

すなわち、まず回帰係数の方は、変数XとYの偏差相乗和を、変数Xの偏差平方和で割って求めることができます。

 

次に、この回帰直線が点グラフの中心(各変数の平均値の座標)を通るものとすれば、そこの点ではym=a+bxm が成立します。

 

したがって、この式に、既に得られたbの値を代入することによって、回帰定数aが求められます。

 

計算例

 

そう難しい計算ではなさそうなので、先の世帯員数と購入量の回帰について、実際のデータで計算してみましょう。

 

まず、10世帯についての個別データおよびそれにもとづく計算結果は次のようになります。

 

統計学における回帰直線の数式化【統計解析講義基礎】

 

したがって、求める回帰式は次のように表すことができます。

 

回帰式 y=20.84+8.79x

 

この式によって示される直線を実際にグラフ上に描けば、前図の回帰直線になります。

 

この回帰直線は、縦軸とy=21の箇所で交わっており、また世帯員数xが1増えるごとに購入量yはほぼ9ずつ増えることを示しています。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学における回帰直線の数式化【統計解析講義基礎】

統計学における回帰直線の数式化【統計解析講義基礎】

統計学における回帰直線の数式化【統計解析講義基礎】