回帰分析の魔法!式y=a+bxでデータを読み解く【ChatGPT統計解析】
回帰直線の式は、y=a+bxと表され、aは直線と縦軸の交点である回帰定数、bは直線の傾きを表す回帰係数です。この回帰係数bは、変数XとYの偏差相乗和を変数Xの偏差平方和で割ることで求められます。また、回帰直線が各変数の平均値の座標を通ると仮定すると、式ym=a+bxmに基づいて回帰定数aも計算できます。これにより、横軸Xの値が1増えるとYの値がbだけ増える直線をグラフ上に描くことが可能です。回帰分析では、この式を用いてデータの傾向を解析し、より精確な線を引くための計算が行われます。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
回帰直線の式
回帰直線を数式で表すことを試みましょう。
ここで、高校で習った数学の、横軸Xと縦軸Yのグラフ上の直線は、
y=a+bx
の形の1次式で表されることを思い出してみましょう。
この式において係数a, bの値を変えれば、どんな直線でもグラフ上に表すことができます。
この式が回帰直線を表しているときには回帰式と呼ばれます。
そして、回帰式を用いる分析手法が回帰分析です。
式の中の文字記号の意味は次の通りです。
@aの値: 回帰直線と縦軸との交点におけるyの大きさを表しており、回帰定数と呼ばれます。
Abの値: 回帰直線の傾きを表しており、回帰係数と呼ばれています。
横軸のxの値が1だけ増えたときにyの値がbだけ増えます。もし、xが増えたときにyが減少すれば、bの値はマイナスとなって、回帰直線は右下がりになります。
この回帰直線は、グラフの各点の散らばりの中心を縫うように引かれます。
定規をあてて、目安法で引けないことはないですが、精確には計算によって引く必要があります。
なお、目安(めやす)という言葉は「仕事に目安をつける」というときは先の見通し、見当という意味でしょうが、おおよその見当で、ええいと線を引く意味で用いることができます。
回帰定数aおよび回帰係数bの計算
回帰直線を求めるということは、式中の回帰定数a、回帰係数bの値を計算によって決定することです。
計算式のみ示せば次のようになります。
回帰係数 b=Sxy/SSx
回帰定数 a=ym−bxm
すなわち、まず回帰係数の方は、変数XとYの偏差相乗和を、変数Xの偏差平方和で割って求めることができます。
次に、この回帰直線が点グラフの中心(各変数の平均値の座標)を通るものとすれば、そこの点ではym=a+bxm が成立します。
したがって、この式に、既に得られたbの値を代入することによって、回帰定数aが求められます。
計算例
世帯員数と購入量の回帰について、実際のデータで計算してみましょう。
まず、10世帯についての個別データおよびそれにもとづく計算結果は次のようになります。
したがって、求める回帰直線の回帰式は次のように表すことができます。
回帰式 y=20.84+8.79x
この回帰直線は、縦軸とy=21の箇所で交わっており、また世帯員数xが1増えるごとに購入量yはほぼ9ずつ増えることを示しています。
関連リンク