線形単回帰分析で労働時間と人件費を予測!誤差に注意【ChatGPT統計解析】
線形単回帰分析は、ターゲット項目と1つの要因項目が決まればモデルを作れるが、比例関係のないデータには不適切。例えば、人件費と労働時間の関係では時給が要因になる。しかし、実際のデータでは残業代や源泉徴収で時給が変化し、誤差が生じる。散布図で可視化し、比例関係や外れ値を確認することが重要。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
線形単回帰分析をしよう
散布図を使った可視化がポイント
比例関係にないデータには使えない
ターゲット項目と、1つの要因項目が決まれば、線形単回帰分析のモデルを作ることができます。
線形単回帰分析は、ターゲット項目をYとし、要因項目をXとして直線的なモデルを作る方法です。
つまり、ターゲット項目と要因項目をY=aX+b の直線式で表します。
この数式の、aとbはデータから計算します。
例えば人件費をターゲット項目とし、従業員の労働時間を要因項目として線形単回帰を行うと、bはほぼゼロとなり、aはほぼ時給と同じ値が計算されるはずです。
ほぼと付けたのは、実際のデータは残業代などで時給が変化したり、源泉徴収などで人件費が微妙に変化したりするため、それが誤差となって時給の額がそのまま計算されることはないと思われるからです。
線形単回帰は比例関係を表しており、当てはまりの良さを散布図で可視化できます。
そもそも比例関係のないデータや、外れ値を含むようなデータに対して線形単回帰分析を行うのは不適切ですので、必ず散布図をチェックしましょう。
関連記事