Excelで解く! ロジスティック回帰の最尤推定法【ChatGPT統計解析】
ロジスティック回帰分析では、最小二乗法ではなく最尤推定法を用います。これは、ロジスティック回帰の等分散性の仮定が成立しないためです。最尤推定法は、尤度(観測されたデータが得られる確率)を最大化するパラメータを見つける方法です。尤度は、あるモデルが与えられたデータを生成する確率として解釈されます。Excelソルバーを使用して、回帰係数の最適値を求めることができます。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
目次 Excelで解く! ロジスティック回帰の最尤推定法【ChatGPT統計解析】
最尤推定法(最尤法)で尤度を最大化
最尤推定法(最尤法)とは、読んで字のごとく尤度を最大にする推定法です。
ロジスティック回帰分析で用いられます。
尤度(Likelihood)というのは確率を別の見方をしたものです。
例えばくじ引きでは、つぼの中の当たりくじの数は普通決まっていて、当たる回数と確率に一定のとびとびの関係があります。
くじは引いたら元に戻し、これを繰り返します(復元抽出法)。
下の左の棒グラフは、つぼの中に当たりくじが2割はいっている場合、10回引いてX回当たる確率を示したものです。
2回当たる場合が最も多いのが想像に難くないでしょう。
さて、今度は見方を変えます。たとえば当たる回数を3回に固定し、つぼの中の当たりくじの数を変えてみます(10個中1個〜10個と変化させる)。
すると、つぼの中の当たりくじの数と確率が一定の連続関係をもちます(右の図)。このときの確率は、尤度という言い方をします。
尤度最大時の当たりくじ数を求めるのが最尤推定法です。
この場合、10回引いて3回当たる確率すなわち尤度は10個中3個入っている場合が最大となり、その確率は0.267となります。最尤推定量は0.3となります。
ロジスティック回帰分析における最尤推定法
ロジスティック回帰分析では等分散性が成立しないため、最小2乗法を使うことはできません。
したがって、ロジスティック回帰分析では最尤推定法により回帰係数を求めます。
Excelソルバーによる最尤推定法の実行
最尤推定法はExcelソルバーで実行することができます。
F列は予測確率、F21には=1/(1+EXP(-(F$28+F$29*B21)))が入ります。
L列は対数尤度、L21には=LN(BINOMODIST($C21,$D21,F21,FALSE))が入ります。
F28:F29を変化させ、対数尤度の和、G30をソルバーで最大化します。
かくして回帰係数が求まり、以下のようなS字の予測式が得られます。
ChatGPTに聞いてみた
プロンプト
あなたは最高のデータサイエンティストです。
ロジスティック回帰分析における最尤推定法について解説してください。
#制約条件:
サルでもわかる平易な日本語で
文字数は300字程度
ChatGPTの回答
ロジスティック回帰分析では、何かが起こる確率を予測します。例えば、「雨が降るかどうか」や「ある病気にかかっているかどうか」のような、はいかいいえで答えられる質問です。このとき、最尤推定法(さいゆうすいていほう)という手法を使います。「最尤推定法」とは、簡単に言うと、観測したデータが得られる確率を最も高くするパラメータ(モデルの設定値)を見つける方法です。ロジスティック回帰分析で言えば、「このパラメータを使ったら、実際に見たデータのパターンが得られる確率が最も高くなるよ」というパラメータを探すわけです。例をあげると、あなたがコインを10回投げて、表が7回、裏が3回出たとします。このとき、コインが表になる確率を予測するのに、最尤推定法を使えば、「このコインは表になる確率が高い」という結論になりやすいです。ロジスティック回帰分析でも同じように、データから「この説明変数を使ったモデルが、観測データに最も合っている」というパラメータを見つけ出します。つまり、最尤推定法は、データが示す確率的なパターンをもとに、最適なパラメータを見つけ出す方法なんです。