EMアルゴリズム|【統計学・統計解析講義応用】
EMアルゴリズム
EMアルゴリズムとは、データに欠測があるとき、母集団パラメータθの最尤推定値を繰り返し計算によって求める方法です。
欠測のない完全データからは、容易にθの推定値が求められますが、不完全データからは計算が難しいとき、次の2つのステップの繰り返しにより最尤推定値を求めます。
θの初期値を定め、第tステップでは、
@E-step(Expectation step):θの初期値を所与として欠測部分をその期待値で置き換え、擬似的な完全データセットを作成します。
AM-step(Maximization step):E-stepで作られた擬似的な完全データセットを用いて尤度関数を最大にするθを求めます。
上記の計算において、E-stepにおける擬似的な完全データセットは欠測データをその期待値で置き換えるのではなく、尤度関数における十分統計量をその期待値で置き換えることに注意します。
また、M-stepにおいて、尤度関数を最大化するのではなく、尤度関数を大きくする適当な値とする計算法を一般化EMアルゴリズム(generalized EM=GEM algorithm)といいます。
EMアルゴリズムの利点は、各反復において尤度関数が減少しないことです。
したがって、収束が得られた場合は少なくとも尤度関数の局所的な極大値となります。
また、EMアルゴリズムは不完全データの解析だけでなく、うまく定式化することによって多くの統計的な問題の解を与えます。
ただし収束は速くはありません。
関連記事