階層的方法|【統計学・統計解析講義応用】
階層的方法
クラスター分析の手法は大きく階層的方法と非階層的方法に分かれます。
階層的方法は逐次的に標本のグループ化を行います。
以下にクラスターを生成する具体的な方法を述べますが、方法によってグループ化の結果が大きく異なります。
群平均法(group average method):2つのクラスターの全ての標本間の距離を求め平均を求めます。
これをそれらのクラスター間の距離とし、距離の小さいクラスター間を合併し、次のクラスターを作ります。SPSSでは平均連結法と呼んでいます。
グループ間(between group)とグループ内(within group)の2種類があります。
最近隣法(nearest neighbor method)、単一連結法(single linkage method):2つのクラスターの標本の中で、最も近いもの同士の距離をそれらのクラスター間の距離とします。
クラスターの生成が鎖のようになっていく性質があり、それを鎖効果(chain effect)といいます。
最遠隣法(further neighbor method)、完全連結法(complete single linkage method):2つのクラスターの標本の中で、最も遠いもの同士の距離をそれらのクラスター間の距離とします。
重心法(centroid methos):2つのクラスターの重心同士の距離をそれらのクラスター間の距離とします。
メディアン法(median method):2つのクラスターの全ての標本間の距離を求め中央値をとります。これをそれらクラスター間の距離とします。
Ward法(Ward method):情報損失量(loss of information)という概念を入れて、合併する際、情報損失量が最小となるクラスターを合併します。
関連記事