ICCで解明!データの類似度と信頼性評価【ChatGPT統計解析】
級内相関(ICC)は、統計学において、特定のグループ内のデータの類似度を測る指標です。例えば、一卵性双生児の知能指数(IQ)の類似度を測定し、通常の兄弟と比較する場合に使われます。通常の相関係数では、双生児のどちらを1人目とするかで結果が異なるため、ICCが利用されます。ICCは、各グループ内のデータの分散(非類似度)が全体の分散と比較してどれほど小さいかを評価します。ICCは3人以上の兄弟の類似度を表現することもでき、測定や評定の信頼性を評価するためにも用いられます。SPSSなどの統計ソフトで簡単に計算でき、信頼性分析の一環としても利用されます。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
級内相関(intra-class correlation)の統計学
一卵性双生児の間の相関
子どもの知的能力が遺伝によってどの程度規定されるのかといった問題を考える場合、一卵性双生児の間での知的能力の類似度とふつうの兄弟の間での知的能力の類似度を比べるというアプローチがよく用いられる。
もし同一の遺伝的特性をもつ一卵性双生児の間での類似度と、ふつうのきょうだいの間での類似度がほぼ同じであれば、遺伝規定性は弱いということになる。
例として、一卵性双生児5組について、ある知能検査を用いて知能指数(IQ)を求めた結果が下の表のようになったとしよう。
このとき、1人目のIQと2人目のIQの間で(通常の)相関係数を求めると0.76となる。
しかし、一卵性双生児において誰を1人目とするかは任意である。
したがって、たとえばA組の2人のIQ (112と121)を入れ替えてもデータとして何ら本質的な違いはないはずである。
しかし、この入れ替えをすると、相関係数の値は0.83となり、最初の値とはかなり異なってくる。
このようにふつうの相関係数では対の間の類似度を的確に表現できない場合に利用されるのが、級内相関係数とよばれる指標である。
この指標においては、双生児の組のなかの誰を1人目とするかに関係なく、各組のなかでのデータの分散(メンバー間の非類似度)が、データ全体としての分散に比べてどれぐらい小さいかに注目する。
もちろん、全体での分散に比べて各組のなかでの分散が小さいほど、級内相関係数の値は大きくなる。
ここで「級」というのは英語ではクラスであり、あるデータのまとまりを指している。
いまの例では一卵性双生児の組が「級」であり、その級のなかで、つまり級内で互いにどれだけ似通っているかという指標が級内相関係数である。
ソフトウェアを使って計算
級内相関係数の計算は、統計ソフトウェアのSPSSが使える環境なら、メニューから「尺度」を選び、さらに「信頼性分析」を選んで、出力する統計量のリスト中の「級内相関係数」をチェックすればよい。
あるいは、一般的な分散分析のソフトウェアがあれば、「級」を要因とした一元配置の分散分析を行い、級間平均平方(MSb)と級内平均平方(MSw)をまず求める。
そして、それらを用いて級内相関係数を、
の式によって計算する。
ここで、nはそれぞれの級に含まれる人数である。
上記の双生児の例ではn=2で、MSb = 376.6、MSw= 57.6となるので、級内相関係数の値は
となる。
級内相関係数は、ふつうの相関係数と異なり、たとえば3人以上の兄弟の間の類似度も表現することができる。
上記の式は、その場合にもそのまま適用することのできる一般的な式である。
測定の信頼性の指標としての利用
級内相関係数の応用範囲は広いが、そのうちの1つに、測定や評定の信頼性を評価するための利用がある。
SPSSで級内相関係数の計算が「信頼性分析」のメニューで実行できることからも、級内相関係数がその目的で利用されていることがわかる。
たとえば入社試験の面接で、複数の面接者が志願者を評定した結果があるとする(下表)。
このとき、面接者によって評定結果がばらばらでは、これらの面接者の評定の観点や、面接および評定のスキルが疑われることになる。
そこで、同じ志願者に対する異なる面接者の評定がどの程度一致しているかを評価することが必要であり、そのために級内相関係数が用いられる。
この場合、志願者全員に同じ面接者の組が評定を行うとしたら、この表は志願者×面接者という二元配置の表となる。
級内相関係数の計算においては、まず二元配置の分散分析を行う。
そして、この場合の「級」にあたる「志願者」の平均平方を級内相関係数の式の級間平均平方MSbとして用い、交互作用の平均平方を級内平均平方MSwとして用いる。
上の表のデータの場合、
n=3で、MSb= 11.64、MSw= 1.64となるので、級内相関係数の値は
となる。
関連リンク