ICCで解明！データの類似度と信頼性評価【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

級内相関（ICC）は、統計学において、特定のグループ内のデータの類似度を測る指標です。例えば、一卵性双生児の知能指数（IQ）の類似度を測定し、通常の兄弟と比較する場合に使われます。通常の相関係数では、双生児のどちらを1人目とするかで結果が異なるため、ICCが利用されます。ICCは、各グループ内のデータの分散（非類似度）が全体の分散と比較してどれほど小さいかを評価します。ICCは3人以上の兄弟の類似度を表現することもでき、測定や評定の信頼性を評価するためにも用いられます。SPSSなどの統計ソフトで簡単に計算でき、信頼性分析の一環としても利用されます。

▼▼▼▼▼▼▼▼
チャンネル登録はこちら

目次 ICCで解明！データの類似度と信頼性評価【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

級内相関（intra-class correlation）の統計学

一卵性双生児の間の相関

子どもの知的能力が遺伝によってどの程度規定されるのかといった問題を考える場合、一卵性双生児の間での知的能力の類似度とふつうの兄弟の間での知的能力の類似度を比べるというアプローチがよく用いられる。

もし同一の遺伝的特性をもつ一卵性双生児の間での類似度と、ふつうのきょうだいの間での類似度がほぼ同じであれば、遺伝規定性は弱いということになる。

例として、一卵性双生児５組について、ある知能検査を用いて知能指数(IQ)を求めた結果が下の表のようになったとしよう。

このとき、１人目のIQと２人目のIQの間で(通常の)相関係数を求めると0.76となる。

しかし、一卵性双生児において誰を１人目とするかは任意である。

したがって、たとえばＡ組の２人のIQ (112と121)を入れ替えてもデータとして何ら本質的な違いはないはずである。

しかし、この入れ替えをすると、相関係数の値は0.83となり、最初の値とはかなり異なってくる。

このようにふつうの相関係数では対の間の類似度を的確に表現できない場合に利用されるのが、級内相関係数とよばれる指標である。

この指標においては、双生児の組のなかの誰を１人目とするかに関係なく、各組のなかでのデータの分散(メンバー間の非類似度)が、データ全体としての分散に比べてどれぐらい小さいかに注目する。

もちろん、全体での分散に比べて各組のなかでの分散が小さいほど、級内相関係数の値は大きくなる。

ここで｢級｣というのは英語ではクラスであり、あるデータのまとまりを指している。

いまの例では一卵性双生児の組が｢級｣であり、その級のなかで、つまり級内で互いにどれだけ似通っているかという指標が級内相関係数である。

ソフトウェアを使って計算

級内相関係数の計算は、統計ソフトウェアのSPSSが使える環境なら、メニューから｢尺度｣を選び、さらに｢信頼性分析｣を選んで、出力する統計量のリスト中の｢級内相関係数｣をチェックすればよい。

あるいは、一般的な分散分析のソフトウェアがあれば、｢級｣を要因とした一元配置の分散分析を行い、級間平均平方(MSb)と級内平均平方(MSw)をまず求める。

そして、それらを用いて級内相関係数を、

の式によって計算する。

ここで、ｎはそれぞれの級に含まれる人数である。

上記の双生児の例ではｎ＝２で、MSb = 376.6、MSw= 57.6となるので、級内相関係数の値は

となる。

級内相関係数は、ふつうの相関係数と異なり、たとえば３人以上の兄弟の間の類似度も表現することができる。

上記の式は、その場合にもそのまま適用することのできる一般的な式である。

測定の信頼性の指標としての利用

級内相関係数の応用範囲は広いが、そのうちの１つに、測定や評定の信頼性を評価するための利用がある。

SPSSで級内相関係数の計算が｢信頼性分析｣のメニューで実行できることからも、級内相関係数がその目的で利用されていることがわかる。

たとえば入社試験の面接で、複数の面接者が志願者を評定した結果があるとする(下表)。

このとき、面接者によって評定結果がばらばらでは、これらの面接者の評定の観点や、面接および評定のスキルが疑われることになる。

そこで、同じ志願者に対する異なる面接者の評定がどの程度一致しているかを評価することが必要であり、そのために級内相関係数が用いられる。

この場合、志願者全員に同じ面接者の組が評定を行うとしたら、この表は志願者×面接者という二元配置の表となる。

級内相関係数の計算においては、まず二元配置の分散分析を行う。

そして、この場合の｢級｣にあたる｢志願者｣の平均平方を級内相関係数の式の級間平均平方MSbとして用い、交互作用の平均平方を級内平均平方MSwとして用いる。

上の表のデータの場合、

ｎ＝３で、MSb= 11.64、MSw= 1.64となるので、級内相関係数の値は

となる。

関連リンク

予測変数の影響

統計的仮説検定と背理法

Pythonのプログラムを作って動かす環境

統計的方法はどんなときに役立つか

介入研究と観察研究

プラセボ

再現不可能な遺伝学

左側打ち切りと区間打ち切り

統計学における事象と試行

統計学における実験計画法：フィッシャーの3原則

前へ

1

2

3

4

5

6

次へ

【トップページへ戻る】
【YouTubeChannel】
【統計解析講義基礎】
【統計解析講義応用】
【ChatGPT・Python・Excel】
【多変量解析】
【医療統計解析】

【社会経済統計】
【ビジネス統計】
【AI・デジタル】
【統計解析コラム】
【統計解析用語集】
【統計解析セミナー】
【お問い合わせ】

セミナー詳細解析ご相談 LINEでお友達

Google Gemini・Python・エクセルを使った講義で最速マスター

ICCで解明！データの類似度と信頼性評価【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】 | Google Gemini・Python・エクセルを使った講義で最速マスター

ICCで解明！データの類似度と信頼性評価【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

級内相関（intra-class correlation）の統計学

一卵性双生児の間の相関

ソフトウェアを使って計算

測定の信頼性の指標としての利用

サブメニュー

最新記事