スピアマンからガンマまで！順序変数の関連尺度徹底解説【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

スピアマンからガンマまで！順序変数の関連尺度徹底解説【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】
順序変数の関連尺度には、スピアマンのロー、グッドマンクラスカルのガンマ、ケンドールのタウ、ソマーズのdが含まれます。スピアマンのローは、順位に基づく相関統計量で、例えば学習時間と試験結果の関係を測定します。ガンマは、2変数の合致対と不一致対の数を基にした尺度で、データの単調性を評価します。ケンドールのタウは、タウa、タウb、タウcの3種類があり、それぞれ合致対と不一致対を調整します。ソマーズのdは、ガンマの非対称版で、変数間の予測力を測定します。

▼▼▼▼▼▼▼▼
チャンネル登録はこちら

目次スピアマンからガンマまで！順序変数の関連尺度徹底解説【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

スピアマンのロー

グッドマン・クラスカルのガンマ

ケンドールのタウ

ソマーズのｄ

スピアマンのロー

順序尺度データ（順序付けられているが、値の間の距離が等しいとはみなせないデータ）に対する最も一般的な相関統計量は、スピアマンの順位係数（スピアマンのロー（ρ）やスピアマンのｒとも呼ばれ、rsなとも表す）である。

スピアマンのローは、データ点の値ではなく順位（1番目、２番目、３冊目など）に基づいている。

学校のクラス順位は比尺度データの一例である。

GPA (Grade Point Average)が最も高い人が１番に順位付けされ、次に高い人が２番となっていくが、１番と２番の生徒の差が２番と３番の差と同じかどうかはわからない。

高校のGPAなどの比尺度で測定できるデータがあっても、さまざまなクラスや学校間での評点制度を比較するのは困難なので、大学入学や奨学金の判断にはクラス順位が使われることがある。

スピアマンのローを計算するには、各変数の値を個別に順位付けし、同じ値の順位は平均化する。

そして、値の対の順位の差をそれぞれ計算し、以下式に示す式を使ってスピアマンのローを計算する。

スピアマンのローの式

１週間の学習時間と最終試験の得点の関係を調べたいとする。

以下表に示すように両方の変数のデータを収集する（例を示す日的から必要となる手計算を最小限にしたデータ集合）。

１週間の学習時間と最終試験の得点

学習の多さが高得点に関係するように見えるが、その関係は完璧ではない(学生３は平均的な学習量だけで高得点を得ており、学生５は比較的少ない学習量で優れた得点を得ている)。

スピアマンのローを計算し､この関係をもっと正確に推定する。

順位の差を二乗するので､(ここで行ったように)試験の順位から勉強時間の順位を引くか逆の引き算をするかは重要ではない。

di2の合計は58なので、このデータでのスピアマンのローを以下式に示す。

スピアマンのローの計算

これは、データの第一印象での推測を裏付けている。

学習に費やした時間と試験の結果には強固ではあるが不完全な関係がある。

グッドマン・クラスカルのガンマ

グッドマン・クラスカルのガンマ（単にガンマと呼ぶことが多い）は、２変数の合致対と不一致対の数を基にした順序変数の関連尺度である。

これは変数が期待通りの順序の値を持つ頻度を示すので、単調性の尺度と呼ばれることもある。

データ集合内の２変数が正の関係を持ち、事例２の方が事例１よりも最初の変数に大きい値を持つ場合には、事例２の方が２つ目の変数でも大きい値を持つと予期するであろう。

これが合致対である。

事例２の方が２つ目の変数に小さい値を持つ場合には、不一致対となる。

手動でガンマを計算するには、まず２変数の度数分布を作成し、自然順序を維持する。

BMI (Body Mass Index、身長に対する体重の尺度）と血圧値に関連する仮想データ集合を考えてみよう。

ｰ般に高いBMIは高血圧に関連するが、すべての人に当てはまるわけではない。

肥満でも正常血圧の人もおり、正常体重でも高血圧の人もいる。

以下表に示すデータ集合の体重と血圧には強い関係があるだろうか。

ガンマを求める式では、以下表に示すセル指定を使う。

ガンマを計算するためのセル指定

まず、次のように合致対（P）と不一致対（Q）を求める。

そして、以下式に示すようにガンマを計算する。

グッドマン・クラスカルのガンマの計算

ガンマの背後にある論法は明確である。

２変数に強い関係がある場合、合致対の割合が高くなるだろう。

したがって、ガンマは関係が弱い場合よりも大きな値となる。

ガンマではどちらの変数を予測因子とみなしどちらの変数を結果とみなすかは重要ではないので、対称尺度である。

ガンマの値はどちらの場合も同じになる。

ガンマはデータ内の同順位を補正しない。

ケンドールのタウ

ケンドール(Maurice Kendall)は、カンマの代わりとして３つの少し異なる種類の順序相関を開発した。

統計コンピュータパッケージはもっと複雑な式を使ってこれらの統計量を計算する場合もあるので、特定のプログラムが使う正確な式はソフトウェアマニュアルで確認する方がよい。

ケンドールのタウ統計はすべて、カンマと同様に対称尺度である。

ケンドールのタウａは合致対と不一致対の数に基づいており、以下式に示すように対の総数（ｎ＝標本サイズ）に基づく尺度で割る。

ケンドールのタウａの式

ケンドールのタウｂは、合致対と不一致対に基づいた類似の関連尺度であり、同順位の数を調整する。

２変数をxとｙとすると、タウｂは(P-Q)をxで同順位ではない対の数(x0)とｙで同順位ではない対の数（y0）の幾何平均で割る。

タウｂは、正方表（行と列の数が同じ表）でのみ1.0または-1.0に近づく。

ケンドールのタウｂの式を以下に示す。

ケンドールのタウｂの式

この式では、x0＝xで同順位ではない対の数、y0=yで同順位ではない対の数である。

ケンドールのタウcは非正方表に使い、以下式に示すように計算する。

ケンドールのタウcの式

この式では、mは行数か列数の小さい方の数であり、nは標本サイズである。

ソマーズのｄ

ソマーズのｄはガンマの非対称版なので、統計量の計算はどちらの変数を予測因子とみなしどちらの変数を結果とみなすかによって変わる。

ソマーズのｄは、予測変数の同順位の対の数で補正する点でもガンマと異なる。

ＸがYを予測するという仮説のもとで調査を行う場合、ソマーズのｄはＸの同順位の対の数で補正する。

YがＸを予測するという仮説の場合には、Yの同順位の対の数で補正する。

タウｂと同様に、ソマーズのｄでは同順位の対を分母から削除する。

X0 = Xでの同順位ではない対の数、Y0＝Yでの同順位ではない対の数という表記法を使うと、ソマーズのｄは以下式に示すように求める。
ソマーズのｄの式

ソマーズのｄの対称値は、この式で計算した２つの非対称値の平均を取れば求められる。

関連リンク

母集団

臨床試験の実施

治療学上の自明の理

ROC曲線によるスクリーニング検査の評価

共変量とサブグループの理解

研究者と研究スタッフ

臨床データマネジメント

介入研究と観察研究

インターネット上のデータを使った評判調査

分散分析という統計手法

1

2

3

4

5

6

セミナー詳細解析ご相談 LINEでお友達

スピアマンからガンマまで！順序変数の関連尺度徹底解説【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

スピアマンからガンマまで！順序変数の関連尺度徹底解説【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

スピアマンのロー

グッドマン・クラスカルのガンマ

ケンドールのタウ

ソマーズのｄ

メニュー

サブメニュー

最新記事