クロス集計表(分割表)による分析|2つ以上の変数の関連・カイ2乗分析・オッズ比【統計学・統計解析講義基礎】
クロス集計表(分割表)による分析の目的は、2つ以上の変数が関連しているかどうかを決定すること。関連の検定にはカイ2乗分析、2つ以上の変数の関連・オッズ比の解釈には線形確率モデル・ロジスティック回帰分析
クロス集計表(分割表)による分析
クロス集計表は、分割表ともよばれ、それぞれの表のセルには度数が入っています。
その度数は、あるものが2つ以上の質的要因、相関関係を交えるときにカウントされます。
たとえば、人が企業における5種類の仕事分類と、男性・女性の別を表から読み取りたいとします。
クロス集計表分析の目的は、2つ以上の変数が関連しているかどうかを決定することにあります。
この例では、性別と仕事分類が不均衡に分布しているかどうかを見出すことができます。
カイ2乗分析は、二変数クロス分類表のような、分割表の関連を検定するために使われます。
2つ以上の変数の関連・カイ2乗分析・オッズ比
この研究デザインに人種や結婚歴などといった3つめの変数を含めることは容易だと思うかもしれません。
しかし、このデザインでは伝統的なカイ2乗検定は妥当ではありません。
むしろ、多変量解析の1つを使って、よく知られている線形確率モデルで、多次元分割表の分析を工夫するべきです。
これらの分析は、たとえば、ログリニア(対数線形モデル)、ロジスティック回帰分析、プロビットモデルなどと呼ばれます。
これらのアプローチを理解するときに大事なのは、オッズ比の概念です。
オッズ比がどのようにして計算されるか、そして多次元分割表の文脈ではどのように解釈されるか、を理解する必要があります。
この例では、会社における上層部のオッズは、従業員の性別に依存することを示すでしょう。
おそらくそのようなデータの分析に用いられる線形確率モデルで最も一般的なものは、ロジスティック回帰分析でしょう。
関連リンク