Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学におけるクロス集計表分析【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学におけるクロス集計表分析【統計解析講義基礎】

統計学におけるクロス集計表分析【統計解析講義基礎】


統計学におけるクロス集計表分析【統計解析講義基礎】

 

クロス集計表は、分割表ともよばれ、それぞれの表のセルには度数が入っています。

 

その度数は、あるものが2つ以上の質的要因を交えるときにカウントされます。

 

たとえば、人が企業における5種類の仕事分類と、男性・女性の別を表から読み取りたいとします。

 

クロス集計表分析の目的は、2つ以上の変数が関連しているかどうかを決定することにあります。

 

この例では、性別と仕事分類が不均衡に分布しているかどうかを見出すことができます。

 

カイ2乗分析は、二変数クロス分類表のような、分割表の関連を検定するために使われます。

 

この研究デザインに人種や結婚歴などといった3つめの変数を含めることは容易だと思うかもしれません。

 

しかし、このデザインでは伝統的なカイ2乗検定は妥当ではありません。

 

むしろ、多変量手続きの1つを使って、よく知られている線形確率モデルで、多次元分割表の分析を工夫するべきです。

 

これらの分析は、たとえば、ログリニア(対数線形モデル)、ロジスティック回帰分析、プロビットモデルなどと呼ばれます。

 

これらのアプローチを理解するときに大事なのは、オッズ比の概念です。

 

オッズ比がどのようにして計算されるか、そして多次元分割表の文脈ではどのように解釈されるか、を理解する必要があります。

 

この例では、会社における上層部のオッズは、従業員の性別に依存することを示すでしょう。

 

おそらくそのようなデータの分析に用いられる線形確率モデルで最も一般的なものは、ロジスティック回帰分析でしょう。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学におけるクロス集計表分析【統計解析講義基礎】

統計学におけるクロス集計表分析【統計解析講義基礎】

統計学におけるクロス集計表分析【統計解析講義基礎】