Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における多変量解析の概念【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における多変量解析の概念【統計解析講義基礎】

統計学における多変量解析の概念【統計解析講義基礎】


統計学における多変量解析の概念【統計解析講義基礎】

 

多変量解析の厳密な定義を与えるのは不可能です。

 

なぜなら、多変量解析という言葉は皆が同意した上で使われているわけではないからです。

 

多変量解析は、研究の文脈や定義された変数を測定する尺度によってその意味が変わります。

 

厳密には、多変量解析は多くの独立変数と従属変数を同時に分析するものです。

 

もっと一般的に言えば、もし2つ以上の従属変数が含まれているのであれば、それは多変量デザインだといえるでしょう。

 

一変数の一元配置分散分析(ANOVA)とMANOVAを比較してみましょう。

 

1つの独立変数と3つの従属変数からなる実験計画があったとしましょう。

 

一元配置ANOVAのアプローチでは、異なる群間平均を検定するために、それぞれの従属変数に対して3つの異なるF検定を行うことになります。

 

MANOVAでは、同じデータに対して3つではなく1つの総体的な検定統計量を算出します。

 

この「同時に行う」というMANOVAの基本的な考え方は、3つの従属変数を新しい変数としてまとめる、あるいは線形結合させるというものです。

 

もし検定統計量が有意であれば、これは2つの群が結合した変数と異なっていることを意味します。

 

有意なF値はどこかの、あるいはすべての従属変数間に違いがあることを示しています。

 

しかし、有意なF値は従属変数が結合したことが原因で生じたともいえます。

 

つまり、驚くことではないのですが、有意な多変量F統計量が得られたときでも、一変数のF検定がどこも有意ではないことがあるのです。

 

線形結合の概念は、多変量解析においてはあちこちで見受けられます。

 

ある研究者が重回帰分析において、結婚満足度をいくつかの変数で予測しようとしている、と考えてみましょう。

 

たとえば、結婚満足度を予測する変数として使われるものには、結婚年数とか、子どもの数とか、年収などがあるでしょう。

 

それらの予測変数を別々に用いる代わりに、個々の予測変数は1つの複合変数という形に合成されます。

 

合成された新しい変数と結婚満足度との関係は、重相関、あるいはRとして表現されます。

 

それぞれの変数は結婚満足度との関連の強さにおいて、全体的な相関に関係しています。

 

重相関は結合の最もよい方法、あるいは重みづけで、予測変数は結合変数と結婚満足度の関係を最大にするようにつくられています。

 

結合変数を生み出す別の例として、因子分析があげられます。

 

たとえば、かなり多い個々の項目がテストに含まれていて、それがいくつかの合成変数、俗に言う「因子」にまとめられますが、これはテストに潜む次元を表しています。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学における多変量解析の概念【統計解析講義基礎】

統計学における多変量解析の概念【統計解析講義基礎】

統計学における多変量解析の概念【統計解析講義基礎】