Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における重回帰分析と相関分析【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における重回帰分析と相関分析【統計解析講義基礎】

統計学における重回帰分析と相関分析【統計解析講義基礎】


統計学における重回帰分析と相関分析【統計解析講義基礎】

 

行動科学や社会科学のどの領域でも、重回帰分析と相関分析(MRC:Multiple Regression and Correlation)の結果を読めなければ研究を理解すること、研究の発展についていくことは難しくなっています。

 

実際に、これらの領域において基礎研究、応用研究として公開されている論文の多くが、重回帰分析、相関分析の手続きを用いた研究結果を含んでいます。

 

重回帰分析と相関分析は実際奥が深く、専門家がこれらについて解釈するときでさえ、いくらかの複雑さと意見の相違が生じます。

 

したがって、解釈のためのシンプルなガイドラインは、かえって誤解や誤用を生じさせる可能性もあります。

 

それでも、手続きの概念的な理解ができれば、重回帰分析の解釈が複雑であることがわかりつつも、ある程度の理解は可能になります。

 

回帰分析や相関分析の歴史的なルーツは、19世紀のFrancis GaltonとKarl Pearsonにまでさかのぼります。

 

心理学における「個人差」研究の分野とも密接に関連しています。

 

それは、変数間の関係から自然と生じるものを見ることによって、個人差を明らかにしようという試みです。

 

それに比べて「実験系」心理学は、実験室状況において変数を操作・制御し、あらゆる個人に応用できる一般法則を発見しようとします。

 

こちらの系列では、Ronald Fisherによって展開された分散分析のようなデータ分析手法が好まれています。

 

心理学において個人差系と実験系が枝分かれしてしまった不幸な結果の1つとして、データ分析的手法に対する不適切な偏見が広まってしまったことがあげられます。

 

多くの実験心理学者は、分析に際するデータの相関について「あまり科学的に望ましいものではない」と考え、相関研究デザイン(たとえば無作為割り当てをしないとか、独立変数を操作しないデザイン)のときだけ相関について分析しようと考えます。

 

Fisher派の分散分析(ANOVA)とそれに関する手法こそが、実験調査デザイン(すなわち参加者のランダム割り当てと独立変数の操作を行うデザイン)にとって最も妥当であると考えられていました。

 

しかし、相関的デザインと実験的調査デザインの違いを、データ分析の手続きに一般化する正当な理由は存在しません。

 

皮肉なことに、Fisherが集団の違いに意味があるかどうかを検証しようとした初期のアプローチでは、今や有名な平均平方を使うANOVA法ではなく、重回帰分析と相関分析(MRC)法が使われていたのです。

 

しかし、コンピューターのない時代において、複雑な計算を要するMRCの実行は事実上不可能でした。

 

したがって、Fisherは計算技術的に実現可能性の高いANOVAに舵を切ったのです。

 

しかし、ANOVAやANCOVA(共分散分析)は人が、そして多くのコンピュータープログラムがするように、MRCの方法によって解を出しています。

 

実際、Fisher流の分散分析手続きは、MRCの特殊でより制限の多いケースとして表現し直すことができます。

 

概念的には、MRCは被験者グループの人数をもとに、従属変数における被験者のスコアを有意に予測できるか否かを判定することにより、被験者グループ間の差の統計的優位性を決定(すなわちANOVAの基本的な役割である)します。

 

どのようにしてこれが成立しているかを説明するのは非常に困難ですのでここでは割愛します。

 

高速で演算を行うためのコンピューターの発展と普及によって、データ分析手法の広い範囲で、MRCの人気がうなぎ上りとなっています。

 

MRCは今や、さまざまな研究デザインやリサーチクエスチョンに対するデータ分析として、一般的で応用しやすいものとして、広く認識されています。

 

たとえば、独立変数は連続的でもカテゴリカルでもいいし、自然発生的問題でも実験的操作でもいいし、相関していてもしていなくても構いません。

 

さらに独立変数と従属変数との関係は線形でも曲線形(非線形)でもよいのです。

 

重回帰/多重相関は、2つの変数しか扱わない二変数の(単純な、ゼロ次の、ともよばれる)回帰/相関と密接に関係しています。

 

実際、MRCは多変量を扱う二変数の回帰/相関の拡張であるとする見方もあります。

 

他の多変量手法にカテゴライズされることもありますが、MRCはおそらく一変数の分析手続きに分類するほうがより正確です。

 

なぜなら、従属変数が1つしかないからです。

 

いろいろな意味で多要因ANOVAと一要因ANOVAの関係が、MRCと二変数回帰/相関との関係に対応します。

 

すなわち、二変数回帰/相関と一要因ANOVAは、どちらも1つの独立変数と1つの従属変数をもつものです。

 

MRCと多要因ANOVAは多くの独立変数をもつにもかかわらず、従属変数は1つのままです。

 

正準相関分析など、複数の従属変数を使用するようなMRCの真の多変量拡張についての議論もあります。

 

二変数・多変数の回帰/相関を使った研究を2つのタイプに分割してみましょう。

 

@応用的な状況で、実際の意思決定を目的として行動や出来事の予測をしようとしているもの。

 

A理論の検証や発展のために、現象の本質を理解したり説明したりしようとしているもの。

 

予測と説明は科学の基本的な目的であり、分離不可能な概念です。

 

したがって、研究の目的が、説明するために与えられた情報から予測することになったり、その逆であったりします。

 

予測と説明の違いを、なんらかの人工的な違いで分けることで、この2つの目的別にMRCの解釈を検証するとよいでしょう。

 

実用的予測と理論的説明については、MRC分析の結果の説明と解釈にも用いられます。

セミナー詳細こちら                    解析ご相談こちら


 

統計学における重回帰分析と相関分析【統計解析講義基礎】

統計学における重回帰分析と相関分析【統計解析講義基礎】

統計学における重回帰分析と相関分析【統計解析講義基礎】