サンプリングの科学:統計で母集団を知る【ChatGPT統計解析】
集団全体を調査できる場合は統計手法は不要。大集団ではサンプリングして統計手法を用いて全体の傾向を知る。母集団は全体、サンプリングはランダムでなければならず、バイアスを持つ。母集団を調査できない場合、サンプリングにより一部を抜き出して傾向を知る。例えば、費用や時間の都合で首都圏在住者からのサンプル抽出は偏りを生む。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
母集団とランダムサンプリング
集団全体の傾向を知るために
ランダムサンプリングの必要性
ある集団がどのような傾向を持っているのか知りたいとき、集団全てを調査できるのであれば統計手法を利用する必要はありません。
集団が大きくて全てを調査しきれないときは、集団からサンプリングを行い、統計手法を利用することで、集団全体の傾向を知ることができます。
このときの集団全体のことを、統計学の用語で母集団といいます。
もともと英語ではsource populationと表現されていて、サンプリング元の集団という意味です。
例えば世論調査などは、日本人全体が母集団です。
サンプリング集団の結果を母集団の結果として解釈するためには、サンプリングがランダムに行われていなくてはなりません。
ランダムにサンプリングされるということは、サンプリング集団に選ばれるかどうかが、何の影響も受けずに偶然に(サイコロを振るように)決まらなくてはならないということです。
現実的にこの条件をクリアすることはとても難しいため、サンプリング集団は母集団と比べて何らかのバイアスを持っていることになります。
母集団全てを調査するのが難しいとき、サンプリングにより一部を抜き出して調査し、全体の傾向を知ることができます。
母集団は日本国民全員とすると、例えば、費用や時間の関係で、首都圏在住者からのサンプル抽出となることがあります。
すると、他の地方に住む人だけが感じるような要素は調査に出ません。
この偏りをバイアスと呼んでいます。
日本人全員といった母集団の場合は、サイコロを振るような、ランダムなサンプリングをすると莫大な交通費と時間がかかってしまい、難しいのです。
関連記事