サンプリングの科学:統計で母集団を知る【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】 | Google Gemini・Python・エクセルを使った講義で最速マスター

セミナー案内             AIデータサイエンス動画           インスタグラム

サンプリングの科学:統計で母集団を知る【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

サンプリングの科学:統計で母集団を知る【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】
集団全体を調査できる場合は統計手法は不要。大集団ではサンプリングして統計手法を用いて全体の傾向を知る。母集団は全体、サンプリングはランダムでなければならず、バイアスを持つ。母集団を調査できない場合、サンプリングにより一部を抜き出して傾向を知る。例えば、費用や時間の都合で首都圏在住者からのサンプル抽出は偏りを生む。

サンプリングの科学:統計で母集団を知る【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】▼▼▼▼▼▼▼▼
チャンネル登録はこちら


目次  サンプリングの科学:統計で母集団を知る【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


母集団とランダムサンプリング


集団全体の傾向を知るために


ランダムサンプリングの必要性


ある集団がどのような傾向を持っているのか知りたいとき、集団全てを調査できるのであれば統計手法を利用する必要はありません。


集団が大きくて全てを調査しきれないときは、集団からサンプリングを行い、統計手法を利用することで、集団全体の傾向を知ることができます。


このときの集団全体のことを、統計学の用語で母集団といいます。


もともと英語ではsource populationと表現されていて、サンプリング元の集団という意味です。


例えば世論調査などは、日本人全体が母集団です。



サンプリング集団の結果を母集団の結果として解釈するためには、サンプリングがランダムに行われていなくてはなりません


ランダムにサンプリングされるということは、サンプリング集団に選ばれるかどうかが、何の影響も受けずに偶然に(サイコロを振るように)決まらなくてはならないということです。


現実的にこの条件をクリアすることはとても難しいため、サンプリング集団は母集団と比べて何らかのバイアスを持っていることになります。


母集団全てを調査するのが難しいとき、サンプリングにより一部を抜き出して調査し、全体の傾向を知ることができます。


母集団は日本国民全員とすると、例えば、費用や時間の関係で、首都圏在住者からのサンプル抽出となることがあります。


すると、他の地方に住む人だけが感じるような要素は調査に出ません。


この偏りをバイアスと呼んでいます。


日本人全員といった母集団の場合は、サイコロを振るような、ランダムなサンプリングをすると莫大な交通費と時間がかかってしまい、難しいのです。



サンプリングの科学:統計で母集団を知る【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


セミナー詳細                    解析ご相談                    LINEでお友達

サンプリングの科学:統計で母集団を知る【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

サンプリングの科学:統計で母集団を知る【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】