母集団と標本調査の基礎:統計的推定【ChatGPT統計解析】
統計の対象となる集合を母集団(population)といい、全数調査は時間や費用、記入の手間などの理由で容易に行えない。そこで、母集団から一部のデータ(標本)を取り出し、全体を推し量る標本調査が一般的である。統計的手法を用いた標本調査を統計的推定という。標本調査の方法には無作為抽出と有為抽出があり、標本の個数を標本の大きさという。全数調査は特定の条件下で行われるが、通常は標本調査が用いられる。例えば、国勢調査や健康診断では全数調査が行われることが多いが、多くのケースでは標本調査が実施される。標本調査は、例えば蛍光灯の寿命やテレビの視聴率など、多岐にわたる情報を得るために用いられる。また、標本調査の結果は個体のプライバシーを保護しつつ集計される。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
母集団(population):統計の対象となる集合
統計の調査対象となる集団は,ある共通性を持つ個体の集まりです。
例えば,国勢調査は,「調査時において,本邦内に住属を行すると」という共通性を持つ個体の集まりです。
統計の対象となる集合を母集団(population)といいます。
牛肉の安全性を調べたいならば,牛肉全体が母集団となります。
蛍光灯の切れる時間を調べたいならば,蛍光灯全休が母集団となります。
母集団に対する調査には,全数調査と標本調査があります。
全数調査は,母集団をすべて調査する方法です。
悉皆調査あるいはセンサスと呼ばれます。
統計法第4条第1項によれば,国勢調査は「人口に関する全数調査」と規定されています。
全数調査の適用例は限られています。
勤務先や通学先での健康診断は,全数調査が原則です。
勤務先での健康診断欠席者には,民間病院で健康診断を受けるようにと厳しい注意の電話がかかります。
こうした全数調査は時間,カネ,記入の面倒さなどの理由で簡単にはできません。
標本(sample)による標本調査
母集団を知りたいがそれは無理というものです。
蛍光灯の例では,全数調査をすれば,売り物がなくなってしまいます。
機械全体を調べようものなら,機械を破損しかねない場合もあります。
日本の視聴者全員を調べることなどとてもできません。
そこでは集団から一部分のデータ(標本, sample)を取り出して,全体を推し量る方法、すなわちが統計的推定使われます。
これが標本調査です。
例えば,腫瘍が良性か悪性かを調べるために細胞検出,政党の支持率などのほかに,ビジネスの世界でも,多くの実例が見られます。
蛍光灯の切れる時間,新しい製品の消費者の味の評価,あるいはテレビ番組の視聴率等の有用な情報は標本調査から求めます。
日常の生活でも,鍋をおたまでかき混ぜて味噌汁の味見をしたり,新刊書をパラパラとめくって内容を調べたりするのは,標本調査の考えによります。
標本を母集団から無作為に取り出すことを無作為抽出(random sampling)といいます。
専門家が全体を代表していると考える標本だけを取り出すことを有為抽出(purposive selection)といいます。
標本の個数を標本の大きさ(sample size)といいます。
一般に,統計的手法を用いて標本調査を行うことを統計的推定といいます。
なお,例えば,国勢調査では,個々の家族の人数といった個体の情報を地域別や年齢別に集積して,日本のある地域の年齢階級別人口や世帯当たりの人員を明らかにします。
このとき,どこの誰の家が何人家族といった個体の情報は捨象されます。
政府統計の場合には,統計法で個体情報のプライバシー保護規定が設けられています。
関連リンク