Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における標本と母集団【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における標本と母集団【統計解析講義基礎】

統計学における標本と母集団【統計解析講義基礎】


統計学における標本と母集団【統計解析講義基礎】

母集団と標本

 

推測統計学が果たしている主要な機能の1つは、標本(サンプル)を用いて仮説を検定し、その標本から得られた結果を用いて、それらが母集団にどのくらいよく適用できるのかを推測できるようにすることです。

 

標本は、単に母集団の部分集合であるというだけでなく、母集団の代わりに標本を使うという考え方の背後には、非常にしっかりとした論拠があります。

 

標本は母集団よりずっと小さいので、何らかの結果を評価するために資金や人、設備などの資源が少なくて済みます。

 

たとえば、10,000人の小学6年生がいる大きな都会の校区の6年生の身長に関心があったとすると、(正しく行えば)わずか100人か200人の児童を測定するだけで、全6年生の平均身長のかなり正確な推定値を得ることができます。

 

非常に少数の参加者に基づいた評価が正確で、母集団の値を正確に反映しているかということを、どのように知ることができるでしょうか。

 

標本が母集団の性質にどれくらい近似しているかの測度は、標本誤差と呼ばれています。

 

標本誤差は基本的に、標本の値(標本統計量と呼ばれています)と母集団の値(母数と呼ばれています)との差です。

 

標本誤差が大きいほど、標本抽出における精度が低く、標本で見いだされたものが母集団において見出したかったものを実際に反映していると主張することが難しくなります。

 

研究者の仕事は、母集団の値の最も正確な表現をできるだけ得られるよう努力して、標本誤差を最小化することです。

 

無作為抽出と無作為割付

 

無作為抽出(ランダムサンプリング、random sampling)とは、研究の対象者に対して生じる、研究者によるサンプリングバイアスを避けるための標本の抽出方法です。

 

ただし、完全に無作為に標本を抽出することは難しいです。

 

たとえば、ある病院薬剤部が計画した臨床研究で高血圧症患者を対象に標本を抽出する場合、わが国における高血圧症患者3,000万人を母集団として無作為に抽出することは不可能です。

 

高血圧症患者3,000万人のうち、医療機関を定期的に受診している患者で、かつ、臨床研究を行う病院で治療を受けている患者、かつ、臨床研究の標本となることに同意した患者ということになります。

 

さらに、患者の年齢・性別・高血圧症の重症度・合併症の有無・併存症の有無など、臨床研究の目的に応じて対象者が絞られることになります。

 

無作為割付とは、母集団から抽出された標本に対して生じる、研究者によるバイアスを避けるための群分け方法です。

 

無作為割付の方法の一つに乱数を発生させ、それを用いて群分けする方法があります。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学における標本と母集団【統計解析講義基礎】

統計学における標本と母集団【統計解析講義基礎】

統計学における標本と母集団【統計解析講義基礎】