層化無作為抽出法【統計解析講義応用】

層化無作為抽出法【統計解析講義応用】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

層化無作為抽出法|【統計学・統計解析講義応用】

層化無作為抽出法【統計解析講義応用】


目次  層化無作為抽出法【統計解析講義応用】

 

 

層化無作為抽出法

 

層化無作為抽出法(stratified random sampling ;層別無作為抽出法)では,母集団を,はじめに2つないしそれ以上の層に分ける.

 

割り当て標本抽出法の場合のように,層化抽出法の目的は,標本の代表性を高めることにある.

 

層化抽出デザインは,適切な数の要素を無作為に選び出せるような均質な下位集団に,母集団を分ける.

 

層化は,年齢,性別,所得水準などの人口学的属性に基づくことが多い.

 

層化する属性を事前にわかっていることが必要で,簡単に識別できないことがある,というむずかしさがある.

 

電話帳を使う場合,ある人の性別を推測するのは危険であろうし,年齢,民族,その他の個人的な情報を層化変数として使うことはできないだろう.

 

患者リスト,学生名簿,組織人名録などには,意義ある層化のための情報が含まれていよう.

 

割り当て標本抽出法では,研究者が候補となる対象に質問して,特定の層に合うかどうかを判断できるので同じ問題は起こらない.

 

しかし,層化抽出法では,無作為抽出の前に,その人の状況を知らなくてはならない.

 

層化標本をつくるためにもっともよくもちいられる手順は,1つの層に属する要素をグループにまとめ,そのなかから必要な数の要素を無作為に抽出するやり方である.

 

研究者は,それぞれの層から同数の要素を抽出することもできるし,または後述する理由で,異なる数の標本を抽出することもできる.

 

25名の男性(1から25番)と25名の女性(26から50番)からなると仮定しよう.

 

性別を層化変数としてもちいると,このリストの前半部分から10名と後半部分から10名を無作為に抽出すれば,10名の男性と10名の女性からなる標本を得ることができる.

 

結局のところ,この例では,リストの半分ずつからそれぞれ10名の標本が抽出されたが,これは単に偶然によるものである.

 

たとえば,一方から8名,他方から12名を抽出するということもよくあるだろう.

 

層化抽出法は,母集団のさまざまな部分の適切な代表性を保証しうる.

 

通常,層化変数によって,母集団は不均等な下位集団に分けられる.

 

たとえば,米国国民という母集団を層化するのに人種をもちいた場合は,白人の下位集団は,アフリカ系アメリカ大やその他の有色人種の下位集団よりも大きくなる.
研究者は,比例層化抽出法(proportionate stratified sampling)をもちいて,母集団の層の大きさに比例して,対象を選ぶことができよう.

 

看護学校の学生の母集団が,アフリカ系アメリカ人の学生10%,ヒスパニックの学生10%,白人の学生80%から構成されていたとすれば,人種/民族的背景を層化変数として, 100名の学生の比例層化抽出標本は,各層からそれぞれ10名,10名,80名の学生で構成されることになろう.

 

研究者の関心が層のあいだの差を理解することだとすれば,比例抽出法は,その比較には十分な数といえない.

 

前述の例では,たったの10例に基づいて,ヒスパニックの看護学生の特性について結論を出すことなどできるだろうか.

 

それは賢明ではないだろう.

 

このため,研究者は,著しく不均等な大きさの層を比較しようとする場合は,不均衡標本抽出デザイン(disproportionate sampling design)を適用することが多い.

 

 

同じ例で,標本抽出の比率を,アフリカ系アメリカ人学生20名,ヒスパニックの学生20名,白人の学生60名とすることもできよう.

 

このデザインでは,2つの少数人種/民族をさらに適切に代表することになる.

 

しかし,不均衡標本抽出法をもちいるときには,母集団全体の数値をもっともよく推定できるように,データに調整を加える必要がある.

 

この調整過程は,重みづけ(weighting)という簡単な算術計算であり,標本抽出法についての教科書に説明されている.

 

層化無作為抽出法をもちいれば,最終的な標本の精度と代表性を高めることができる.

 

構成員数が比較的に小さい下位集団について信頼できる情報を得たい場合,層化によって,その層のオーバーサンプリングをして,標本となる十分な数の事例を含めることができる.

 

しかし,重要な変数に関する情報が得られないときは,層化抽出法を使えないことがある.

 

さらに,層化抽出法では,複数のリストから標本を抽出しなければならないので,単純無作為抽出法よりも労力が必要である.

 

層化無作為抽出法の例

 

バス,シングルトン,ストライカス,スティーヴンソン,マクドナルド,ウィリアムズは,産科を備えた病院のどの程度が,妊婦のB型肝炎検診についての方針をもっているかを判断する調査を行った.

 

968の病院の層化無作為標本が選ばれた(病床数と医学部との提携関係によって層化した).

 

集群抽出法(クラスター抽出法)

 

多くの母集団では,すべての要素をリスト化することは不可能である.

 

たとえば,米国のフルタイムの看護学生を母集団とした場合,単純無作為標本または層化無作為標本を抽出する目的でリス卜をつくり,それに番号を振る作業は困難だろう.

 

このやり方で学生の標本をつくろうとすると,結果的には1つの学校からわずか1名か2名だけの学生を抽出することになるので,法外に費用もかかるだろう.

 

個人面接をするとすれば,面接者は,全国に散在している学生に会うために旅行しなければならないだろう.

 

大規模な調査では,単純無作為標本抽出または層化無作為標本抽出をもちいることはほとんどなく,通常,集群抽出法をもちいる.

 

 

層化無作為抽出法【統計解析講義応用】


セミナー詳細                    解析ご相談                    LINEでお友達

 

層化無作為抽出法【統計解析講義応用】

層化無作為抽出法【統計解析講義応用】