効率的で簡単!系統抽出法の効果と手順解説【ChatGPT統計解析】
系統抽出法とは、リストや集団から一定間隔で事例を抽出する方法で、確率標本抽出にも非確率標本抽出にも適用できる。この手法では、患者リストの10人目や会員名簿の100人目といったように、特定の間隔で標本を選ぶ。母集団が限定されない場合、非確率標本抽出となるが、リストや標本抽出枠があれば無作為標本が得られる。手順として、標本の大きさを決め、母集団の大きさを割り間隔を求める。最初の要素は乱数表を使って無作為に抽出し、その後も一定間隔で抽出する。労力が少なく、単純無作為抽出法と同等の結果が得られるが、要素が一定間隔で配列されているリストでは偏りが生じる場合がある。この方法は層化リストにも適用可能で、実例としてトールらが系統抽出法で死亡証明書から標本を抽出し、家族への調査を行った。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
系統抽出法
ここで最後に述べる標本抽出デザインは,正確な手順をもちいることによって,確率標本抽出にも非確率標本抽出にもなる.
系統抽出法(systematic sampling ; 等間隔抽出法)では,リストや集団から一定の間隔で事例を抽出する.
たとえば,患者リストの10人目ごとに患者を選んだり, ANA会員名簿で100人目ごとに会員を選ぶ.
系統抽出法では,本屋に入る人,道路を歩いている人,病院を出る人などを,何人目かごとに標本にもちいることもある.
そういう場合,母集団を,本屋に入るすべての人々,歩いているすべての人々,病院を出るすべての人々,というように狭く限定しないかぎりは,標本抽出は,本質的に非確率標本抽出である.
系統抽出法を適用できれば,本質的に,無作為標本が抽出される.
リストもしくは標本抽出枠があれば,次のような手順をもちいることができる.
望ましい標本の大きさを一定の数(n)で決める.
母集団の大きさ(V)がわかっているか,推定しなければならないVを71で割ると,標本抽出の間隔が求められる.
標本抽出間隔(sampling interval)とは,標本として選ぶ要素間の標準的間隔をいう.
つまり,そのリストの200番目ごとの要素が,標本として抽出されることになる.
最初の要素は,乱数表をもちいて無作為に抽出すべきである.
乱数表から73を無作為に抽出したとしよう.73をはじめに, 273番の人, 473番の人, 673番の人というように,標本が抽出される.
別の方法としては,1ページにリストされた要素の1番からある番号までの数から,1つの番号を無作為に選び,次に,全ページ上からん番目ごとの単位(例:各ページの38番)を無作為に選ぶこともできよう.
このような手法で実施した系統抽出法は,本質的には単純無作為抽出法と同じ結果を生むが,はるかに労力が少ない.
ある種の要素が,標本抽出間隔と一致した間隔で配列されているようなリストでは,問題が生じるだろう.
たとえば,10人目ごとに主任ナースが配列されているようなナース名簿をもちいて,10人間隔で標本抽出を行った場合,主任ナースがいつも抽出されるか,またはまったく抽出されないことになる.
幸い,この種の問題はまれである.
たいていの場合,系統抽出法は,単純無作為抽出法と比べ,効率的な手法で同じ結果を得られるので望ましい.
系統抽出法は,層化されたリストにも適用できる.
系統抽出法の例
トール,ティルデン,ローゼンフェルト,ピックマンは,亡くなった人の家族を調査して,死にゆく人の最適ケアの障害となるものを探索した.
標本枠は,オレゴン州における2万4074名の死亡証明書であった.
そこから系統抽出法によって1458の証明書を抽出した.次に,できるかぎり多くの家族を見つけだし,電話面接を行った.
系統抽出法(systematic sampling;等間隔抽出法)とは、標本を選ぶための確率標本抽出法の一つであり、リストや集団の中から一定の間隔ごとにデータを抽出する方法です。この手法を用いることで、確率標本抽出と非確率標本抽出のどちらのアプローチも可能となります。系統抽出法は、調査対象を無作為に抽出し、母集団の代表性を保ちながら標本を得るための手軽かつ効率的な方法とされています。具体的な手順として、まず母集団をリスト化し、必要とされる標本のサイズを決め、その上でリストの中から一定の間隔で標本を選び出します。この間隔は母集団の総数を標本サイズで割った数で決まります。たとえば、ある患者リストから10人ごとに1人を選んだり、企業の顧客リストから100人ごとに1人を抽出したりすることが典型的な例です。また、一般的なリストだけでなく、街角を通行する人々や病院を出入りする患者、商店に入ってくる顧客といったランダムな人の流れの中からも、ある一定間隔で標本を選ぶことができます。このように、広範な母集団の一部として、どこでも手軽に適用できるのが系統抽出法の特徴です。しかしながら、母集団を例えば「特定の店を訪れるすべての顧客」や「道路を歩いているすべての人」といった形で限定せずに広く設定してしまうと、選ばれた標本が母集団全体を代表する確率標本ではなく、非確率標本となってしまう可能性があります。したがって、系統抽出法を用いる場合には、母集団の性質や範囲を明確にし、それに基づいて標本抽出枠を確立することが重要です。この方法は、無作為標本を得るためのコストを低減しながら、同じ結果を得られる利点があるため、確率標本抽出法として広く用いられています。系統抽出法を適用する際、標本抽出枠が確定していれば、以下のような具体的な手順を取ることができます。まず、望ましい標本の大きさを「n」として設定し、母集団の大きさ「V」がわかっている場合、Vをnで割ることで標本抽出の間隔、すなわち「sampling interval」を求めます。標本抽出間隔とは、標本として選ぶ要素同士の標準的な間隔を意味し、母集団のリストの中から定期的に同じ間隔で選ぶ基準となります。例えば、顧客リストで1000人の中から100人を標本として選ぶ場合、1000を100で割った10が間隔となり、10番目ごとに選ぶといった手法です。このとき、最初の要素を選ぶ位置は乱数表や乱数ジェネレータを用いて無作為に決定することが推奨されます。例えば乱数表から73が出た場合、73番目の人からスタートし、10人おきに選んでいくことで、83番、93番、103番といったように標本を抽出することができます。別の方法として、リスト内の最初のいくつかの要素から1つの番号を無作為に選び、それ以降は各ページやリストの一定番号(例:各ページの38番目など)を基準として抽出していく方法もあります。このようなアプローチを取ることにより、系統抽出法は単純無作為抽出法と同等の精度で母集団の代表性を確保しながら、より効率的に標本を抽出することができます。系統抽出法の最大の利点は、単純無作為抽出法に比べて労力やコストが少ない点です。標本抽出の際に全体を通してランダムな位置を確認する必要がないため、リストさえ整っていれば手間をかけずにデータを得られます。しかし、系統抽出法にはいくつかの注意点も存在します。たとえば、リストがあらかじめ一定のパターンで並んでいる場合には、標本抽出間隔がそのパターンと一致すると偏りが発生する可能性があります。たとえば、ナース名簿が10人ごとに主任ナースを配置しているような場合に、10人間隔で標本を抽出すると主任ナースだけが抽出されたり、逆に主任ナースが全く抽出されなかったりする恐れがあります。このような偏りが生じると、標本の代表性が損なわれるため、データの偏りを考慮する必要があります。幸い、この種の問題が発生するのはまれであり、多くの場合において系統抽出法は安定した結果をもたらします。標本抽出の間隔が母集団の構成に影響を与えないと判断できる場合、系統抽出法は単純無作為抽出法に比べて効率的で、ほぼ同じ水準の精度を得られる望ましい方法といえます。さらに、系統抽出法は層化されたリストにも適用可能であるため、異なる層ごとに一定の間隔で標本を選ぶことも容易です。系統抽出法の具体的な実例として、トール、ティルデン、ローゼンフェルト、ピックマンらが行った研究が挙げられます。彼らは、オレゴン州で発行された24,074枚の死亡証明書から標本を抽出し、亡くなった人の家族に電話調査を行い、死にゆく人のケアに関する障害や問題点を調査しました。この研究では、系統抽出法によってランダムに1458件の死亡証明書が選ばれ、そこから遺族へのアプローチが行われました。このような系統抽出法を用いることで、研究の手間を減らしつつ、母集団を代表するデータを効率的に収集することが可能となりました。このように系統抽出法は、無作為抽出法の効果を維持しながら、さまざまな場面で活用できる柔軟性のある手法として広く用いられています。
関連記事