Z検定で分かる!大規模標本の割合分析【ChatGPT統計解析】
Z検定は、大規模標本における割合の検定に使われます。割合は、分子が分母に含まれる事例の比率で、カテゴリデータに適用されます。標本サイズが大きい場合、二項分布は正規分布に近づき、Z検定が可能です。経験則として、npとn(1-p)がともに5以上であることが必要です。例として、工場で生産されたねじの品質を検定し、95%以上が基準を満たすかどうかを検討します。一標本Z検定により、Z値が棄却域に入った場合、仮説を棄却できます。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
割合に関するZ検定の統計学
割合:大規模標本の場合
割合は、分子のすべての事例が分母にも含まれる分数の値である。
例えば、特定の大学の女子学生の割合という場合、分子は女子学生の数、分母は大学の全学生(男性と女性の両方)になる。
また、特定の大学で化学を専攻する学生数について話す場合、分子は化学専攻の学生数、分母は大学の全学生(すべての専攻)になる。
割合の観点で説明できるデータはカテゴリデータの特殊な場合、カテゴリが2つだけの場合である。
最初の例では男性と女性、2つ目の例では化学専攻と化学以外の専攻である。
フィッシャーの正確確率検定やカイ2乗検定などの統計の多くは、割合に関する仮説を検定するのに利用できる。
しかし、データ標本が十分に大きい場合には、二項分布の正規近似を使って追加的な検定を実施できる。
これが可能なのは、二項分布はn(標本サイズ)が増えると正規分布に似てくるからである。
どのくらいの標本サイズが十分に大きいのだろうか。
経験則では、npとn(1-p)の両方が5以上でなければいけない。
あなたは工場長であり、工場で生産する特定の種類のねじの95%の直径が0.50センチから0.52センチの間であると主張しているとする。
顧客から最近出荷したねじに指定の直径以外のねじがあまりに多く混入していると苦情が寄せられたので、100本のねじの標本を抽出し、何本が基準を満たしているかを測定する。
次の仮説で一標本Z検定を実施し、95%のねじが指定の基準を満たしているという仮説比率が正しいかどうかを確認する。
H0:π≧0.95, H1: π< 0.95
πは、母集団において基準(直径が0.50センチから0.52センチの間)を満たすねじの比率である。
なお、これは片側検定である。
少なくとも95%のねじが基準を満たしていれば満足であり、95%以上なら満足である(もちろん、100%基準を満たしていれば最も満足であるが、完璧に正確な製造工程は存在しない)。
100本のねじの標本では、91本が指定の直径以内であった。α=0.05という基準を用いると、この結果は工場で製造したこの種類のねじの少なくとも95%が基準を満たしているという帰無仮説を棄却するのに十分だろうか。
割合に関する一標本Z検定を求める式を以下に示す。
割合に関する一標本Z統計量の式
この式では、π0は仮説母割合、pは標本割合、nは標本サイズである。
この式に数値を代入すると、以下の式に示すようにZ値= −1.835が得られる。
割合に関する一標本Z統計量の計算
ここでの仮説とα水準を考えると、片側Z検定の楽却値は−1.645である。
ここでの値−1.835はこの棄却値よりも極端なので、帰無仮説を棄却し、工場で生産したこの種類のねじの95%未満が指定の基準を満たしていると結論付ける。
また、大規模標本での母割合の差も検定できる。
現在喫煙している高校生の割合を調べ、2国間でのこの割合を比較したいとする。
帰無仮説はどちらの国でも割合が同じであるというものになるので、これは次の仮説での両側検定になる。
H0:π1=π2、 H1 : π1≠π2
標本サイズに関する前提(両方の標本でnp≧5、n(1-p)≧5)を満たしているとすると、以下の式を使って2つの母集団の割合の差のZ統計最を計算できる。
2つの割合の差のZ統計量を求める式
この式では、p1は標本1での割合、p2は標本2での割合、n1は標本1のサイズ、n2は標本2のサイズ、p-hatは両方の標本での成功の合計(この例では喫煙者数)を標本サイズの合計で割った、併合割合である。
2つのそれぞれの国から500人の高校生の標本を抽出するとする。
国1では、標本に現在の喫煙者が90人入っていた。
国2では、現在の喫煙者が70人入っていた。
このデータを考えると、それぞれの国の高校生が同じ割合で喫煙しているという帰無仮説を棄却するだけの十分な情報があるだろうか。
これは以下式に示す2標本Z検定を計算すれば検定できる。
2つの割合の差のZ統計量の計算
なお、併合割合は次のようになる。
(90+70)/(500+500)=160/1000=0.16
このZ値は、1.96 ( α= 0.05での帰無仮説を棄却するのに必要な値)よりも極端ではない。
したがって、この2国間の高校生の喫煙者の割合が同じであるという帰無仮説を棄却できない。
関連リンク