数字の罠を見抜く!標本調査の真実と誤解【ChatGPT統計解析】
標本調査では、調査対象集団からデータを無作為に抽出するが、集団の偏った部分を取り出すことがある。人々は数字を盲目的に信用しがちだが、数字の背後にある意味を正しく理解する必要がある。例えば、同窓会の案内で回収された平均年収、鴨居の高さに関する伝統的規格、戦時中の英国軍パイロットの調査などは、抽出方法の偏りや回収率、対象の選択によって結果が歪められている可能性がある。このような例から、統計データや数字を扱う際は、それらがどのように集められ、何を表しているのかを深く理解し、誤解や誤った結論を避けるための注意が必要であることを学ぶ。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
無作為抽出と偏った抽出
調査をするときは、当然「調べたい集団」を想定しています。
ところが、調査した対象が、想定している集団と違ってしまうことがあります。
また、集団の一部のデータをとり出す「標本調査」では、「無作為抽出(ランダムサンプリング)」をする必要があります。
無作為抽出とは、簡単にいえば、「調べたい集団からまんべんなく標本をとり出す」という意味です。
しかし、この場合も、集団のうち偏った一部分だけをとり出してしまうことがあります。以下の例を見てみましょう。
A:同窓会の案内を出しました。返事に現在の年収を書いてもらい、同窓生の平均年収を求めました。この結果は信用できるでしょうか。
B:日本家屋の伝統的規格では、鴨居の高さは五尺七寸(約173cm)または五尺八寸(約176cm)となっています。戦後、日本人の体格が大きく向上したころに、「最近の若い人は背が高い人が増えて、鴨居で頭を打つ人が多い」といわれ、規格を変えなければいけないという声があがりました。
しかし、当時の20歳前後の人について、統計データ(文部省学校保健統計調査報告書による)を用いて調べてみると、176cm以上の人は5%前後しかいませんでした。なぜ、鴨居で頭を打つ人がたくさんいるような気がしたのでしょうか?
C:戦時中の英国での有名な例です。英国軍では、爆撃から帰還したパイロットに調査を行い、「敵攻撃機からの攻撃方向で一番多かったのは後ろ上方からである」という結果が得られました。この結果は信用できるでしょうか。
<解説>
A:返事の回収率はおそらく100%ではなかったでしょう。きちんと案内が届いて返事を返してきた人は、生活が安定している人が多いと思われます。また、収入の少ない人は、見栄を張ってうそを書いているかもしれません。ですから、それを使って求めた平均年収は信用できません。そもそも、こういう個人のプライバシーに関することを、同窓会の案内で尋ねるべきではありません。
B:鴨居で頭を打つ人が多い、という印象をもっている人は、まんべんなく調査した結果がそうなのだという気がしていますが、実際には、鴨居で頭を打たない人は「頭を打って困る」という不平は言いませんから、不平を言う人ばかりが目立って目につくことになります。
なお、現在では、鴨居の高さは六尺(約182cm)以上がふつうだそうです。
C:帰還したパイロットは敵攻撃機からの攻撃を逃れた人であり、攻撃にあって撃墜された人からは調査していませんから、撃墜された人がたくさんいるのなら、上の結論は信用できません。
数字が表している意味を正しく理解する
人は、数字で表現された情報は、つい盲目的に信用してしまいがちです。
しかし、その数字が表している意味をよく知っていないと、適用の限界や結果の意味を誤解し、誤った結論を信じてしまうことにもなりかねません。
統計的手法について勉強する前に、「数字で表された表現」を正しく読む方法を勉強しましょう。
関連リンク